Modelos de Mineração de Dados

Slides:



Advertisements
Apresentações semelhantes
Mineração de Dados Algoritmo APRIORI
Advertisements

Sistemas Especialistas
1 Seleção de Atributos Marcílio Souto DIMAp/UFRN.
Indução de Árvores de Decisão
Data Mining: Conceitos e Técnicas
INTELIGÊNGIA COMPUTACIONAL
ANÁLISE DISCRIMINANTE
Redes Neurais Artificiais (Parte 1)
Análise Léxica (Parte 2)
IA - Prof. Paulemir Campos
Pesquisas de Dados (Parte 2)
Classificação de Dados
Sistemas de Apoio à Decisão (SAD) Helena Galhardas
Uma das tarefas descritivas da
HAC MD -junho/ Noções de algoritmos e estudo de casos das principais tarefas de Mineração de dados.
Exercício 1 Rodar o algoritmo de classificação J4.8 do Weka variando:
Aprendizado de Máquina
Aprendem a partir de seus vizinhos AULA 9 DATA MINING Sandra de Amo
2/18/2014Mestrado em Ciencia da Computacao Tópicos Especiais Mineração de Dados Profa. Sandra de Amo Mestrado em Ciência da Computação Faculdade.
Mineração de Dados Temporais Introdução
Mestrado em Ciência da Computação 2008
Universidade Federal do Paraná
Mineração de Dados Introdução.
Artigo: ‘Mining Frequent Patterns without Candidate Generation’
A FAST APRIORI implementation
CLOSET: An Efficiet Algorithm for Mining Frequent Closed Itemsets
CLOSET: An Efficient Algorithm for Mining Frequent Closed Itemsets Jian Pei, Jiawei Han e Runying Mao Apresentação preparada por Alexandre Lorenzatti.
CLOSET: An Efficient Algorithm for Mining Frequent Closed Itemsets
Mining Frequent Patterns without Candidate Generation
Agrupamento de padrões Métodos hierárquicos
Descoberta de Padrões usando Conhecimento Prévio
Paulo J Azevedo Departamento de Informática
INF 1771 – Inteligência Artificial
Sistemas Inteligentes
II. M o d e l o s d e C o n h e c i m e n t o
Aprendizagem de Máquina - Agrupamento
Aprendizado Baseado em Instâncias – Algoritmo k-NN
Classificação. Classificação: Atribuição a uma classe (rótulo de um atributo categórico). Classifica dados (constrói um modelo) baseado em um conjunto.
1 Descoberta de Conhecimento em Bases de Dados por Algoritmos Genéticos Prof. Marco Aurélio C. Pacheco.
6/7/2014 Mestrado em Ciencia da Computacao Otimização da Técnica Apriori Sandra de Amo Data Mining AULA 4.
Sistema Recomendador para Comércio Eletrônico
O problema do emparelhamento máximo
Data Mining Técnicas não supervisionadas
Indução de Árvore de Decisão
Introdução à IA (Parte 1)
Mineração de Dados e Aprendizado de Máquina Marcilio Souto DIMAp/UFRN.
IA - Prof. Paulemir Campos
Mineração de Exceções Apresentadores Andrey C. Cavalcanti George Soares da Silva.
O Processo de KDD Data Mining SUMÁRIO - AULA1 O processo de KDD
Pilhas e Filas usando Alocação Estática e Dinâmica de Memória
Mineração de Dados: Classificação e Predição
Recuperação Inteligente de Informação
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG O Problema Dados –Um banco de transações de compra –Cada transação é um conjunto de ítens comprados Encontrar.
UFPE-CIN SeminárioSeminário Erivan A. Andrade Jacques Robin Mineração de Exceções.
24/4/2015IA - Prof. Paulemir Campos1 WEKA UPE – Caruaru – Sistemas de Informação Disciplina: Inteligência Artificial Prof.: Paulemir G. Campos.
Mineração de Dados: Introdução
Márcio Leal de Melo Dahia1 Aprendizado baseado em instâncias.
Projetos de descobertas de conhecimento em banco de dados e mineração de dados Jacques Robin, Francisco de Assis e Paulo Adeodato CIn-UFPE.
Aprendizado Baseado em Instancias. Introdução Em contraste aos métodos de aprendizado que constroem uma descrição explicita genérica da função alvo. Os.
Descoberta em múltiplos níveis conceituais
Classificação de Textos
Mineração de Dados Profa. Sandra de Amo
CIn-UFPE1 Recuperação Inteligente de Informação Agrupamento de Texto.
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
Mineração de Dados Classificação Felipe Carvalho – UFES 2009/2.
Aula Pratica Aprendizagem WEKA Prof. Ivan Gesteira Costa Filho Centro de Informática Universidade Federal de Pernambuco.
Mineração de Dados (Data Mining)
Análise do Sistema Alexandre Mota
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Apresentação da Disciplina Camilo Daleles Rennó
Transcrição da apresentação:

Modelos de Mineração de Dados UPE – Caruaru – Sistemas de Informação Disciplina: Mineração de Dados Prof.: Paulemir G. Campos Modelos de Mineração de Dados 3/25/2017 MD - Prof. Paulemir Campos

MD - Prof. Paulemir Campos Roteiro da Aula Introdução; Técnicas de Mineração de Dados; Aplicações; Referências. 3/25/2017 MD - Prof. Paulemir Campos

MD - Prof. Paulemir Campos Introdução Basicamente compreende os diversos algoritmos de aprendizado de máquina, tais como: Classificação: Regressão Linear; Redes MLP e RBF; Árvores de Decisão ID3 e C4.5; Regras de Classificação. 3/25/2017 MD - Prof. Paulemir Campos

MD - Prof. Paulemir Campos Introdução Basicamente compreende os diversos algoritmos de aprendizado de máquina, tais como (Cont.): Cluster ou Agrupamento: K-Means; Regras de Associação: APRIORI A seguir serão descritos alguns destes. 3/25/2017 MD - Prof. Paulemir Campos

MD - Prof. Paulemir Campos Regressão Linear Utiliza uma representação matemática linear para detectar algum padrão presente nos dados observados. Modelo clássico de regressão linear: Y = X. +  onde: Y é o vetor n x 1; X é uma matriz n x (p+1) do modelo;  é uma matriz (p+1)x1 de parâmetros desconhecidos e  é um vetor de erros aleatórios nx1. 3/25/2017 MD - Prof. Paulemir Campos

Regressão Linear - Exemplo 3/25/2017 MD - Prof. Paulemir Campos

MD - Prof. Paulemir Campos Árvores de Decisão Um método "divide e conquista" para o problema de aprendizado de um conjunto de instâncias independentes, onde a classificação é dada pelo nó folha, partindo-se da raiz da árvore. Principais algoritmos: ID3 e C4.5. 3/25/2017 MD - Prof. Paulemir Campos

MD - Prof. Paulemir Campos Árvores de Decisão Algoritmo Básico: A árvore é construída recursivamente de cima para baixo no modo dividir para conquistar; No início todos os exemplos se encontram na raiz; Os atributos são discretos (os atributos contínuos são discretizados previamente); Os exemplos são particionados recursivamente com base em atributos selecionados; Os atributos são selecionados heuristicamente ou através de uma critério estatístico (ex., ganho de informação). 3/25/2017 MD - Prof. Paulemir Campos

MD - Prof. Paulemir Campos Árvores de Decisão Condições de parada: Todas as amostras de um dado nó pertencem a mesma classe; Não há mais atributo disponível para futuras partições – usa-se voto da maioria para classificar a folha; Não há mais exemplos disponíveis. 3/25/2017 MD - Prof. Paulemir Campos

Árvores de Decisão - Exemplo 3/25/2017 MD - Prof. Paulemir Campos

Regras de Classificação É uma alternativa popular para árvores de decisão. Os antecedentes de uma regra equivalem aos nós que vão sendo testados até se atingir o nó folha, que é o conseqüente dessa regra. 3/25/2017 MD - Prof. Paulemir Campos

Regras de Classificação Exemplos: Se Aumento_de_Salario_1_ano > 2.5 e Estututo_de_Feriados > 10 Então Candidato_a_Promocao = Bom Se Aumento_de_Salario_1_ano =< 2.5 Então Candidato_a_Promocao = Ruim 3/25/2017 MD - Prof. Paulemir Campos

MD - Prof. Paulemir Campos K-Means Dado k, o algoritmo k-means é implementado em 4 passos: Partição dos objetos em k grupos não vazios; Defina as sementes como os centróides dos grupos da partição atual; Associe cada objeto ao grupo cuja semente é a mais próxima ao mesmo; Volte para o passo 2 até que não haja novas associações de objetos a algum grupo. 3/25/2017 MD - Prof. Paulemir Campos

MD - Prof. Paulemir Campos K-Means - Exemplo 3/25/2017 MD - Prof. Paulemir Campos

MD - Prof. Paulemir Campos K-Means Pontos Fortes É relativamente eficiente; Geralmente encontra um ótimo local. Pontos Fracos Aplicável apenas quando a média é definida; É necessário especificar a priori k, o número de grupos; É sensível a ruídos e valores aberrantes; Não é apropriado para a descoberta de grupos não esféricos. 3/25/2017 MD - Prof. Paulemir Campos

MD - Prof. Paulemir Campos Regras de Associação Diferem das regras de classificação devido a poderem predizer qualquer atributo, não somente a classe. Assim, dão a liberdade de predizer também combinações de atributos. 3/25/2017 MD - Prof. Paulemir Campos

MD - Prof. Paulemir Campos Regras de Associação Conceitos Básicos: Dados: (1) conjunto de transações, (2) cada transação é uma lista de itens (comprados por um cliente em uma visita); Achar: todas as regras que correlacionam a presença de um conjunto de itens com a presença de outro conjunto de itens em uma mesma transação. 3/25/2017 MD - Prof. Paulemir Campos

MD - Prof. Paulemir Campos Regras de Associação Exemplo: Dado: 98% das pessoas que compram pneus e auto-acessórios, também fazem algum serviço automotivo. Achar: todas as regras X & Y  Z com um mínimo de suporte e confiança Suporte (support), s, probabilidade que uma transação contenha {X  Y  Z}; Confiança (confidence), c, probabilidade condicional que uma transação que contenha {X  Y} também contém Z. 3/25/2017 MD - Prof. Paulemir Campos

MD - Prof. Paulemir Campos Regras de Associação Assim, a idéia é: Achar os conjuntos de itens freqüentes (itemsets freqüentes): o conjunto de itens que tem um mínimo de suporte; Um subconjunto de um itemset freqüente, também deve ser um itemset freqüente; Achar iterativamente itemsets freqüentes com cardinalidade de 1 à k (k-itemset); Usar os itemsets freqüentes para gerar as regras de associação. 3/25/2017 MD - Prof. Paulemir Campos

MD - Prof. Paulemir Campos Regras de Associação O Algoritmo APRIORI: Passo de união (join): Ck é gerado, unindo Lk-1 com ele mesmo; Passo de poda (prune): Qualquer (k-1)-itemset que não seja freqüente, não pode ser um subconjunto de um k-itemset freqüente. 3/25/2017 MD - Prof. Paulemir Campos

O Algoritmo APRIORI Exemplo Database D L1 C1 Scan D C2 C2 L2 Scan D C3 L3 Scan D 3/25/2017 MD - Prof. Paulemir Campos

Aplicações Potenciais Análise de bases de dados e suporte à decisão Análise de Mercado alvo de campanhas, análise de compras, segmentação do mercado, gerencia de relações com clientes, vendas cruzadas; Análise de Risco fidelização de clientes, controle de qualidade, análise de competitividade; Detecção de Fraude 3/25/2017 MD - Prof. Paulemir Campos

MD - Prof. Paulemir Campos Referências Witten, I. H. e Frank, E. Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations. Morgan Kaufmann, 1999. Han, J. e Kamber, M. Data Mining: Concepts and Techniques. Morgan Kaufmann, 2001. 3/25/2017 MD - Prof. Paulemir Campos

MD - Prof. Paulemir Campos Referências Notas de aulas dos profs. Francisco A. T. de Carvalho, Paulo Adeodato e Jacques Robin de Mineração de Dados do Cin/UFPE. 3/25/2017 MD - Prof. Paulemir Campos