Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG Classificação Não Supervisionada As instâncias não são previamente classificadas Um algoritmo de classificação.

Slides:



Advertisements
Apresentações semelhantes
Sistemas Operacionais
Advertisements

INTELIGÊNGIA COMPUTACIONAL
Agrupamento (clustering)
HAC MD -junho/ Noções de algoritmos e estudo de casos das principais tarefas de Mineração de dados.
Exercício 1 Rodar o algoritmo de classificação J4.8 do Weka variando:
Universidade Federal do Paraná
Reconhecimento de Padrões Aprendizagem Supervisionada (KNN)
Agentes Baseados em Conhecimento
Jacques Robin, Francisco Carvalho, Flávia Barros
FACENS – Engenharia da Computação Inteligência Artificial
RIPPER Fast Effective Rule Induction
Knowledge Acquisition Via Incrementa Conceptual Clustering DOUGLAS H. FISHER Machine Learning 2: , 1987 Apresentação: Mário Machado e Otavio Acosta.
Agrupamento de padrões Métodos hierárquicos
II. M o d e l o s d e C o n h e c i m e n t o
3. Árvore de Decisão.
Aprendizado de Máquina
Aprendizado de Máquina Aula 8
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG.
CLUSTERING: UMA REVISÃO AOS ALGORITMOS BÁSICOS
Aprendizagem de Máquina - Agrupamento
Classificação/Clusterização
Classificação. Classificação: Atribuição a uma classe (rótulo de um atributo categórico). Classifica dados (constrói um modelo) baseado em um conjunto.
Sistema Recomendador para Comércio Eletrônico
E NHANCED S ELF -O RGANIZING I NCREMENTAL N EURAL N ETWORK FOR O NLINE U NSUPERVISED L EARNING Cesar Lima José Francisco Maíra Nascimento.
Clustering Estudo de métodos computacionais para encontrar os grupos naturais existentes nos dados. Processo também conhecido por Segmentação ou por Aprendizagem.
INF 1771 – Inteligência Artificial
Aprendizado de Máquina - Introdução
CIn-UFPE1 Recuperação Inteligente de Informação Agrupamento de Texto.
Árvores de Decisão: supervisionado, simbólico, não incremental (?)
Técnicas de Representação de Conhecimento Diversas.
O Processo de KDD Data Mining SUMÁRIO - AULA1 O processo de KDD
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG Etapas do Processo.
Ademir Rafael Marques Guedes
Marcus Sampaio DSC/UFCG Mineração de Dados Marcus Sampaio Pós-Graduação em Informática da UFCG
2. Visão Geral de MD Alguns slides foram adaptados, traduzidos ou copiados de Pang-Ning Tan (ver Bibliografia)
 À primeira vista, o diagrama de objetos é bastante semelhante com o diagrama de classes, mas existem algumas pequenas diferenças.
Generalização e herança Agregação e composição
M INERAÇÃO DE R ELACIONAMENTOS - L INK M INING Ricardo Prudêncio.
Recuperação Inteligente de Informação
7. Mineração de Texto ("Text Mining")
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG O Problema Dados –Um banco de transações de compra –Cada transação é um conjunto de ítens comprados Encontrar.
Classificação/Categorização Christian Diego – cdad Icamaan Viegas – ibvs.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG A Lógica dos Algoritmos “Covering” A estratégia é selecionar cada classe do conjunto- treinamento, e.
Marcus Sampaio DSC/UFCG Os slides 3-15 foram copiados de Pang-Ning Tan.
SISTEMAS DE APOIO À DECISÃO - SAD
1. I n t r o d u ç ã o Vários slides foram adaptados, traduzidos ou copiados de Pang-Ning Tan (ver Bibliografia)
Mineração de Dados: Introdução
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Análise de Agrupamento Camilo Daleles Rennó
Clustering Algorithms for Gene Expression Analysis Pablo Viana Fagner Nascimento.
Introdução a Mineração de Dados
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG URL: Função: Classificação Técnica: Árvore de Decisão.
Marcus Sampaio DSC/UFCG Os slides 3-15 foram copiados de Pang-Ning Tan.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG NaïveBayes Na modelagem estatística, todos os atributos são considerados igualmente importantes e independentes.
Universidade Federal do Paraná
HAC 1 MD - junho/2008 Tecnologias de suporte à Mineração de Dados Gerenciamento de dados Data Warehouse OLAP Arquiteturas Visualização Sistemas de Suporte.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG CEAPE-PB Centro de Apoio aos Pequenos EMPREENDIMENTOS – CEAPE-PB, com sede na Cidade de Campina Grande.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG NaïveBayes Na modelagem estatística, todos os atributos são considerados igualmente importantes e independentes.
Descoberta em múltiplos níveis conceituais
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG A Lógica dos Algoritmos “Covering” A estratégia é selecionar cada classe do conjunto-treinamento, e procurar.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG Classificação Não Supervisionada As instâncias não são previamente classificadas Um algoritmo de classificação.
Eduardo Matos (ejvm) Leonardo Vilaça (lhvs) Igor Ebrahim (ies) Thiago Gomes (tgr)MW
Aprendizado por Indução
CIn-UFPE1 Recuperação Inteligente de Informação Agrupamento de Texto.
DECOM – ICEB – UFOP Prof. Álvaro Guarda Aprendizado de Máquina - 0 Aprendizado Indutivo de Conceitos Conceito Conjunto de objetos com características comuns.
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
Mineração de Dados Classificação Felipe Carvalho – UFES 2009/2.
Text Clustering Tarcísio Pontes Rafael Anchieta. Roteiro Motivação Introdução Representação de documentos Redução da dimensão Clustering para textos Avaliação.
Diagrama de Classes Herança Dependências.
Transcrição da apresentação:

Marcus Sampaio DSC/UFCG

Marcus Sampaio DSC/UFCG Classificação Não Supervisionada As instâncias não são previamente classificadas Um algoritmo de classificação não supervisionada define dinamicamente o atributo de classificação e as classes –Algoritmos de lógica muito complexa

Marcus Sampaio DSC/UFCG O objetivo é mostrar as instâncias caem dentro de um grupo (cluster) –Um grupo podia ser clientes que compram muito equipamentos eletrônicos Os algoritmos de clustering diferem –Na forma como os grupos são visualizados –Na precisão com que os grupos são definidos Lógica de Clustering

Marcus Sampaio DSC/UFCG Visualização de Grupos a d k j h e c b g i f

Marcus Sampaio DSC/UFCG Visualização de Grupos (2) a d k j g e h c i f b Note que uma instância pode pertencer a mais de um grupo

Marcus Sampaio DSC/UFCG O estágio de agrupamento (clustering) é muitas vezes seguido de outro estágio –Dado um grupo, uma árvore de decisão ou um conjunto de regras de classificação são inferidas para o grupo (definição do grupo) Semântica de Grupos

Marcus Sampaio DSC/UFCG Algoritmo CobWeb Técnica incremental de agrupamento Atributos nominais Agrupamentos hierárquicos de instâncias Category Utility –Medida de qualidade de um grupo

Marcus Sampaio DSC/UFCG EstadoTempUmidVentoJogo ensolquentealtafalsonão (a) ensolquentealtaverdadenão (b) nubladoquentealtafalsosim (c) chuvosoamenaaltafalsosim (d) chuvosofrianormalfalsosim (e) chuvosofrianormalverdadenão (f) nubladofrianormalverdadesim (g) ensolamenaaltafalsonão (h) ensolfrianormalfalsosim (i) Algoritmo CobWeb (2)

Marcus Sampaio DSC/UFCG chuvosoamenanormalfalsosim (j) ensolamenanormalverdadesim (k) nubladoamenaaltaverdadesim (l) nubladoquentenormalfalsosim (m) chuvosoamenaaltaverdadenão (n) Algoritmo CobWeb (3)

Marcus Sampaio DSC/UFCG a:não b:nãod:simc:sim e:sim a:nãob:nãod:simc:sim f:não (1)(2) (3) Algoritmo CobWeb (4)

Marcus Sampaio DSC/UFCG e:sim a:nãob:nãod:simc:sim f:não (4) g:sim Algoritmo CobWeb (5)

Marcus Sampaio DSC/UFCG e:sima:não c:simb:não f:não (5) g:simd:simh:não Algoritmo CobWeb (6)

Marcus Sampaio DSC/UFCG e:sim a:não i:sim b:não f:não (6) g:sim d:simh:não k:sim l:simc:sim n:não j:sim m:sim Algoritmo CobWeb (7)

Marcus Sampaio DSC/UFCG EstadoTempUmidVentoJogo ensolquentealtafalsonão (a, ) ensolquentealtaverdadenão (b), nubladoquentealtafalsosim (c), chuvosoamenaaltafalsosim (d, ) chuvosofrianormalfalsosim (e), chuvosofrianormalverdadenão (f), 1-3 nubladofrianormalverdadesim (g), 1-3 ensolamenaaltafalsonão (h, ) ensolfrianormalfalsosim (i), Algoritmo CobWeb (8)

Marcus Sampaio DSC/UFCG chuvosoamenanormalfalsosim (j), 1-3 ensolamenanormalverdadesim (k), nubladoamenaaltaverdadesim (l), nubladoquentenormalfalsosim (m), 1-3 chuvosoamenaaltaverdadenão (n), 1-3 Algoritmo CobWeb (9)

Marcus Sampaio DSC/UFCG Algoritmo CobWeb (10) Aplicando um algoritmo de classificação, pode-se inferir a semântica dos grupos –1-2-4 – –1-2-5 –1-3-6 –1-3

Marcus Sampaio DSC/UFCG Algoritmo CobWeb (11) Para ver como a qualidade — category utility — de um grupo é calculada, consulte o livro- texto –Págs

Marcus Sampaio DSC/UFCG Algoritmo CobWeb (12) Como fazer predição com um modelo induzido por um algoritmo clustering? –Dada uma instância de execução, o algoritmo classifica a instância como pertencendo a um ou mais grupos