A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Natasha Correia Queiroz Lino Agrupamento Conceitual Aprendizagem Não Supervisionada.

Apresentações semelhantes


Apresentação em tema: "Natasha Correia Queiroz Lino Agrupamento Conceitual Aprendizagem Não Supervisionada."— Transcrição da apresentação:

1 Natasha Correia Queiroz Lino Agrupamento Conceitual Aprendizagem Não Supervisionada

2 PróximoAnterior 2Índice Introdução - Aprendizagem Tipos Aprendizagem Exemplo Inicial Agrupamento Tradicional x Agrupamento Conceitual Métodos e seus componentes –Método Tradicional –Método Conceitual Resultados Conclusão dos resultados Alguns Sistemas de Agrupamento Conceitual (COBWEB)

3 PróximoAnterior 3Aprendizagem Michalski, 1986: Aprendizagem é construir ou modificar representações do que está sendo experienciado.

4 PróximoAnterior 4 Classificação dos Métodos de Aprendizagem CBR

5 PróximoAnterior 5 Aprendizagem - Tipos Aprendizagem Supervisionada –Dado um conjunto de exemplos pré-classificados, aprender uma descrição geral que encapsula a informação contida nesses exemplos - e que pode ser usada para prever casos futuros Aprendizagem Não Supervisionada –Dada uma coleção de dados não classificados, agrupá-los por regularidades

6 PróximoAnterior 6 Aprendizagem Não Supervisionada Aprendiz não recebe nenhuma informação explícita sobre a classificação dos exemplos de entrada Informação está implícita O objetivo do processo de aprendizagem é descobrir regularidades nos dados de entrada Consiste em particionar instâncias em classes, baseada em alguma métrica de similaridade (encontrar agrupamento das instâncias no espaço de instâncias)

7 PróximoAnterior 7 Exemplo Inicial - Mesa de Restaurante Objetos: comida em prato, salada, utensílios, sal, pimenta, guardanapos, vaso com flores, xícara de café

8 PróximoAnterior 8 Exemplo Inicial - Mesa de Restaurante Possível classificação dada por uma pessoa: –Encadeamento de Inferências (conceito de comestível): Sal e pimenta são temperos Temperos são usados para dar gosto a comida Comida temperada é algo para ser comido Coisas que são para serem comidas são comestíveis Sal e pimenta são comestíveis Salada é vegetal Vegetais são comida Comida é algo para ser comido Coisas que são para serem comidas são comestíveis Salada é comestível

9 PróximoAnterior 9 Exemplo Inicial - Mesa de Restaurante Possível classificação dada por uma pessoa (cont.): –Encadeamento de Inferências (conceito de comestível): Guardanapo não é comida Guardanapo não é comestível Vaso com flores não é comida Vaso com flores não é comestível Problema: –Existem outras classificações que podem até ser hierárquicas –Como decidir qual classificação é melhor ou mais apropriada?

10 PróximoAnterior 10 Exemplo Inicial - Mesa de Restaurante Utensílios TalherRecipiente Garfo Faca Colher Taça Xícara Prato Forma, Funcionalidade

11 PróximoAnterior 11 Tipos de Agrupamento Agrupamento Tradicional Agrupamento Conceitual

12 PróximoAnterior 12 Agrupamento Tradicional - O que é Técnica tradicional Construção de classificações significativas de objetos ou situações observadas Conhecido como Taxonomia Numérica, pois envolve a produção de uma hierarquia de classe, usando medida matemática de similaridade entre as instâncias

13 PróximoAnterior 13 Agrupamento Tradicional - Desvantagens Algoritmos são incapazes de considerar as relações semânticas entre os atributos das instâncias ou conceitos globais que podem ter relevância na formação do esquema de classificação A informação usada é apenas a que está contida nas instâncias Geralmente inadequado

14 PróximoAnterior 14 Agrupamento Conceitual - Idéia Introduzido inicialmente por R. S. Michalski Um processo de construção de uma rede de conceitos Caracteriza uma coleção de objetos com nós associados a conceitos, descrevendo classes de objetos e links associados às relações entre as classes

15 PróximoAnterior 15 Agrupamento Conceitual - Exemplo Considerando o exemplo:

16 PróximoAnterior 16 Agrupamento Conceitual - Exemplo Pessoas não agrupariam A e B juntos, mas sim dentro de dois losangos Particionamento é feito usando o conceito de membro ao invés de distância Os pontos são colocados no mesmo grupo se coletivamente eles representam o mesmo conceito –Isto é a base do agrupamento conceitual!

17 PróximoAnterior 17 Agrupamento Conceitual - Definição Dado: –Um conjunto de objetos –Um conjunto de atributos usados para caracterizar os objetos –Um corpo de conhecimento adquirido - incluindo problemas de restrições, propriedades dos atributos, critérios para avaliação de qualidade da classificação construída Encontrar: –Uma hierarquia de classes de objetos Cada nó deve formar um conceito coerente –Compacto –Facilmente representado em termos de uma definição ou regra que tenha uma interpretação natural para humanos

18 PróximoAnterior 18 Agrupamento Conceitual - Exemplo Descrição de animais: Hierarquia de classificação produzida:

19 PróximoAnterior 19 Agrupamento Conceitual - Exemplo

20 PróximoAnterior 20 Agrupamento - Métodos (Abordagens) Baseados em Distâncias Baseados em Probabilidades Hierárquicos

21 PróximoAnterior 21 Agrupamento - Método Tradicional x Conceitual Método de Agrupamento Dinâmico (Tradicional) –Encontra classes iterativamente, aplicando alternadamente uma função de representação e uma função de alocação, até que um ótimo local (do critério de optimalidade assumido) seja atingido. Agrupamento Conceitual Conjuntivo (Conceitual) –Pode ser visto como um Agrupamento Dinâmico, onde classes representam um forte conceito de ligação organizando uma coleção de objetos

22 PróximoAnterior 22 Agrupamento Dinâmico - Algoritmo NUMTAX Dado um conjunto de objetos E, e um inteiro k, o método particiona E em k classes que são ótimos locais de acordo com um critério assumido. Inicia-se com alguma representação inicial das k classes, escolhidas randomicamente Uma sequência de iterações é executada para: –Encontrar a classe que melhor se ajusta às representações de classes obtidas –Encontrar a representação que melhor se ajusta às classes obtidas Quando não há mais melhoras, o processo termina

23 PróximoAnterior 23 Agrupamento Conceitual Conjuntivo - Algoritmo PAF Dado um conjunto de objetos E, e um inteiro k (quantidade de classes); são selecionados k protótipos de E Para cada protótipo é determinado um conjunto (star) de expressões que contenham este protótipo, e não contenham os demais Redução das expressões contidas nos conjuntos (star) Para cada conjunto (star), uma expressão é selecionada de forma que as expressões obtidas sejam mutuamente disjuntas, juntas contenham todos os dados, e otimizem um critério de optimalidade assumido. (Algoritmo de busca )

24 PróximoAnterior 24 Agrupamento Conceitual Conjuntivo - Algoritmo PAF Para cada expressão é selecionado um novo protótipo, e é iniciada uma nova iteração do algoritmo. –Duas técnicas de seleção de protótipos são usadas: Protótipos são eventos centrais Protótipos são eventos de fronteiras As classes obtidas são avaliadas de acordo com o critério de optimalidade. Se for a primeira iteração, as classes são armazenadas, caso contrário, só de forem melhores do que as anteriores. O algoritmo termina, quando após um número especificado de iterações, não é produzida uma classificação melhor

25 PróximoAnterior 25 Agrupamento - Componentes Componentes independentes de método: –Objetos –Atributos (variáveis) –Codificação dos atributos (domínio das variáveis e medidas de escala) –Princípio para agrupar objetos em classes –Estrutura inter-classe

26 PróximoAnterior 26 Agrupamento - Componentes Componentes dependentes de método: –Esquema de representação de classes –Função de representação –Função de alocação –Critério de optimalidade de agrupamento

27 PróximoAnterior 27 Agrupamento - Componentes Independentes Objetos : –Provém de um estudo experimental de algum fenômeno –São descritos por algum conjunto de atributos (variáveis) –Exemplo: Conjunto de microorganismos

28 PróximoAnterior 28 Agrupamento - Componentes Independentes Atributos (Variáveis) : –Nem todos os atributos são sempre relevantes para o problema de agrupamento –A tarefa de detectar os atributos relevantes é outro problema –Exemplo: Partes do corpo Manchas no corpo Textura Tipo de calda

29 PróximoAnterior 29 Agrupamento - Componentes Independentes Codificação dos atributos: –Modelo de medida / Convenção utilizada –Atributos podem ser medidos em diferentes escalas: Atributos qualitativos: nominal Atributos quantitativos: ordinal, intervalo, razão –Exemplo: Partes do corpo (1 parte, 2 partes, muitas partes) Manchas no corpo (uma mancha, muitas manchas) Textura (em branco, listrada, quadriculada) Tipo de calda (nenhuma, única, múltipla)

30 PróximoAnterior 30 Agrupamento - Componentes Independentes Tabela:

31 PróximoAnterior 31 Agrupamento - Componentes Independentes Princípio para agrupar objetos em classes: –Caracterização através de um conceito simples –Medida de similaridade Usualmente uma medida de distância –Medidas quantitativas (fórmulas) –Medidas qualitativas (binária) –Exemplo: Taxonomia Numérica (Agrupamento Tradicional): –18 técnicas diferentes determinadas pela combinação das medidas de similaridade usadas (NUMTAX) Agrupamento Conceitual Conjuntivo (Agrupamento Conceitual) –De acordo com o algoritmo PAF

32 PróximoAnterior 32 Agrupamento - Componentes Independentes Medida de similaridade –Exemplos: Minkowsky (quantitativa) Russel and Rao (qualitativa)

33 PróximoAnterior 33 Agrupamento - Componentes Independentes Estrutura inter-classes: –Baseada nas relações entre as classes –Tipos de estruturas: Partição Sobreposição Hierárquica Bipolar

34 PróximoAnterior 34 Agrupamento - Componentes Independentes Estrutura inter-classes: –Exemplos : Estrutura de PartiçãoEstrutura de Sobreposição

35 PróximoAnterior 35 Agrupamento - Componentes Independentes Estrutura inter-classes: –Exemplos : Estrutura HierárquicaEstrutura Bipolar

36 PróximoAnterior 36 Agrupamento - Componentes Independentes Estrutura inter-classes: –Estrutura para o exemplo dos microorganismos: Estrutura de partição

37 PróximoAnterior 37 Agrupamento - Componentes Dependentes Esquema de representação de classes Função de representação Função de alocação Critério de optimalidade de agrupamento

38 PróximoAnterior 38 Agrupamento - Componentes Dependentes Esquema de representação de classes: –Construção matemática ou geométrica que caracteriza objetos na classe –Exemplos: Objeto no centro de massaOs três objetos mais distantesLinha de menor inércia Função de disitribuição normalNós em uma árvore de classificação

39 PróximoAnterior 39 Agrupamento - Componentes Dependentes Esquema de representação de classes (cont.): –Agrupamento Conceitual Conjuntivo (utiliza dois esquemas): Objeto único (central ou extremo) - protótipo da classe Esquema final da classe - expressão

40 PróximoAnterior 40 Agrupamento - Componentes Dependentes Função de representação : –Determina a melhor representação para as classes de acordo com o critério de representação assumido –Formalmente a função é um mapeamento: Onde: é um conjunto de classes é um conjunto de representações de classes

41 PróximoAnterior 41 Agrupamento - Componentes Dependentes Função de representação (g) - Agrupamento Conceitual Conjuntivo (cont) : –Procedure que, dado um conjunto de k classes, seleciona k protótipos para cada classe, e determina um conjunto de k expressões disjuntas, 1, 2,..., k, tais que: A expressão i contém o protótipo ei, A união das expressões contém o conjunto completo de objetos Todos as k expressões juntas maximiza o critério de optimalidade do agrupamento

42 PróximoAnterior 42 Agrupamento - Componentes Dependentes Função de alocação: –É o inverso da função de representação –Formalmente: Função de alocação (f) - Agrupamento Conceitual Conjuntivo: –Procedure que, dada uma representação consistindo de k expressões 1, 2,..., k, forma um agrupamento Ck = {E1, E2,..., Ek}, onde a classe Ei contém exemplos observados em i

43 PróximoAnterior 43 Agrupamento - Componentes Dependentes Critério de optimalidade de agrupamento: –Especifica as propriedades desejadas em uma classe –Mede o ajuste entre as classes e as representações das classes Medida simples ou medida ponderada Formalmente pode ser definido como: Critérios elementares - Agrupamento Conceitual Conjuntivo: Ajuste entre as classes e os dados Diferenças inter-classes Dimensão essencial Simplicidade de representação das classes

44 PróximoAnterior 44 Resultados Obtidos - NUMTAX (Partes Corpo = 1) (Tipo Calda = 0 ou 1) (Partes Corpo > 1) (Tipo Calda = 0) [Tipo Calda > 1] [(Partes Corpo > 1) (Tipo Calda = 0, >1 )]

45 PróximoAnterior 45 Resultados Obtidos - PAF (Tipo Calda = 1) (Textura = branca ou listrada) (Tipo Calda = 1) (Textura = branca ou listrada) (Partes Corpo = 1, 2 ) (Tipo Calda > 1)

46 PróximoAnterior 46 Para a subjetividade humana as soluções mais comuns são: –3 Classes (k=3): [Tipo de calda = nenhuma] x [Tipo de calda = única] x [Tipo de calda = múltipla] NUMTAX é mais arbitrário, complexo e possui disjunção (Agrupamento Tradicional) PAF corresponde mais aos conceitos humanos de classificação (Agrupamento Conceitual Conjuntivo) Conclusão dos Resultados

47 PróximoAnterior 47 Alguns Sistemas de Agrupamento Conceitual CLUSTER (Michalski ) CLUSTER/2 (Michalski) UNIMEN (Lebowitz ) COBWEB (Fisher )

48 PróximoAnterior 48 Sistema COBWEB Baseado no princípio de que um bom agrupamento deve: –Minimizar a distância entre objetos em um grupo (Similaridade inter-grupo) –Maximizar a distância entre objetos de grupos diferentes (Similaridade intra-grupo) Objetivo do COBWEB: –Encontrar bom tradeoff!

49 PróximoAnterior 49 Sistema COBWEB Características: –Função de avaliação heurística para guiar a busca –Estrutura de Representação: Estrutura de hierárquica com representação de conceitos –Esquemas de Classificação: Utilização de operadores –Estratégias de Controle

50 PróximoAnterior 50Referências Michalski, R. S., Stepp, R., and Diday, E., "A Recent Advance in Data Analysis: Clustering Objects into Classes Characterized by Conjunctive Concepts," Chapter in the book Progress in Pattern Recognition, Vol. 1, L. Kanal and A. Rosenfeld (Editors), North-Holland, pp , Michalski, R. S. and Stepp, R., "Learning from Observation: Conceptual Clustering," Chapter in the book, Machine Learning:An Artificial Intelligence Approach, R. S. Michalski, J.G. Carbonell and T.M. Mitchell (Eds.), TIOGA Publishing Co., PaloAlto, pp , 1983.

51 PróximoAnterior 51Referências Stepp, R. and Michalski, R. S., "Conceptual Clustering: Inventing Goal-Oriented Classifications of Structured Objects, Reports of the Intelligent Systems Group, ISG 85-10, UIUCDCS-F , Department of Computer Science, University of Illinois, Urbana, February Kodratoff, Y. and Ganascia, J., Improving the Generalization Step in Learning, Chapter in the book, Machine Learning:An Artificial Intelligence Approach, R. S. Michalski, J.G. Carbonell and T.M. Mitchell (Eds.), TIOGA Publishing Co., PaloAlto, pp , 1983.

52 PróximoAnterior 52Referências Michalski, R.S. and Kaufman, K.A., "Data Mining and Knowledge Discovery: A Review of Issues and a Multistrategy Approach," Reports of the Machine Learning and Inference Laboratory, MLI 97-2, George Mason University, Fairfax, VA, 1997.

53 PróximoAnterior 53Referências URLs: –http://www.mli.gmu.edu/~sfischt/cluster2.html –http://www.csd.abdn.ac.uk/~pedwards/CS5505/slides.html –http://www.swi.psy.uva.nl/mlteach/courses/courses.htm –http://yake.ecn.purdue.edu/~brodley/courses/695C/ overheads/overheads.html

54 PróximoAnterior 54


Carregar ppt "Natasha Correia Queiroz Lino Agrupamento Conceitual Aprendizagem Não Supervisionada."

Apresentações semelhantes


Anúncios Google