A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

1 MD - junho/2008 HAC Agrupamento (clustering) Tarefa descritiva que agrupa exemplos (objetos) de acordo com suas características Objetivo: agrupar objetos.

Apresentações semelhantes


Apresentação em tema: "1 MD - junho/2008 HAC Agrupamento (clustering) Tarefa descritiva que agrupa exemplos (objetos) de acordo com suas características Objetivo: agrupar objetos."— Transcrição da apresentação:

1 1 MD - junho/2008 HAC Agrupamento (clustering) Tarefa descritiva que agrupa exemplos (objetos) de acordo com suas características Objetivo: agrupar objetos em clusters (agrupamentos) de modo que objetos pertencentes a um mesmo cluster são mais similares entre si de acordo com alguma medida de similaridade pré-definida, enquanto que objetos pertences a clusters diferentes têm uma similaridade menor Consumo de um carro em função de suas características Valor de um imóvel em função das características dele e do bairro

2 2 MD - junho/2008 HAC Tarefas de MD Data Mining Atividade Descritiva Sumariza ção Regras de Associaçã o Clusterin g Atividade Preditiva Regressã o Classifica ção

3 3 MD - junho/2008 HAC Agrupamento Tarefa de aprendizado não-supervisionado: Exemplos não estão rotulados – não existe uma classe conhecida considerada o atributo meta

4 4 MD - junho/2008 HAC Exemplo x k1 x k

5 5 MD - junho/2008 HAC Examplo – conjunto de dados 1)0.5316)6831) )1317)7632)42 3)2318)10433)63 4)1119) )6.53 5)1220)10335)62 6)12.521)9.5336)82 7)1.5222)9.5437)25 8)2123)9.5538)16 9)2224)7739) )3225)77.540)26 11)6626) )27 12)9327)10542) )9428)7.5 43) )6.5 29)7844)46 15)6730)9545)57

6 6 MD - junho/2008 HAC

7 7 MD - junho/2008 HAC Processo de agrupamento 1. seleção de exemplos e seleção ou construção de atributos seleciona atributos relevantes ou constroi atributos representativos 2. Similaridade entre exemplos seleciona a medida de similaridade a ser utilizada, que deve ser adequada ao domínio 3. Agrupamento aplicação do algoritmo de agrupamento

8 8 MD - junho/2008 HAC Medidas de similaridade medidas de distância (para dados contínuos) medidas de correlação (para dados contínuos) medidas de associação (para dados discretos)

9 9 MD - junho/2008 HAC Medidas de distância atributos dos exemplos são considerados como dimensões de um espaço multidimensional cada exemplo corresponde a um ponto no espaço similaridade entre dois pontos é a distância entre eles

10 10 MD - junho/2008 HAC Medidas de distância Manhattan/city-block D(x,y) = ( abs( x i – y i )) formato do cluster encontrado: 0,0

11 11 MD - junho/2008 HAC Medidas de distância euclidiana D(x,y) = SQRT ((x i – y i ) 2 ) formato do cluster encontrado: 0,0

12 12 MD - junho/2008 HAC Formatos de clusters Manhattan Euclidiana Chebychev Mahalanobis

13 13 MD - junho/2008 HAC

14 14 MD - junho/2008 HAC Algoritmo k-means usuário define previamente o número k de partições repetir até que os cluster se estabilizem: Escolher aleatoriamente k pontos que serão os centros dos clusters iniciais – centróides determinar para cada exemplo do conjunto de dados, o cluster ao qual ele pertence, calculando a distância entre o exemplo e o centro do cluster calcular um novo centróide para cada cluster, que passa a ser o novo centro (os pontos iniciais não são os centros definitivos dos clusters, mas sim uma tentativa inicial)


Carregar ppt "1 MD - junho/2008 HAC Agrupamento (clustering) Tarefa descritiva que agrupa exemplos (objetos) de acordo com suas características Objetivo: agrupar objetos."

Apresentações semelhantes


Anúncios Google