A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Exercícios de clustering

Apresentações semelhantes


Apresentação em tema: "Exercícios de clustering"— Transcrição da apresentação:

1 Exercícios de clustering
Mineração de dados Exercícios de clustering

2 Exercício 2 Para o quadro abaixo, aplique o algoritmo aglomerativo MIN (single link) e apresente o dendograma final.

3 Passo 1: calcular a tabela de distâncias iniciais
4 6 2 E 7 3 5 d(A,B) = |3-4| + |2-5| = 4 d(A,C) = |3-4| + |2-7| = 6 …. Considerando a menor distância como BC temos o primeiro grupo. O próximo passo é recalcular a matriz de distâncias considerando agora o grupo BC. A B C D E 2

4 A B C D 4 6 2 E 7 3 5 A BC D 4 6 2 E 7 3 5 d(A,BC)= min(d(A,B), d(A,C)) = min(4,6) = 4 d(D,BC)= min(d(D,B), d(D,C)) = min(4,2) = 2 d(E,BC)= min(d(E,B), d(E,C)) = min(3,3) = 3 A menor distância é entre BC e D que formam o próximo grupo. O próximo passo é recalcular a matriz de distâncias considerando agora o grupo BCD. A B C D E 2

5 A B C D 4 6 2 E 7 3 5 A BCD 4 E 7 3 d(A,BCD)= min(d(A,B), d(A,C), d(A,D)) = min(4,6,6) = 4 d(E,BCD)= min(d(E,B), d(E,C), d(E,D)) = min(3,3,5) = 3 A menor distância é entre BCD e E que formam o próximo grupo. O próximo passo é recalcular a matriz de distâncias considerando agora o grupo BCDE. d(A,BCDE)= min(d(A,B), d(A,C), d(A,D),d(A,E)) = min(4,6,6,7) = 4 A B C D E 3 2 A B C D E 4 3 2

6 Exercício 3 Idem ao anterior, mas considerando a similaridade MAX A B
4 6 2 E 7 3 5

7 Exercício 4 Analisando o dendograma abaixo, quantos clusters deveriam ser utilizados? Porque? Quais são os clusters? A B C D E F G H I 3 clusters (AB, CDEF, GHI)

8 Exercício 5 Primeiro passo (EPS = 3): calculo da vizinhanca Vizinhanca x1 (x7) Vizinhanca x2(x3,x4,x8), para EPS=3 eh um core Vizinhanca x3 (x2,x6), para EPS=3 e um core Vizinhanca x4(x2,x9) eh core Vizinhanca x5(nada) eh noise Vizinhanca x6(x3) Vizinhanca x7(x1) Vizinhanca x8 (x2) Vizinhanca x9(x4) Segundo passo: x1 é noise porque não é core e não está na vizinhança de um core X2, x3 e x4 são core porque tem pelo menos 2 pontos na vizinhança X5 é noise porque não está na vizinhança de nenhum core e não é core X6 é border porque está na vizinhança de x3 que é core X7 é noise porque não está na vizinhança de nenhum core e não é core X8 é border porque está na vizinhança de x2 que é core X9 é um border porque está na vizinhança do x4 que é um core Considerando os dados acima e o algoritmo DBSCAN, identifique os pontos core, border e noise, para: minPoints=2 e Eps=3 minPoints=2 e Eps=4


Carregar ppt "Exercícios de clustering"

Apresentações semelhantes


Anúncios Google