Exercícios de clustering

Slides:



Advertisements
Apresentações semelhantes
Distância Conceito útil para se medir a localização relativa entre diferentes vértices de um grafo Distância d(v,w): em um grafo conexo: número de arestas.
Advertisements

João Luiz Fernandes e Aura Conci Universidade Federal Fluminense
Experiments with Clustering as a Software Remodularization Method Nicolas Anquetil and Timothy C. Lethbridge University of Ottawa, Canada WCRE 1999:
Job mais curto Primeiro
Análise de Agrupamentos (Clusters) Marcílio C. P. de Souto DIMAp/UFRN.
ESTRUTURA DE DADOS EXERCÍCIOS e MATRIZES
Quadrilátero é um polígono de quatro lados
Exercício 1 A) Caminho 3 – 4 -3 B) Caminho 100 – 1 – 1 – 100
Pontes Seja (G) o número de componentes conexas de G. Uma ponte é uma aresta a tal que (G - a) > (G)
Medidas de Dispersão.
Aparentemente, existe uma dificuldade inerente ao ser humano em compreender que uma soma infinita de termos não nulos possa resultar em um número finito.
CÁLCULO DA INVERSA DA BASE
CÁLCULO DA INVERSA DA BASE
Método Hierárquico Aglomerativo de Clusterização Algoritmo CURE
Método de Clusterização baseado em Densidade Algoritmo DBSCAN
Avaliação de Clusteres
Análise Sintática - Continuação
7a. e 8a. Aulas – Correlação e Regressão
Reconhecimento de Padrões Segmentação
Apresentação: Léia Michelle de Souza
Algoritmos Escher.
Método dos Mínimos Quadrados (MMQ)
Observe o quadrilátero ABCD:
INF 1771 – Inteligência Artificial
Lógica e Técnicas de Programação
Alexandre Xavier Falcão & David Menotti
CLUSTERING: UMA REVISÃO AOS ALGORITMOS BÁSICOS
Aprendizagem de Máquina - Agrupamento
Finding and Evaluating Community Structure in Networks
D ETECÇÃO DE C OMUNIDADES Ricardo Prudêncio. L INK M INING - T AREFAS Relacionadas a Objetos Relacionadas a Arestas Relacionadas a Grafos Ranking de Nós.
Caracterização de consumos
K-Means / Clustering.
Cálculo Numérico / Métodos Numéricos
Algoritmos e Programação I
Avaliação de Clusteres Parte II
CIn-UFPE1 Recuperação Inteligente de Informação Agrupamento de Texto.
Aprendizagem de Máquina - Agrupamento Prof. Sérgio Queiroz Slides inicialmente preparados pelo Prof. Ricardo Prudêncio, aos quais foram feitas modificações.
Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Programa de Pós-graduação em Biociências Área de Concentração.
Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Programa de Pós-graduação em Biociências Área de Concentração.
ARRANJO FÍSICO CÉLULAS
Análise de padrões de uso em grades computacionais oportunistas
Aula 8. Classificação Não Supervisonada por Regiões
Método dos Mínimos Quadrados (MMQ)
Análise de Agrupamentos Marcílio Souto DIMAp/UFRN.
Algoritmos de Agrupamento (Clustering): Métodos Hierárquicos e k-médias Marcílio C. P. de Souto DIMAp/UFRN.
Revisão 2° Bimestre Inteligência Artificial. Redes Neurais.
Raiz quadrada exata de números inteiros
Algoritmos para Obtenção de Árvore Geradora Mínima
Recuperação Inteligente de Informação
Limites – Aula II Prof. Zé Roque.
Medidas de Dispersão O que é dispersão?
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Análise de Agrupamento Camilo Daleles Rennó
EXERCÍCIOS DE SÍNTESE 12 DE NOVEMBRO DE Determine o consumo/custo máximo e mínimo de utilidades CorrenteWCp kW/ o C To o C Td o C Q1Q Q2Q2.
Clustering Algorithms for Gene Expression Analysis Pablo Viana Fagner Nascimento.
Aplicação do Algoritmo de Dijkstra - Matching 3ª reunião do Grupo de Estudos – UP&D Fernando Sales e Danilo Lage 22 de fev de 2008.
VBA.
Professor: André L. R. Didier Autor: Francisco Airton
Programação de computadores
3º Momento Resultados Simare 2014
Estudo das Funções ESTUDO DAS FUNÇÕES 9º ano - Matemática.
CIn-UFPE1 Recuperação Inteligente de Informação Agrupamento de Texto.
Exercício: Contar mentalmente um tempo de 10 segundos
Sobre a Prova Prof. André Aparecido da Silva
Introdução a Programação Aula 02 Jackson Eduardo
Camilo Daleles Rennó Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Análise.
Variância/ Covariância, Correlação Regressão. Variância.
Introdução a Análise de Redes Sociais Aula 07 Dalton Martins Laboratório de Políticas Públicas Participativas Gestão da Informação Universidade.
Técnicas Estatísticas de Agrupamento
Exercícios Crie um algoritmo que leia uma matriz 5x5. Em seguida, conte quantos números pares existem na matriz. Crie um algoritmo que leia uma matriz.
Exercícios de clustering
Transcrição da apresentação:

Exercícios de clustering Mineração de dados Exercícios de clustering

Exercício 2 Para o quadro abaixo, aplique o algoritmo aglomerativo MIN (single link) e apresente o dendograma final.

Passo 1: calcular a tabela de distâncias iniciais 4 6 2 E 7 3 5 d(A,B) = |3-4| + |2-5| = 4 d(A,C) = |3-4| + |2-7| = 6 …. Considerando a menor distância como BC temos o primeiro grupo. O próximo passo é recalcular a matriz de distâncias considerando agora o grupo BC. A B C D E 2

A B C D 4 6 2 E 7 3 5 A BC D 4 6 2 E 7 3 5 d(A,BC)= min(d(A,B), d(A,C)) = min(4,6) = 4 d(D,BC)= min(d(D,B), d(D,C)) = min(4,2) = 2 d(E,BC)= min(d(E,B), d(E,C)) = min(3,3) = 3 A menor distância é entre BC e D que formam o próximo grupo. O próximo passo é recalcular a matriz de distâncias considerando agora o grupo BCD. A B C D E 2

A B C D 4 6 2 E 7 3 5 A BCD 4 E 7 3 d(A,BCD)= min(d(A,B), d(A,C), d(A,D)) = min(4,6,6) = 4 d(E,BCD)= min(d(E,B), d(E,C), d(E,D)) = min(3,3,5) = 3 A menor distância é entre BCD e E que formam o próximo grupo. O próximo passo é recalcular a matriz de distâncias considerando agora o grupo BCDE. d(A,BCDE)= min(d(A,B), d(A,C), d(A,D),d(A,E)) = min(4,6,6,7) = 4 A B C D E 3 2 A B C D E 4 3 2

Exercício 3 Idem ao anterior, mas considerando a similaridade MAX A B 4 6 2 E 7 3 5

Exercício 4 Analisando o dendograma abaixo, quantos clusters deveriam ser utilizados? Porque? Quais são os clusters? A B C D E F G H I 3 clusters (AB, CDEF, GHI)

Exercício 5 Primeiro passo (EPS = 3): calculo da vizinhanca Vizinhanca x1 (x7) Vizinhanca x2(x3,x4,x8), para EPS=3 eh um core Vizinhanca x3 (x2,x6), para EPS=3 e um core Vizinhanca x4(x2,x9) eh core Vizinhanca x5(nada) eh noise Vizinhanca x6(x3) Vizinhanca x7(x1) Vizinhanca x8 (x2) Vizinhanca x9(x4) Segundo passo: x1 é noise porque não é core e não está na vizinhança de um core X2, x3 e x4 são core porque tem pelo menos 2 pontos na vizinhança X5 é noise porque não está na vizinhança de nenhum core e não é core X6 é border porque está na vizinhança de x3 que é core X7 é noise porque não está na vizinhança de nenhum core e não é core X8 é border porque está na vizinhança de x2 que é core X9 é um border porque está na vizinhança do x4 que é um core Considerando os dados acima e o algoritmo DBSCAN, identifique os pontos core, border e noise, para: minPoints=2 e Eps=3 minPoints=2 e Eps=4