Exercícios de clustering

Slides:

Advertisements

Apresentações semelhantes

Distância Conceito útil para se medir a localização relativa entre diferentes vértices de um grafo Distância d(v,w): em um grafo conexo: número de arestas.

Advertisements

João Luiz Fernandes e Aura Conci Universidade Federal Fluminense

Experiments with Clustering as a Software Remodularization Method Nicolas Anquetil and Timothy C. Lethbridge University of Ottawa, Canada WCRE 1999:

Job mais curto Primeiro

Análise de Agrupamentos (Clusters) Marcílio C. P. de Souto DIMAp/UFRN.

ESTRUTURA DE DADOS EXERCÍCIOS e MATRIZES

Quadrilátero é um polígono de quatro lados

Exercício 1 A) Caminho 3 – 4 -3 B) Caminho 100 – 1 – 1 – 100

Pontes Seja (G) o número de componentes conexas de G. Uma ponte é uma aresta a tal que (G - a) > (G)

Medidas de Dispersão.

Aparentemente, existe uma dificuldade inerente ao ser humano em compreender que uma soma infinita de termos não nulos possa resultar em um número finito.

CÁLCULO DA INVERSA DA BASE

CÁLCULO DA INVERSA DA BASE

Método Hierárquico Aglomerativo de Clusterização Algoritmo CURE

Método de Clusterização baseado em Densidade Algoritmo DBSCAN

Avaliação de Clusteres

Análise Sintática - Continuação

7a. e 8a. Aulas – Correlação e Regressão

Reconhecimento de Padrões Segmentação

Apresentação: Léia Michelle de Souza

Algoritmos Escher.

Método dos Mínimos Quadrados (MMQ)

Observe o quadrilátero ABCD:

INF 1771 – Inteligência Artificial

Lógica e Técnicas de Programação

Alexandre Xavier Falcão & David Menotti

CLUSTERING: UMA REVISÃO AOS ALGORITMOS BÁSICOS

Aprendizagem de Máquina - Agrupamento

Finding and Evaluating Community Structure in Networks

D ETECÇÃO DE C OMUNIDADES Ricardo Prudêncio. L INK M INING - T AREFAS Relacionadas a Objetos Relacionadas a Arestas Relacionadas a Grafos Ranking de Nós.

Caracterização de consumos

K-Means / Clustering.

Cálculo Numérico / Métodos Numéricos

Algoritmos e Programação I

Avaliação de Clusteres Parte II

CIn-UFPE1 Recuperação Inteligente de Informação Agrupamento de Texto.

Aprendizagem de Máquina - Agrupamento Prof. Sérgio Queiroz Slides inicialmente preparados pelo Prof. Ricardo Prudêncio, aos quais foram feitas modificações.

Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Programa de Pós-graduação em Biociências Área de Concentração.

Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Programa de Pós-graduação em Biociências Área de Concentração.

ARRANJO FÍSICO CÉLULAS

Análise de padrões de uso em grades computacionais oportunistas

Aula 8. Classificação Não Supervisonada por Regiões

Método dos Mínimos Quadrados (MMQ)

Análise de Agrupamentos Marcílio Souto DIMAp/UFRN.

Algoritmos de Agrupamento (Clustering): Métodos Hierárquicos e k-médias Marcílio C. P. de Souto DIMAp/UFRN.

Revisão 2° Bimestre Inteligência Artificial. Redes Neurais.

Raiz quadrada exata de números inteiros

Algoritmos para Obtenção de Árvore Geradora Mínima

Recuperação Inteligente de Informação

Limites – Aula II Prof. Zé Roque.

Medidas de Dispersão O que é dispersão?

Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Análise de Agrupamento Camilo Daleles Rennó

EXERCÍCIOS DE SÍNTESE 12 DE NOVEMBRO DE Determine o consumo/custo máximo e mínimo de utilidades CorrenteWCp kW/ o C To o C Td o C Q1Q Q2Q2.

Clustering Algorithms for Gene Expression Analysis Pablo Viana Fagner Nascimento.

Aplicação do Algoritmo de Dijkstra - Matching 3ª reunião do Grupo de Estudos – UP&D Fernando Sales e Danilo Lage 22 de fev de 2008.

Professor: André L. R. Didier Autor: Francisco Airton

Programação de computadores

3º Momento Resultados Simare 2014

Estudo das Funções ESTUDO DAS FUNÇÕES 9º ano - Matemática.

CIn-UFPE1 Recuperação Inteligente de Informação Agrupamento de Texto.

Exercício: Contar mentalmente um tempo de 10 segundos

Sobre a Prova Prof. André Aparecido da Silva

Introdução a Programação Aula 02 Jackson Eduardo

Camilo Daleles Rennó Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Análise.

Variância/ Covariância, Correlação Regressão. Variância.

Introdução a Análise de Redes Sociais Aula 07 Dalton Martins Laboratório de Políticas Públicas Participativas Gestão da Informação Universidade.

Técnicas Estatísticas de Agrupamento

Exercícios Crie um algoritmo que leia uma matriz 5x5. Em seguida, conte quantos números pares existem na matriz. Crie um algoritmo que leia uma matriz.

Exercícios de clustering

Transcrição da apresentação:

Exercícios de clustering Mineração de dados Exercícios de clustering

Exercício 2 Para o quadro abaixo, aplique o algoritmo aglomerativo MIN (single link) e apresente o dendograma final.

Passo 1: calcular a tabela de distâncias iniciais 4 6 2 E 7 3 5 d(A,B) = |3-4| + |2-5| = 4 d(A,C) = |3-4| + |2-7| = 6 …. Considerando a menor distância como BC temos o primeiro grupo. O próximo passo é recalcular a matriz de distâncias considerando agora o grupo BC. A B C D E 2

A B C D 4 6 2 E 7 3 5 A BC D 4 6 2 E 7 3 5 d(A,BC)= min(d(A,B), d(A,C)) = min(4,6) = 4 d(D,BC)= min(d(D,B), d(D,C)) = min(4,2) = 2 d(E,BC)= min(d(E,B), d(E,C)) = min(3,3) = 3 A menor distância é entre BC e D que formam o próximo grupo. O próximo passo é recalcular a matriz de distâncias considerando agora o grupo BCD. A B C D E 2

A B C D 4 6 2 E 7 3 5 A BCD 4 E 7 3 d(A,BCD)= min(d(A,B), d(A,C), d(A,D)) = min(4,6,6) = 4 d(E,BCD)= min(d(E,B), d(E,C), d(E,D)) = min(3,3,5) = 3 A menor distância é entre BCD e E que formam o próximo grupo. O próximo passo é recalcular a matriz de distâncias considerando agora o grupo BCDE. d(A,BCDE)= min(d(A,B), d(A,C), d(A,D),d(A,E)) = min(4,6,6,7) = 4 A B C D E 3 2 A B C D E 4 3 2

Exercício 3 Idem ao anterior, mas considerando a similaridade MAX A B 4 6 2 E 7 3 5

Exercício 4 Analisando o dendograma abaixo, quantos clusters deveriam ser utilizados? Porque? Quais são os clusters? A B C D E F G H I 3 clusters (AB, CDEF, GHI)

Exercício 5 Primeiro passo (EPS = 3): calculo da vizinhanca Vizinhanca x1 (x7) Vizinhanca x2(x3,x4,x8), para EPS=3 eh um core Vizinhanca x3 (x2,x6), para EPS=3 e um core Vizinhanca x4(x2,x9) eh core Vizinhanca x5(nada) eh noise Vizinhanca x6(x3) Vizinhanca x7(x1) Vizinhanca x8 (x2) Vizinhanca x9(x4) Segundo passo: x1 é noise porque não é core e não está na vizinhança de um core X2, x3 e x4 são core porque tem pelo menos 2 pontos na vizinhança X5 é noise porque não está na vizinhança de nenhum core e não é core X6 é border porque está na vizinhança de x3 que é core X7 é noise porque não está na vizinhança de nenhum core e não é core X8 é border porque está na vizinhança de x2 que é core X9 é um border porque está na vizinhança do x4 que é um core Considerando os dados acima e o algoritmo DBSCAN, identifique os pontos core, border e noise, para: minPoints=2 e Eps=3 minPoints=2 e Eps=4