A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Programa de Pós-graduação em Biociências Área de Concentração.

Apresentações semelhantes


Apresentação em tema: "Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Programa de Pós-graduação em Biociências Área de Concentração."— Transcrição da apresentação:

1 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Programa de Pós-graduação em Biociências Área de Concentração “Caracterização e Aplicação da Diversidade Biológica” Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Dr. Fernando Frei

2 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Método Hierárquicos Aglomerativos Dr. Fernando Frei Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Iniciam operando a matriz de similaridade, considerando cada objeto como sendo o grupo inicial (cluster). 4. Repetem-se os passos anteriores n-1 vezes, de maneira que todos os n objetos pertençam a um grupo ao fim do algoritmo 1. Na matriz de similaridade procuram-se os dois objetos mais similares 2. Retiram-se os objetos i e j, os quais formam um grupo; eliminando-se a linha e a coluna correspondentes de i e j; 3. Definem-se uma linha e uma coluna obtidas pelas distâncias entre o grupo (ij) e os objetos restantes, de acordo com o procedimento do algoritmo adotado;

3 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Métodos Abordados Single Linkage Complete Linkage Average Linkage Método de Ward

4 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Vizinho mais Próximo (Single Linkage) - Este método, também conhecido por “nearest neighbor”, inicia seu procedimento pela procura dos dois objetos mais similares na matriz de similaridade D 1. O primeiro passo é verificar a distância mínima entre dois objetos, na matriz D, a qual é dada por: ( intersecção entre a coluna 3 e a linha 5 );

5 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Necessitamos obter a distâncias entre os objetos do grupo (CE) e os objetos restantes. Neste ponto o método Single Linkage fica caracterizado, as distâncias entre o grupo (CE) e os demais devem ser as menores; assim teríamos : A B C D A

6 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia.

7 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Características do Single Linkage Em geral, grupos muito próximos podem não ser identificados; Permite detectar grupos de formas não-elipticas; Apresenta pouca tolerância a ruído, pois tem tendência a incorporar os ruídos em um grupo já existente; Apresenta bons resultados tanto para distância Mahalanobis quanto para outras distâncias; Tendência a formar longas cadeias (encadeamento).

8 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Vizinho mais Distante (Complete Linkage) Este método, após agrupar os dois indivíduos mais semelhantes, de menor distância, verifica a distância máxima deste primeiro grupo para os objetos restantes. Desta forma procura garantir que os objetos de um grupo guardem a máxima distância de outros grupos. Utilizaremos a mesma matriz de distância do exemplo anterior para ilustrar os passos deste método. A B C D E

9 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. A B C D A Necessitamos obter a distâncias entre os objetos do grupo (CE) e os objetos restantes. Neste ponto o método Complete Linkage fica caracterizado, as distâncias entre o grupo (CE) e os demais devem ser as maiores; assim teríamos :

10 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Complete Linkage Single Linkage O próximo passo é, novamente, obter a menor distância. O valor é obtido pela intersecção da coluna representada pelo objeto B e da linha representada pelo objeto D, esta distância é igual a 4,5, o que indica a formação de um novo grupo, objetos B e D (BD).

11 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia.

12 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Apresenta bons resultados tanto para a distâncias Mahalanobis quanto para outras distancias; Tendência a formar grupos compactos; Os ruídos demoram para serem incorporados ao grupo. Características do Complete Linkage

13 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Distância Média (Average Linkage) O método da Distância Média procede, inicialmente, da mesma maneira que os métodos anteriores, ou seja, principia por agrupar os dois objetos mais semelhantes. A seguir utiliza a média aritmética das distâncias dos objetos de cada grupo para confeccionar a nova matriz de distâncias A B C D E

14 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Novamente temos como passo inicial a obtenção do grupo (CE), o qual apresenta a distância mínima igual a 2,8. Utilizando a média aritmética, obteremos as novas distâncias que irão compor a nova matriz de distância D2: A B C D E

15 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia.

16 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Características do Avarege Linkage Menor sensibilidade a ruídos que os métodos de ligação simples e completa; Apresenta bons resultados tanto para a distância Mahalanobis quanto para outras distâncias; Tendência a formar grupos com número de elementos similares.

17 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Diferentes Resultados! Pode parecer que, qualquer uma das três metodologias descrita, forneça o mesmo resultado. No exemplo utilizado isto é verdade, pois temos, como resultado dois grupos, o primeiro formado pelos objetos (ECA) e o segundo por (BD), entretanto, em outras situações, onde a estrutura de dados analisada não é tão bem definida, resultados diferentes podem surgir para diferentes algoritmos.

18 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Exemplo

19 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Método de Ward Este método, diferente dos anteriores, tem como característica, a obtenção da soma dos quadrados, a qual chamaremos de SQ, para todos os possíveis grupos. A reunião definitiva dos objetos irá contemplar os menores valores de SQ. Este método pode ser usado diretamente na matriz de dados iniciais.

20 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Exemplo O primeiro passo é calcular o valor de SQ para cada um dos possíveis pares de objetos:

21 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. PassoPossíveis GruposE 1 (AB) (AC) (AD) (AE) (BC) (BD) (BE) (CD) (CE) (DE) CBBBAAAAAACBBBAAAAAA DDCCDCCBBBDDCCDCCBBB EEEBEEBEBCEEEBEEBEBC 74 20 68 08 18 10 34 16 04* 36 2 (CE) (CEA) (CEB) (CED) (AB) (AD) (BD) B A DBADDBDBADDB 78 72 14* 21.3 37.5 3 (CEA) (CEBD) (CE) (BD) A (BDA) 31* 59 105 4 (ABCDE) 115 O primeiro grupo é formado pelos objetos C e E, valor de SQ é o menor (SQ =4). Desta forma, podemos iniciar o segundo passo (passo 2), que consiste na combinação do grupo (CE) com todas as demais possibilidades de agrupamento. Para ilustrar este passo calcularemos:

22 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Continuação...

23 Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Apresenta bons resultados tanto para distâncias Mahalanobis quanto para outras distâncias; Pode apresentar resultados insatisfatórios quando o número de elementos em cada grupo é praticamente igual; Tem tendência a combinar grupos com poucos elementos; Sensível à presença de outliers. Características do Método de Ward


Carregar ppt "Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Programa de Pós-graduação em Biociências Área de Concentração."

Apresentações semelhantes


Anúncios Google