A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Revisão de conceitos relacionados à inferência filogenética

Apresentações semelhantes


Apresentação em tema: "Revisão de conceitos relacionados à inferência filogenética"— Transcrição da apresentação:

1 Revisão de conceitos relacionados à inferência filogenética
Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados Almir R. Pepato

2 O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas por árvores não-enraizadas, definido pela fórmula: Os métodos de inferência filogenéticas são os que permitem a escolha, dentre todas essas hipóteses, daquela que consideramos a que melhor representa as relações de ancestralidade dentre os terminais em consideração.

3 Representando filogenias
Ramos: N= (2i-3)= 7 Árvore não enraizada Número de árvores não enraizadas: Cada árvore que antecede a árvore com i terminais possui 2i-5 ramos, assim ela produz : Árvores. Exemplo:

4 Representando filogenias
Árvores enraizadas: Apresentam informação temporal. Há muito mais, já que podemos inserir a raiz em qualquer nó. No exemplo:

5 Representando filogenias
(((A, B), (C, D)), E); Bipartições ou splits

6 Representando filogenias
Árvore aditiva: A distância entre qualquer par de OTUs é a soma dos comprimentos de ramo que as separam. Comprimentos de ramos estimados de maneira independente. Portanto devem ser calculados N= (2i-3)= 7 Ramos. Árvore ultramétrica: Todas as OTU equidistantes da raiz. Ramos a serem calculados: (i-1)=4 Pois: L1=L2+L4+L8 L4+L8 = L3+L5 L5 = L6 L7=L8

7 O problema Número de clados Enraizada Não-enraizada 2 1 3 4 15 5 105 6
954 7 10,395 8 135,135 9 2,027,025 10 34,459,425

8 Métodos de inferência A- Algoritmos- Uma série de passos que conduzem à árvore filogenética. A1-Análises de agrupamento (UPGMA) A2- Neighbour Joining B- Critérios de Otimização – Emprega uma função objetiva para comparar as hipóteses filogenéticas. B1- Máxima Parcimônia B2- Máxima Verossimilhança B3- Evolução Mínima B4- Mínimos Quadrados C- Inferência Bayesiana - Avalia a probabilidade posterior dos clados formados pelos terminais sob consideração.

9 Parcimônia De forma independente, Luca Cavalli-Sforza e Anthony Edwards em 1963 e Camin e Sokal em 1965 chegaram a parcimônia como critério para otimização de cladogramas em caso de conflito entre caracteres (homoplasia) William de Ockham ( ou 1348) “entia non sunt multiplicanda praeter necessitatem”

10 Parcimônia Função objetiva da parcimônia:

11 Parcimônia

12 Parcimônia de Fitch G C Premissas: Caracteres não polarizados e não ordenados. Todas as mudanças de caráter com o mesmo custo. 1- Para cada terminal atribua um estado de caráter conforme a matriz à sua disposição. Estabeleça arbitrariamente uma raiz (ela não muda o comprimento da árvore). A A C

13 Parcimônia de Fitch Visite um nó interno para o qual se conhece o conjunto de caracteres Sk para os dois descendentes (Si, Sj) imediatos. Assinale a ele um conjunto de valores Sk conforme as regras: A- Se então , nesse caso deve-se acrescentar 1 ao comprimento da árvore; B- Se então nesse caso não se acrescenta nada ao comprimento da árvore. Comprimento: 3 A C C G Y 1 X 1 A Z W 1

14 Generalizando... Parcimônia de Sankoff
T 1 A B C D 1 2 3 Parcimônia de Fitch Parcimônia de Dollo, caracteres ordenados: A-B-C-D A B C D 1 2 3 As matrizes de Sankoff permitem que o procedimento apresentado para a parcimônia de Fitch seja generalizado para outras situações. Parcimônia de Wagner, caracteres ordenados: A-B-C-D

15 Generalizando... Parcimônia de Sankoff

16 Métodos de distância Algorítmos de agrupamento (não otimizam uma função): 1-UPGMA (Árvores ultramétricas) 2-Neighbour Joining 3- Neighbourliness 4- “Transformed distance method” Evolução Mínima: Otimiza a função (busca a árvore que oferece a melhor nota):

17 UPGMA OTU A B C D dAB dAC dBC dAD DBD DCD OTU (AB) C D d(AB)C d(AB)D
A raiz é posta em:

18 Neighbor-Joining Passo a passo: 1- Começamos com uma matriz de distância relacionando n OTUs. 2- Uma nova matriz é calculada (Matriz Q). Nessa matriz a separação de cada par de terminais é ajustada com base na sua divergência média desde todos os outros terminais. 3- Agrupe dois terminais ao acaso:

19 Neighbor-Joining 4- Calcule o comprimento da árvore sabendo que:
Distância do par de membros ao novo nó: Distância dos demais OTUs ao novo nó:

20 Neighbor-Joining 5- Determine o comprimento para todas as combinações de duas OTUs. Escolha a que minimiza o comprimento da árvore. 6- Recalcule a matriz de distâncias de considerando os dois terminais escolhidos como um único táxon. 7- Repita o processo até obter uma árvore completamente resolvida.

21 Neighbor-Joining

22 Mínimos Quadrados

23 Mínimos Quadrados OTU A B C D dAB dAC dBC dAD DBD DCD

24 Algoritmos de busca B C Árvore inicial, três espécies ao acaso. 1 A Adiciona-se o próximo táxon (D) (três árvores): Impraticável para um número maior de terminais!!!!! E E E B D E D C B C E B C D E 2a 2b 2c E E E A A E A E E E Adiciona-se o quinto táxon(E) (15 árvores)....

25 Stepwise addition B C Árvore inicial, três espécies ao acaso. 1 A Adiciona-se o próximo táxon (D) (três árvores): E A ordem em que são acrescidos os terminais determina o resultado da busca. B D E D C B C B C D E 2a 2b 2c A A A E E Escolhe-se a melhor árvore e adiciona-se o quinto táxon(E) (5 árvores)....

26 Star-tree decomposition
A ordem em que são agrupados os terminais determina o resultado da busca. Mais lento que o anterior: as árvores tem sempre o mesmo número de terminais.

27 Nearest-neighbor interchanges (NNI)

28 Subtree pruning and regrafting (SPR)

29 Tree bisection and reconnection (TBR)

30 Algoritmos de Busca

31 Novas Tecnologias Ratchet:
Desenhado para maximizar o número de pontos iniciais e reduzir o tempo gasto na procura a partir de cada ponto inicial e assim examinar mais ilhas de árvores. Perturba os dados mudando o peso a eles atribuído. Tree fusing (TF): Troca de sub-grupos idênticos entre árvores diferentes. Sectorial Seaches (SS): Tipo especial de avaliação de rearranjo, que necessita de uma árvore como ponto inicial. Seleciona diferentes setores da árvore e os re-analisa separadamente. Se uma configuração melhor é encontrada, ela é substituída na árvore inicial.

32 Novas Tecnologias Tree Drifting (DFT):
Soluções sub-ótimas são aceitas durante o rearranjo, com uma certa probabilidade. A probabilidade de aceitar uma solução sub-ótima depende da Relative Fit Difference (RFD) e a diferença de comprimento entre a nova e a velha solução. RFDAB = (F–C)/F F = Soma das diferenças de passos nas duas árvores (A e B) que melhor ajusta (fit) a árvore A C = Soma dos caracteres que melhor ajustam (fit) a árvore B

33 Índices Índice de consistência (CI)- É a medida de quão bem um caráter ajusta-se a uma topologia. É calculado dividindo-se o menor número possível de passos do caráter pelo número de passos observados ao longo da topologia. Ou então é uma medida de homoplasia de uma árvore, sendo dado por: CI = Número total de mudanças de estado esperado dada a matriz de dados X 100/ Número de passos na árvore CI= 6*100/7 = 85,7

34 Índices

35 Índices Índice de retenção (RI):
RI = Número máximo de passos na árvore – número de mudanças de estado na árvore X 100/número máximo de passos na árvore – número de mudanças de estado nos dados

36 Suporte Bootstrap

37 Suporte Bootstrap

38 Suporte Suporte de Bremer:
Quanta homoplasia é necessária para derrubar um clado? Ex: A menor árvore que NÃO tem o clado (A C) é dois passos mais longa que a árvore apresentada.

39 Problemas com a Parcimônia

40 Qual método empregar? Huelsenbeck et al., 1996

41 Qual método empregar? Huelsenbeck et al., 1996

42 O uso da distância para inferência filogenética
1- Há perda de informação com a conversão da matriz de caracteres em matriz de distâncias. 2- O comprimento dos ramos de uma árvore de distância não são independentes, mas calculados em relação aos demais. Assim mesmo que as distâncias sejam corrigidas com o emprego de modelos estocásticos, elas serão sub-estimativas. Qualquer “problema” relacionado a um dos ramos (mudança na frequência das bases, ramo especialmente longo) será propagado ao longo de toda a filogenia.

43 Substituições multiplas
Distância genética p difere da distância aparente D, devido às substituições múltiplas.


Carregar ppt "Revisão de conceitos relacionados à inferência filogenética"

Apresentações semelhantes


Anúncios Google