A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Métodos geométricos (baseados em distância). Cálculo de Distâncias As distâncias evolutivas são calculadas para todos os pares de taxa (ou OTUs) e a árvore.

Apresentações semelhantes


Apresentação em tema: "Métodos geométricos (baseados em distância). Cálculo de Distâncias As distâncias evolutivas são calculadas para todos os pares de taxa (ou OTUs) e a árvore."— Transcrição da apresentação:

1 Métodos geométricos (baseados em distância)

2 Cálculo de Distâncias As distâncias evolutivas são calculadas para todos os pares de taxa (ou OTUs) e a árvore é construída considerando as relações entre estes valores

3

4 Estatísticas das Seqüências Conteúdo de bases Distância das sequências par a par transiçoes/transversões (0,5) Ou 2x trans/transv (1,0) Todas estas estatísticas são levadas em conta na escolha do modelo de substituição a ser utilizado

5 Cálculo de Distâncias Distância p

6 Se as seqüências forem muito distintas, p pode ser subestimado por homoplasias Com isso, algumas correções são necessárias Como regra geral: se p > 0,3 a distância calculada por p é uma subestimativa Se p > 0,5 – metade dos aa são diferentes... Se p > 0,15 – utilizar algum modelo de substituição para corrigir a estimativa

7 Jukes-Cantor (d) - JC Correção que leva em conta a possibilidade de substituições de bases A T C G A - α α α T α - α α C α α - α G α α α -

8 Substituições ocorrem com igual frequência em todos os nn, e que cada nn muda para qualquer outro com uma probabilidade α por ano (r = 3 α) r é a taxa de substituição por sítio e por ano. Considere duas sequencias, X e Y que divergiram de um ancestral há t anos Seja q t a proporção de sítios idênticos e p t a proporção de sítios diferentes (1 – q t ) Jukes-Cantor (d) - JC

9 Proporção de sítios idênticos em t+1: Probabilidade de que um sítio idêntico em t continue idêntico em t+1: (1 – r) 2 = 1 – 2r + r 2 1 – 2r probabilidade de que um sítio diferente em t se torne idêntico em t+1 2r/3 Jukes-Cantor (d) - JC

10 Seja X i e Y j em t: Para que sejam idênticos em t+1: X i X j e Y j Y j ; α (1 – r) ou X i X i e Y j Y i ; (1 – r) α 2. α (1 – r ) = 2. r/3 (1-r) = 2r/3 – 2r 2 /3 2r/3

11 Então: Ou: Jukes-Cantor (d) - JC

12 Então: Ou: Jukes-Cantor (d) - JC Sítio idêntico em t que continua idêntico

13 Então: Ou: Jukes-Cantor (d) - JC Sítio idêntico em t que continua idêntico Sítio não idêntico em t que passou a ser idêntico

14 Representando q t+1 – q t por dq/dt: Em condições iniciais q = 1 em t = 0: Jukes-Cantor (d) - JC

15 Se p = (1 - q) Sendo d a proporção de nn que se modificaram com o tempo: d = 2r. t Jukes-Cantor (d) - JC

16

17

18 Kimura 2 parâmetros – K80 Correção que leva em conta probabilidades diferentes de transições e transversões A T C G A - β β α T β - α β C β α - β G α β β -

19 r = α + 2β Transições As transversões Kimura 2 parâmetros – K80

20 Tamura Leva em conta as diferenças em transições e transversões (α e β), além da frequência diferencial de CG. A T C G A - βθ 2 βθ 1 αθ 1 T βθ 2 - αθ 1 βθ 1 C βθ 2 αθ 2 - βθ 1 G αθ 2 βθ 2 βθ 1 - θ 1 = frequência de CG θ 2 = freqüência de AT

21 Tamura-Nei (TrN) Leva em conta as diferenças em transições e transversões (α e β), além da frequência diferencial de bases (g). A T C G α 1 g G A - βg T βg C α 1 g G α 2 g C T βg A - α 2 g C βg G α 2 g T C βg A α 2 g T - βg G α 1 g A G α 1 g A βg T βg C - g A, g T, g C, g G = frequência de cada uma das bases

22

23 Tajima-Nei (F81) Leva em conta apenas as diferentes freqüências das bases: A T C G A - αg T αg C α 1 g G T αg A - αg C α 1 g G C αg A αg T - α 1 g G G αg A αg T αg C - g A, g T, g C, g G = frequência de cada uma das bases

24 General Time Reversible (GTR) Leva em conta diferentes freqüências de bases e de substituições A T C G A - ag T bg C cg G T ag A - dg C eg G C bg A dg T - fg G G cg A eg T fg C - g A, g T, g C, g G = frequência de cada uma das bases a, b, c, d, e, f = probabilidade de substituição

25 Distâncias Gamma Nas distâncias consideradas anteriormente, assume-se que a taxa de substituições nucleotídicas é a mesma para todos os sítios... Na verdade, isso dificilmente é assim, e esta taxa varia de sítio para sítio.

26 Parâmetro a ser ajustado = α Distâncias Gamma α=0,2 α=1 α=2 α=5 α=10

27 UPGMA (Unweighted Pair-Group Method with Arithmetic Mean) É o mais simples e intuitivo dos métodos Se baseia nas médias das distâncias entre as OTUs Parte do princípio de que o relógio molecular está funcionando A B D E F G H I C Tempo

28 Exemplo numérico Localizar a menor distância: ABCDEF AX B1X C45X D634X E9924X F78353X

29 Exemplo numérico Localizar a menor distância: ABCDEF AX B1X C45X D634X E9924X F78353X

30 Exemplo numérico Localizar a menor distância: ABCDEF AX B1X C45X D634X E9924X F78353X

31 Calcular médias ABCDEF X CX D4X E24X F353X ABCDEF AX B1X C45X D634X E9924X F78353X

32 CDEF X C4,5X D4X E24X F353X ABCDEF AX B1X C45X D634X E9924X F78353X

33 ABCDEF X C4,5X D 4X E24X F353X ABCDEF AX B1X C45X D634X E9924X F78353X

34 ABCDEF X C4,5X D 4X E924X F353X ABCDEF AX B1X C45X D634X E9924X F78353X

35 ABCDEF X C4,5X D 4X E924X F7,5353X ABCDEF AX B1X C45X D634X E9924X F78353X

36 ABCDEF X C4,5X D 4X E924X F7,5353X

37 ABCDEF X C4,5X D 4X E924X F7,5353X

38 ABCDEF X C4,5X D 4X E924X F7,5353X

39 ABCDEF AX B1X C45X D634X E9924X F78353X ABCEDF ABX CEX DX F5X

40 ABCDEF AX B1X C45X D634X E9924X F78353X ABCEDF ABX CEX DX F5X (d AC +d AE +d BC =d BE )/4

41 ABCDEF AX B1X C45X D634X E9924X F78353X ABCEDF ABX CE6,75X DX F5X (d AC +d AE +d BC =d BE )/4

42 ABCDEF AX B1X C45X D634X E9924X F78353X ABCEDF ABX CE6,75X D4,5X F7,55X Repetindo a matriz anterior

43 ABCDEF AX B1X C45X D634X E9924X F78353X ABCEDF ABX CE6,75X D4,5X F7,55X (d CD +d ED )/2

44 ABCDEF AX B1X C45X D634X E9924X F78353X ABCEDF ABX CE6,75X D4,54X F7,55X (d CD +d ED )/2

45 ABCDEF AX B1X C45X D634X E9924X F78353X ABCEDF ABX CE6,75X D4,54X F7,535X (d CF +d EF )/2

46 ABCEDF ABX CE6,75X D4,54X F7,535X

47 ABCEFD ABX CEF7X D4,54,3X Calcular as médias (d AC +d AE +d AF +d BC +d BE +d BF )/6; (d CD +d ED +d FD )/3

48 ABCEFD ABX CEFD6.3X Calcular a média (d AC +d AD +d AE +d AF +d BC +d BD +d BE +d BF )/8

49 Matriz cofenética ABCDEF AX B1X C6,3 X D 4,3X E6,3 24,3X F6,3 34,33X

50 Comparação entre matrizes... Original Cofenética ABCDEF AX B1X C6,3 X D 4,3X E6,3 24,3X F6,3 34,33X ABCDEF AX B1X C45X D634X E9924X F78353X

51 Quando a taxa de substituição de nucleotídeos varia de uma linhagem para a outra, o UPGMA fornece a topologia incorreta Nestes casos é necessário utilizar métodos que permitam taxas evolutivas diferentes entre os organismos UPGMA - Limitações

52 Evolução Mínima Método que busca, dentre todas as árvores possíveis, aquela cuja soma dos tamanhos de ramos é a menor (parte do princípio que a árvore verdadeira seria a que contém os menores tamanhos de ramos) Limitações: como o número de topologias possíveis é muito grande, a busca pode tornar-se lenta

53 Neighbor Joining (NJ) Saitou & Nei (1987) Método baseado no princípio da evolução mínima Não examina todas as topologias, mas requer o princípio da EM em todos os estágios (é uma simplificação da EM)

54 Conceito de vizinhos – dois taxa conectados por um único nó numa árvore não enraizada (1,2 e 5,6) Neighbor Joining (NJ)

55

56 Algoritmo: Início com uma topologia em estrela Somar todos os tamanhos de ramos da árvore inicial (S 0 ) Tomar um par de vizinhos, estabelecer a distância entre este par e todos os outros Estimar S i,j Repetir o procedimento para todos os pares de vizinhos até encontrar o menor S. Neighbor Joining (NJ)

57

58

59 Neighbor-Joining

60 Testes Estatísticos Bootstrap: é o mais utilizado, faz uma reamostragem dos sítios com reposição: G AA A A A C C CA T TT T T TT T T C C C C G G G G G T T T C C C AA A A A T T T T T T T N G G G G G G G G e b o k e f e h c j k f m n i AA A A A C C C C G AA A A A AA A A A C C CA T TT T T TT T T C C C C AA A A A G G G G G T T T C C C AA A A A T T T T T T T N G G G G G G G G a b c d e f g h i j k l m n o a b c d c f g h d j o l m n o G AA A A A AA A A A C C C T T T T T C C C C AA A A A G G G G G C C C AA A A A T T T T T T T N G G G G G G G G C C C T G G G G T T T T

61 Bibliografia Li W-H Molecular Evolution. Sinauer Ass. Publish. Matioli, S.R Biologia Molecular e Evolução. Editora Holos, São Paulo. Nei, M. & Kumar, S Molecular Evolution and Phylogenetics. Oxford University Press.


Carregar ppt "Métodos geométricos (baseados em distância). Cálculo de Distâncias As distâncias evolutivas são calculadas para todos os pares de taxa (ou OTUs) e a árvore."

Apresentações semelhantes


Anúncios Google