A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

[SCC0271] Introdução à Bioinformática Arvores Filogenéticas Estagiário PAE: Pedro Shiguihara-Juárez Professor: Dilvan de Abreu Moreira Instituto de Ciências.

Apresentações semelhantes


Apresentação em tema: "[SCC0271] Introdução à Bioinformática Arvores Filogenéticas Estagiário PAE: Pedro Shiguihara-Juárez Professor: Dilvan de Abreu Moreira Instituto de Ciências."— Transcrição da apresentação:

1 [SCC0271] Introdução à Bioinformática Arvores Filogenéticas Estagiário PAE: Pedro Shiguihara-Juárez Professor: Dilvan de Abreu Moreira Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo

2 Leitura Introduction to Computational Genomics: A Case Studies Approach – Capítulo 7 Árvores Filogenéticas2

3 Tópicos 1.Arvores 2.Estruturas de árvores filogenéticas 3.Arvores filogenéticas com raiz e sem raiz 4.Considerações na construção de uma árvore 5.Inferência de uma árvore com métodos baseados em distância Árvores Filogenéticas3

4 Arvores Árvores Filogenéticas4 Fonte: Nature.com

5 1/7/2016André de Carvalho - ICMC/USP5 Árvores Filogenéticas Orangutan GorillaChimpanzee Human Fonte: Tree of the Life Website, University of Arizona

6 1/7/2016André de Carvalho - ICMC/USP 6

7 Trajetórias genográficas Árvores Filogenéticas7 Os vikings

8 Relações entre os genes Árvores Filogenéticas8 Fonte: Nature.com

9 Arvore: processo de ramificação Árvores Filogenéticas9 EspéciesLugares Genes

10 Arvore: processo de ramificação Árvores Filogenéticas10 EspéciesLugares Genes (unidade sob comparação) TAXA

11 então.. As árvores permitem representar (ou visualizar) algum processo de ramificação Árvores Filogenéticas11

12 Estrutura de árvores filogenéticas Árvores Filogenéticas12 Fonte: Nature.com

13 Partes de uma árvore Árvores Filogenéticas13 humano rato baiacu Drosophila raiz Ramo Nó interno Nó externo (folha) tempo

14 Partes de uma árvore Árvores Filogenéticas 14 Antepassados (não necessariamente mas geralmente extintos) Taxa tempo Taxa

15 Arvore simples Árvores Filogenéticas 15 Apresenta 2 taxa só 1 possível topologia A C B

16 Arvore simples Árvores Filogenéticas 16 Apresenta 2 taxa só 1 possível topologia A C B A B C = Qualquer rotação de ramos sobre um nó interno não muda as relações entre os táxons A, B e C. (Taxon: plural de taxa)

17 Arvore com bifurcação Árvores Filogenéticas 17 Se X é nó interno tem grau: g(x) = 3, exceto a raiz B E D Normalmente assumimos que a verdadeira árvore está se bifurcando Se Y é nó externo tem grau: g(y) = 1 C G F A G(A) = 2 G(B) = G(C) = 3 G(D) = G(E) = G(F) = G(G) = 1

18 Arvore com multifurcações Árvores Filogenéticas 18 Se X é nó interno g(x) > 3 Nós internos podem ter mais de dois filhos E D Normalmente utilizado para representar incerteza na ordem de divisão dos eventos H F BC A G I

19 Arvores filogenéticas com raiz e sem raiz Árvores Filogenéticas19 Fonte: Nature.com

20 Arvore com raiz Árvores Filogenéticas 20 Nó interno especial RAIZ IMLK AF UR Para o que a raiz é útil?

21 Arvore com raiz Árvores Filogenéticas 21 Nó interno especial RAIZ IM RAIZ: É o ancestral comum Dá uma orientação: todos os caminhos levam de volta para a raiz LK AF UR Para o que a raiz é útil?

22 Arvore sem raiz Árvores Filogenéticas 22 Não tem antepassado comum Arvore sem orientação 1 L4 L2 L3 2 3 L5 L1 Como encontrar a raiz? Informação biológica externa Suposição sobre onde deveria estar a raiz

23 Arvore sem raiz Árvores Filogenéticas 23 Não tem antepassado comum Arvore sem orientação Nó externo humano ratobaiacu Drosophila raiz Ramo ou aresta Nó interno

24 Arvore sem raiz Árvores Filogenéticas 24 Uma forma de encontrar a raiz: B A C 21 5 18 13 Outgroup Study group d1 d2 d1 < d2

25 Considerações na construção de uma árvore Árvores Filogenéticas25 Fonte: Nature.com

26 Número de possíveis árvores Árvores Filogenéticas 26  Reconstrução de árvores filogenéticas a partir de sequências de DNA: Complicado pelo grande número de possíveis árvores Com raizSem raiz n  2n  3

27 Número de possíveis árvores Árvores Filogenéticas 27  Exercício 1 Qual é o número de possíveis árvores para comparar: macacos, ratos e cães utilizando uma árvore com raiz e sem raiz. Qual é o número de possíveis árvores para comparar: homens, aves, macacos, ratos e cães utilizando uma árvore com raiz e sem raiz. Resposta Com sem

28 Número de possíveis árvores Árvores Filogenéticas 28  Exercício 1 Qual é o número de possíveis árvores para comparar: macacos, ratos e cães utilizando uma árvore com raiz e sem raiz. 1 Resposta Qual é o número de possíveis árvores para comparar: homens, aves, macacos, ratos e cães utilizando uma árvore com raiz e sem raiz. 15 3 105 Com sem

29 Representação de árvores Árvores Filogenéticas 29 9 87 3 6 2145 9 8 7 8 3 6 74 5 61 2 5 - - 4 - - 3 - - 2 - - 1 - - (((1,2),3),((4,5),(6,7))) (utilizado no formato Newick) 2. Representação: Parênteses 1. Representação: Array

30 Inferência de uma árvore com métodos baseados em distância Árvores Filogenéticas30 Fonte: Nature.com

31 Inferência de uma árvore Árvores Filogenéticas 31  Como inferir uma árvore? A partir da distância genética

32 Inferência de uma árvore Árvores Filogenéticas 32  Como inferir uma árvore? A partir da distância genética  Como obter a distância genética? A partir do alinhamento das sequências

33 Inferência de uma árvore Árvores Filogenéticas 33  Como inferir uma árvore? A partir da distância genética  Como obter a distância genética? A partir do alinhamento das sequências  Isso é tudo? Distâncias têm que ser corrigidas por causa de múltiplas substituições

34 Inferência de uma árvore Árvores Filogenéticas 34  Como inferir uma árvore? A partir da distância genética  Como obter a distância genética? A partir do alinhamento das sequências  Isso é tudo? Distâncias têm que ser corrigidas por causa de múltiplas substituições Exemplo: algoritmo de Jukes-Cantor

35 Inferência de uma árvore Árvores Filogenéticas 35 DNA mãe : tctgcctc tctgcctcgatgcctc gatgcatcgacgcctc Caso 1:

36 Inferência de uma árvore Árvores Filogenéticas 36 DNA mãe : tctgcctc tctgcctcgatgcctc gatgcatcgccgcctc Caso 2: Duas mutações na mesma posição Algoritmo Jukes-Cantor (gctgcctc)

37 Matriz de distância Árvores Filogenéticas 37  Distância aditiva Biologicamente, aditividade é uma propriedade importante para uma matriz de distância Número de substituições separando duas taxa de seu último ancestral comum forma uma distância aditiva. Distância sobre o caminho do nó i ao nó j Modelo de Jukes-Cantor é frequentemente usado como modelo de substituição.

38 Matriz de distância Árvores Filogenéticas 38 9 8 7 L3 6 L2L1L4L5 1 1 1 1 2 2 2

39 UPGMA Árvores Filogenéticas 39 Comprimento do ramo assume “relógio molecular” (ultrametricidade) A C B Cada filho tem igual comprimento respeito ao seu pai 2 2 Ultrametricidade extremamente simples para encontrar comprimento do ramo Unweighted Pair Group Method with Arithmetic Averages UPGMA Um dos primeiros métodos baseados em distância

40 UPGMA Árvores Filogenéticas 40 1.Selecionar nós i e j, de tal forma que, Dij é a menor distância da árvore 2.Criar novo grupo (ij) 3.Conectar nó i ao grupo ij (Di(ij)=Dij/2). Conectar nó j ao grupo ij (Dj(ij)=Dij/2). 4.Calcular distâncias do grupo ij a todos os demais nós k da árvore (k!=i e k!=j) 5.Excluir as colunas e linhas da matriz de dados que correspondem ao grupo de i e j. Adicionar uma coluna e linha para o grupo (ij). 6.Se houver apenas um item na matriz de dados, pare. Caso contrário, volte ao passo 1. Unweighted Pair Group Method with Arithmetic Averages

41 UPGMA Árvores Filogenéticas 41  Exemplo: (Fonte: Mona Singh – U. Princeton)

42 UPGMA Árvores Filogenéticas 42  Unweighted Pair Group Method with Arithmetic Averages

43 UPGMA Árvores Filogenéticas 43  Unweighted Pair Group Method with Arithmetic Averages

44 UPGMA Árvores Filogenéticas 44  Unweighted Pair Group Method with Arithmetic Averages  Se uma árvore com valores exatos existe? Exemplo:

45 UPGMA Árvores Filogenéticas 45  Quase nunca é válida para sequências de DNA  Pode levar a inferência incorreta

46 Neighbor-Joining Árvores Filogenéticas 46 Desenvolvido em 1987 por Naruya Saitou e Masatochi Nei Algoritmo guloso (greedy) Iterativamente combina pares de nós Chave para sucesso do algoritmo: Nós que são topologicamente vizinhos na árvore são combinados Processo repetido até que todas as taxa sejam combinadas Arvore gerada é sem raiz

47 Neighbor-Joining Árvores Filogenéticas 47 Fórmula 3-pontos: L x + L y = d AB L x + L z = d AC L y + L z = d BC L x = (d AB +d AC -d BC )/2 L y = (d AB +d BC -d AC )/2 L z = (d AC +d BC -d AB )/2 A B centro C LxLx LyLy LzLz Cálculo do tamanho dos ramos – Supor 3 taxa em uma árvore sem raiz

48 Neighbor-Joining Árvores Filogenéticas 48 Usa condição de 4-pontos para selecionar nós vizinhos a serem combinados – Supor que 1 e 2 são vizinhos d(1,2) + d(i,j) < d(i,1) + d(2,j) R i = ∑ j d(i,j) M(i,j) = (n-2)d(i,j) – R i – R j M(i,j) < M(i,k) para todo k  j 1 2 centro i LxLx LyLy LzLz j LqLq Grau de vizinhancidade

49 Neighbor-Joining Árvores Filogenéticas 49 Entrada: matriz nxn de distancias D e um outgroup Output: árvore filogenética T com raiz 1: Atualizar tabela M usando D e escolher menor valor de M para selecionar duas taxa para combinar 2: Combinar duas taxa t i e t j em um novo nó V e usar fórmula de 3-pontos para atualizar a matriz de distâncias D’ onde t i e t j são substituídos por V. 3: Calcular tamanho dos ramos de t k a V usando a fórmula de 3-pontos, T(V,1) = t i e T(V,2) = t j, TD(t i ) = L(t i,V) e TD(t i ) = L(t i,V) 4: Matriz de distâncias D’ agora tem n – 1 taxa. se existe mais 2 taxa ir para 1: se existem 2 taxa, combina-las por um ramo de tamanho d(t i,t j ). 5: Definir o nó raiz como o ramo ligando o outgroup ao resto da árvore

50 Estudo de caso: SARS Árvores Filogenéticas50 Fonte: Nature.com

51 Estudo de casos: SARS Árvores Filogenéticas 51 SARS - Severe Acute Respiratory Syndrome Causada pelo SARS coronavirus (SARS-COV) Análise filogenética da epidemia de SARS Genoma do SARS-CoV tem 6 genes O que queremos saber? Árvore epidemiológica Data de origem Área de origem

52 1/7/2016André de Carvalho - ICMC/USP52 Coronavirus SARS www.cell-research.com Termo corona vem da coroa que aparece quando o vírus é observado em um microscópio eletrônico

53 1/7/2016André de Carvalho - ICMC/USP53 Epidemia de SARS Coronavírus – Patógenos que causam uma grande variedade de doenças em animais Qualquer organismo capaz de causar doença infecciosa – Podem apresentar mutações frequentes e, assim, infectar outras espécies – Outros coronavírus foram identificados como causadores de hepatite em ratos e gastrenterite em suínos – É o vírus mais comum em patologia veterinária

54 SARS: Por que sabemos que veio da civeta? Árvores Filogenéticas 54

55 1/7/2016André de Carvalho - ICMC/USP55 Origem da Epidemia de SARS Abril de 2003 – Laboratório canadense sequência a sequência de RNA do vírus SARS CoV – Análise filogenética do vírus mostrou que o coronavirus mais próximo é o da civeta – Alimento popular em Guangdong - China

56 SARS: Como se espalhou? Árvores Filogenéticas 56

57 SARS: Por que o inicio em Guangdong? Árvores Filogenéticas 57 Menor variação fora da província de Guangdong

58 SARS: Em que data? Árvores Filogenéticas 58 Com 95% de confiança, 16 de setembro de 2002

59 1/7/2016André de Carvalho - ICMC/USP59 SARS Número de Casos Reportados

60 Conclusão Árvores Filogenéticas 60 Construção de árvores filogenéticas Algoritmo UPGMA Algoritmo Neighbor-Joining Estudo de Casos: SARS

61 Perguntas? Árvores Filogenéticas 61


Carregar ppt "[SCC0271] Introdução à Bioinformática Arvores Filogenéticas Estagiário PAE: Pedro Shiguihara-Juárez Professor: Dilvan de Abreu Moreira Instituto de Ciências."

Apresentações semelhantes


Anúncios Google