Carregar apresentação
A apresentação está carregando. Por favor, espere
PublicouRebeca Molinari Cesário Alterado mais de 7 anos atrás
1
[SCC0271] Introdução à Bioinformática Arvores Filogenéticas Estagiário PAE: Pedro Shiguihara-Juárez Professor: Dilvan de Abreu Moreira Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo
2
Leitura Introduction to Computational Genomics: A Case Studies Approach – Capítulo 7 Árvores Filogenéticas2
3
Tópicos 1.Arvores 2.Estruturas de árvores filogenéticas 3.Arvores filogenéticas com raiz e sem raiz 4.Considerações na construção de uma árvore 5.Inferência de uma árvore com métodos baseados em distância Árvores Filogenéticas3
4
Arvores Árvores Filogenéticas4 Fonte: Nature.com
5
1/7/2016André de Carvalho - ICMC/USP5 Árvores Filogenéticas Orangutan GorillaChimpanzee Human Fonte: Tree of the Life Website, University of Arizona
6
1/7/2016André de Carvalho - ICMC/USP 6
7
Trajetórias genográficas Árvores Filogenéticas7 Os vikings
8
Relações entre os genes Árvores Filogenéticas8 Fonte: Nature.com
9
Arvore: processo de ramificação Árvores Filogenéticas9 EspéciesLugares Genes
10
Arvore: processo de ramificação Árvores Filogenéticas10 EspéciesLugares Genes (unidade sob comparação) TAXA
11
então.. As árvores permitem representar (ou visualizar) algum processo de ramificação Árvores Filogenéticas11
12
Estrutura de árvores filogenéticas Árvores Filogenéticas12 Fonte: Nature.com
13
Partes de uma árvore Árvores Filogenéticas13 humano rato baiacu Drosophila raiz Ramo Nó interno Nó externo (folha) tempo
14
Partes de uma árvore Árvores Filogenéticas 14 Antepassados (não necessariamente mas geralmente extintos) Taxa tempo Taxa
15
Arvore simples Árvores Filogenéticas 15 Apresenta 2 taxa só 1 possível topologia A C B
16
Arvore simples Árvores Filogenéticas 16 Apresenta 2 taxa só 1 possível topologia A C B A B C = Qualquer rotação de ramos sobre um nó interno não muda as relações entre os táxons A, B e C. (Taxon: plural de taxa)
17
Arvore com bifurcação Árvores Filogenéticas 17 Se X é nó interno tem grau: g(x) = 3, exceto a raiz B E D Normalmente assumimos que a verdadeira árvore está se bifurcando Se Y é nó externo tem grau: g(y) = 1 C G F A G(A) = 2 G(B) = G(C) = 3 G(D) = G(E) = G(F) = G(G) = 1
18
Arvore com multifurcações Árvores Filogenéticas 18 Se X é nó interno g(x) > 3 Nós internos podem ter mais de dois filhos E D Normalmente utilizado para representar incerteza na ordem de divisão dos eventos H F BC A G I
19
Arvores filogenéticas com raiz e sem raiz Árvores Filogenéticas19 Fonte: Nature.com
20
Arvore com raiz Árvores Filogenéticas 20 Nó interno especial RAIZ IMLK AF UR Para o que a raiz é útil?
21
Arvore com raiz Árvores Filogenéticas 21 Nó interno especial RAIZ IM RAIZ: É o ancestral comum Dá uma orientação: todos os caminhos levam de volta para a raiz LK AF UR Para o que a raiz é útil?
22
Arvore sem raiz Árvores Filogenéticas 22 Não tem antepassado comum Arvore sem orientação 1 L4 L2 L3 2 3 L5 L1 Como encontrar a raiz? Informação biológica externa Suposição sobre onde deveria estar a raiz
23
Arvore sem raiz Árvores Filogenéticas 23 Não tem antepassado comum Arvore sem orientação Nó externo humano ratobaiacu Drosophila raiz Ramo ou aresta Nó interno
24
Arvore sem raiz Árvores Filogenéticas 24 Uma forma de encontrar a raiz: B A C 21 5 18 13 Outgroup Study group d1 d2 d1 < d2
25
Considerações na construção de uma árvore Árvores Filogenéticas25 Fonte: Nature.com
26
Número de possíveis árvores Árvores Filogenéticas 26 Reconstrução de árvores filogenéticas a partir de sequências de DNA: Complicado pelo grande número de possíveis árvores Com raizSem raiz n 2n 3
27
Número de possíveis árvores Árvores Filogenéticas 27 Exercício 1 Qual é o número de possíveis árvores para comparar: macacos, ratos e cães utilizando uma árvore com raiz e sem raiz. Qual é o número de possíveis árvores para comparar: homens, aves, macacos, ratos e cães utilizando uma árvore com raiz e sem raiz. Resposta Com sem
28
Número de possíveis árvores Árvores Filogenéticas 28 Exercício 1 Qual é o número de possíveis árvores para comparar: macacos, ratos e cães utilizando uma árvore com raiz e sem raiz. 1 Resposta Qual é o número de possíveis árvores para comparar: homens, aves, macacos, ratos e cães utilizando uma árvore com raiz e sem raiz. 15 3 105 Com sem
29
Representação de árvores Árvores Filogenéticas 29 9 87 3 6 2145 9 8 7 8 3 6 74 5 61 2 5 - - 4 - - 3 - - 2 - - 1 - - (((1,2),3),((4,5),(6,7))) (utilizado no formato Newick) 2. Representação: Parênteses 1. Representação: Array
30
Inferência de uma árvore com métodos baseados em distância Árvores Filogenéticas30 Fonte: Nature.com
31
Inferência de uma árvore Árvores Filogenéticas 31 Como inferir uma árvore? A partir da distância genética
32
Inferência de uma árvore Árvores Filogenéticas 32 Como inferir uma árvore? A partir da distância genética Como obter a distância genética? A partir do alinhamento das sequências
33
Inferência de uma árvore Árvores Filogenéticas 33 Como inferir uma árvore? A partir da distância genética Como obter a distância genética? A partir do alinhamento das sequências Isso é tudo? Distâncias têm que ser corrigidas por causa de múltiplas substituições
34
Inferência de uma árvore Árvores Filogenéticas 34 Como inferir uma árvore? A partir da distância genética Como obter a distância genética? A partir do alinhamento das sequências Isso é tudo? Distâncias têm que ser corrigidas por causa de múltiplas substituições Exemplo: algoritmo de Jukes-Cantor
35
Inferência de uma árvore Árvores Filogenéticas 35 DNA mãe : tctgcctc tctgcctcgatgcctc gatgcatcgacgcctc Caso 1:
36
Inferência de uma árvore Árvores Filogenéticas 36 DNA mãe : tctgcctc tctgcctcgatgcctc gatgcatcgccgcctc Caso 2: Duas mutações na mesma posição Algoritmo Jukes-Cantor (gctgcctc)
37
Matriz de distância Árvores Filogenéticas 37 Distância aditiva Biologicamente, aditividade é uma propriedade importante para uma matriz de distância Número de substituições separando duas taxa de seu último ancestral comum forma uma distância aditiva. Distância sobre o caminho do nó i ao nó j Modelo de Jukes-Cantor é frequentemente usado como modelo de substituição.
38
Matriz de distância Árvores Filogenéticas 38 9 8 7 L3 6 L2L1L4L5 1 1 1 1 2 2 2
39
UPGMA Árvores Filogenéticas 39 Comprimento do ramo assume “relógio molecular” (ultrametricidade) A C B Cada filho tem igual comprimento respeito ao seu pai 2 2 Ultrametricidade extremamente simples para encontrar comprimento do ramo Unweighted Pair Group Method with Arithmetic Averages UPGMA Um dos primeiros métodos baseados em distância
40
UPGMA Árvores Filogenéticas 40 1.Selecionar nós i e j, de tal forma que, Dij é a menor distância da árvore 2.Criar novo grupo (ij) 3.Conectar nó i ao grupo ij (Di(ij)=Dij/2). Conectar nó j ao grupo ij (Dj(ij)=Dij/2). 4.Calcular distâncias do grupo ij a todos os demais nós k da árvore (k!=i e k!=j) 5.Excluir as colunas e linhas da matriz de dados que correspondem ao grupo de i e j. Adicionar uma coluna e linha para o grupo (ij). 6.Se houver apenas um item na matriz de dados, pare. Caso contrário, volte ao passo 1. Unweighted Pair Group Method with Arithmetic Averages
41
UPGMA Árvores Filogenéticas 41 Exemplo: (Fonte: Mona Singh – U. Princeton)
42
UPGMA Árvores Filogenéticas 42 Unweighted Pair Group Method with Arithmetic Averages
43
UPGMA Árvores Filogenéticas 43 Unweighted Pair Group Method with Arithmetic Averages
44
UPGMA Árvores Filogenéticas 44 Unweighted Pair Group Method with Arithmetic Averages Se uma árvore com valores exatos existe? Exemplo:
45
UPGMA Árvores Filogenéticas 45 Quase nunca é válida para sequências de DNA Pode levar a inferência incorreta
46
Neighbor-Joining Árvores Filogenéticas 46 Desenvolvido em 1987 por Naruya Saitou e Masatochi Nei Algoritmo guloso (greedy) Iterativamente combina pares de nós Chave para sucesso do algoritmo: Nós que são topologicamente vizinhos na árvore são combinados Processo repetido até que todas as taxa sejam combinadas Arvore gerada é sem raiz
47
Neighbor-Joining Árvores Filogenéticas 47 Fórmula 3-pontos: L x + L y = d AB L x + L z = d AC L y + L z = d BC L x = (d AB +d AC -d BC )/2 L y = (d AB +d BC -d AC )/2 L z = (d AC +d BC -d AB )/2 A B centro C LxLx LyLy LzLz Cálculo do tamanho dos ramos – Supor 3 taxa em uma árvore sem raiz
48
Neighbor-Joining Árvores Filogenéticas 48 Usa condição de 4-pontos para selecionar nós vizinhos a serem combinados – Supor que 1 e 2 são vizinhos d(1,2) + d(i,j) < d(i,1) + d(2,j) R i = ∑ j d(i,j) M(i,j) = (n-2)d(i,j) – R i – R j M(i,j) < M(i,k) para todo k j 1 2 centro i LxLx LyLy LzLz j LqLq Grau de vizinhancidade
49
Neighbor-Joining Árvores Filogenéticas 49 Entrada: matriz nxn de distancias D e um outgroup Output: árvore filogenética T com raiz 1: Atualizar tabela M usando D e escolher menor valor de M para selecionar duas taxa para combinar 2: Combinar duas taxa t i e t j em um novo nó V e usar fórmula de 3-pontos para atualizar a matriz de distâncias D’ onde t i e t j são substituídos por V. 3: Calcular tamanho dos ramos de t k a V usando a fórmula de 3-pontos, T(V,1) = t i e T(V,2) = t j, TD(t i ) = L(t i,V) e TD(t i ) = L(t i,V) 4: Matriz de distâncias D’ agora tem n – 1 taxa. se existe mais 2 taxa ir para 1: se existem 2 taxa, combina-las por um ramo de tamanho d(t i,t j ). 5: Definir o nó raiz como o ramo ligando o outgroup ao resto da árvore
50
Estudo de caso: SARS Árvores Filogenéticas50 Fonte: Nature.com
51
Estudo de casos: SARS Árvores Filogenéticas 51 SARS - Severe Acute Respiratory Syndrome Causada pelo SARS coronavirus (SARS-COV) Análise filogenética da epidemia de SARS Genoma do SARS-CoV tem 6 genes O que queremos saber? Árvore epidemiológica Data de origem Área de origem
52
1/7/2016André de Carvalho - ICMC/USP52 Coronavirus SARS www.cell-research.com Termo corona vem da coroa que aparece quando o vírus é observado em um microscópio eletrônico
53
1/7/2016André de Carvalho - ICMC/USP53 Epidemia de SARS Coronavírus – Patógenos que causam uma grande variedade de doenças em animais Qualquer organismo capaz de causar doença infecciosa – Podem apresentar mutações frequentes e, assim, infectar outras espécies – Outros coronavírus foram identificados como causadores de hepatite em ratos e gastrenterite em suínos – É o vírus mais comum em patologia veterinária
54
SARS: Por que sabemos que veio da civeta? Árvores Filogenéticas 54
55
1/7/2016André de Carvalho - ICMC/USP55 Origem da Epidemia de SARS Abril de 2003 – Laboratório canadense sequência a sequência de RNA do vírus SARS CoV – Análise filogenética do vírus mostrou que o coronavirus mais próximo é o da civeta – Alimento popular em Guangdong - China
56
SARS: Como se espalhou? Árvores Filogenéticas 56
57
SARS: Por que o inicio em Guangdong? Árvores Filogenéticas 57 Menor variação fora da província de Guangdong
58
SARS: Em que data? Árvores Filogenéticas 58 Com 95% de confiança, 16 de setembro de 2002
59
1/7/2016André de Carvalho - ICMC/USP59 SARS Número de Casos Reportados
60
Conclusão Árvores Filogenéticas 60 Construção de árvores filogenéticas Algoritmo UPGMA Algoritmo Neighbor-Joining Estudo de Casos: SARS
61
Perguntas? Árvores Filogenéticas 61
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.