Dilvan Moreira (Baseado em material do prof. André Carvalho)

Slides:



Advertisements
Apresentações semelhantes
Carolina Fonseca Neumar Ribeiro
Advertisements

My drivers Podemos definir um driver como uma ponte de comunicação entre determinado dispositivo e a central de processamento de um computador. Na prática,
Definição de Comportamento no Behaviorismo Radical  Compromissos filosóficos, dinâmica do comportamento, eventos- estados-processos: relação organismo.
Aula 5 Bioestatística. Estatísticas para uma variável.
Curso Superior em Redes de Computadores OSPF – Parte 2 Prof. Sales Filho.
Tecnologias e Linguagens para Banco de Dados I - WEB Prof. João Ricardo Andrêo 29/5/ :40 1 Atividades: 1 - Criar uma base de dados para uma empresa.
Funções Prof. Márcio.
Classificação feita pelo Homem primitivo: Perigosos e não perigosos. Comestíveis e não comestíveis. Venenosos e não venenosos. Aristóteles, filósofo grego.
Categoria: Ciências da Saúde | Subcategoria: Saúde Coletiva | nº FEBRACE: 3455 Alunas: Isabela Baquete Prado e Mariane Yoshie Sato Orientador: Prof. Ms.
Estudos Interdisciplinares de Técnicas de Pesquisa Acadêmica: Éricka Reis Barros.
Origem e evolução dos seres vivos Há evidências científicas de que o nosso planeta surgiu há cerca de 4,6 bilhões De anos, a partir de aglomeração de poeira,
Natiele Zanardo Carvalho Biologia e Saúde Humana.
RHAYANE BORGES SILVA 4º ANO ADMINISTRAÇÃO Mensuração e Escala Parte II.
Cálculo Numérico Computacional Prof. Linder Cândido da Silva.
ESTUDO TRANSVERSAL.
PRÁTICA CIENTIFICA ANÁLISE DE ARTIGO CIENTÍFICO: “PROPOSTA DE SOLUÇÃO PARA O PROBLEMA DAS P-MEDIANAS NA LOCALIZAÇÃO DE UNIDADES DE SAÚDE 24 HORAS” Brasília,
A ULA 6 B IOESTATÍSTICA Inferência Pontual, Intervalar e Testes de Hipóteses.
Inferência Estatística
Aula 5. Teste de Hipóteses II. Capítulo 12, Bussab&Morettin “Estatística Básica” 7ª Edição.
Universidade Federal do Espírito Santo - UFES Laboratório de Computação de Alto Desempenho - LCAD Introdução ao Logisim Prof. Alberto F. De Souza LCAD/DI/UFES.
Redes de Co-citação Wagner de Souza Rolim CIn – UFPE.
EAL ESTATÍSTICA, PLANEJAMENTO E OTIMIZAÇÃO DE EXPERIMENTOS.
Média, Moda e Mediana Prof.: Adeilton Silva..
Tecnologias e Linguagens para Banco de Dados I Prof. João Ricardo Andrêo 1/6/ :19 1 Respostas: 1. O que é um Sistema Gerenciador de Banco de Dados.
Mecânica Teórica Introdução e conceitos básicos da Mecânica Teórica:  Campos de Física Teórica;  Objecto de estudo;  Métodos da mecânica teórica; 
CENTRO DE CIÊNCIA DO SISTEMA TERRESTRE METODOLOGIA DE PESQUISA CIENTÍFICA DEMANDA DE ENERGIA ELÉTRICA E DESENVOLVIMENTO SOCIOECONÔMICO : O CASO DAS COMUNIDADES.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Intervalo de Confiança Camilo Daleles Rennó
Avaliação e Revisão do Mapa Estratégico do MPE Produtos Gerados Brasília, 13 de Abril de 2009.
INE5408 Estruturas de Dados Introdução a Árvores - Conceitos - Árvores Binárias - Métodos e algoritmos de percurso - Métodos e algoritmos de balanceamento.
Informática Industrial N8INF Prof. Dr. Cesar da Costa 4.a Aula: Rede ModBus.
Análise do tema a partir das informações da coletânea CAPÍTULO 2 – página 10 a 15.
USO RACIONAL DE ENERGIA ELÉTRICA ILUMINAÇÃO FORÇA MOTRIZ (ACIONAMENTOS) Lineu B Reis 2010.
Frente 1B Aula 03 Pirâmides Ecológicas: Quantificando o ecossistema.
SISTEMAS OPERACIONAIS MEMÓRIA VIRTUAL. INTRODUÇÃO Memória Virtual é um técnica sofisticada e poderosa de gerenciamento de memória, onde a MP e a MS são.
Comportamento Respondente
Índice de Exposição a Produtos Químicos de Dow Método simples para prever dispersão de vapores/gases de fugas de processos Índice utilizado como parte.
Programação p/ INTERNET - HTML Prof. João Ricardo Andrêo 2/6/ :46 1 TABELAS A TAG é utilizada para apresentação de dados no formato de tabelas (apresentação.
IFDM 2015 Índice Firjan de Desenvolvimento Municipal Ano Base 2013 Recorte Municipal Abrangência Nacional.
Hidrodinâmica Aula 04 (1 0 Sem./2016) 1. A função escoamento para fluxos bidimensionais A) Velocidade para um fluxo bidimensional em componentes cartesianas.
6. Andando na Superfície de Resposta Técnica de otimização baseada em planejamentos fatoriais Etapas distintas: Modelagem e deslocamento Modelagem: ajuste.
AULA 4 Aceleração Monitores: Hugo Brito Aluno de Engenharia Eletrônica – 6º Período Natalia Garcia Aluna de Engenharia Civil – 4º Período paginapessoal.utfpr.edu.br/cdeimling.
Noções de amostragem Bioestatística. É a ciência que fornece os princípios e os métodos para coleta, organização, resumo, análise e interpretação de dados.
Vinicius Carvalho Beck 2016 Pensamento Matemático Parte 1.
Normalização (4FN) Na literatura aparecem outras formas normais, como a forma normal de Boyce/Codd, a 4FN e a 5FN. Destas a única que tem importância na.
INTRODUÇÃO AO ESTUDO DOS SERES VIVOS SISTEMÁTICA, CLASSIFICAÇÃO E BIODIVERDIDADE PROF.LEONAM - IFRN/CAICÓ POR QUÊ?
Preservar e Recuperar o Meio Ambiente
INE5408 Estruturas de Dados Estruturas de Dados básicas utilizando Vetores - Listas.
Hidrodinâmica Aula 08 (1 0 Sem./2016) 1. A viscosidade e a Equação de Navier-Stokes 2.
Profa. Claíde Abegg / Rosane Davoglio
ARGUMENTAÇÃO. Não há o que discutir e argumentar, onde reina o consenso. É exatamente o dissenso seu campo de atuação. Lineide Mosca, 2006.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Inferência Estatística Camilo Daleles Rennó
Bases Biológicas do Comportamento. Adaptação Processo lento, que envolve muitas gerações de indivíduos de uma mesma espécie.
Diagramas de Sequência e Comunicação
Curso de Jornalismo Investigativo: uma capacitação para organizações e ativistas locais Análise e filtro de dados: oficina prática Apresentação baseada.
Trbalho de Geografia Prof: Karina Aluno: Arthur de Oliveira Moteiro.
Maira de Souza Flôr: bolsista do PUIC; acadêmica do Curso de Psicologia, Campus Norte, Pedra Branca. Anita Bacellar: orientadora do PUIC; docente do Curso.
Sequência e Progressão Aritmética
Unidade I Estatística Descritiva Profª. Maria Ester Domingues de Oliveira.
1 1 Slide Programação Dinâmica Prof. Dr. Alexandre Pereira Salgado Junior.
Indicadores de Saúde Conceito
Prof a Ana Carla Bittencourt Reis 1 Teoria das Filas.
Como construir modelos empíricos. Nos modelos estudados, cada fator foi fixado em dois níveis Por esta razão temos que nos contentar com uma visão limitada.
Métodos Quantitativos em Medicina Cálculo do Tamanho da Amostra Patometria 2015.
Sensores e transdutores Adolfo Fernandes Herbster Universidade Paulista.
Calculo de Hoare Daniel Soares, Gabriel Alabarse Hernandez(150756) e Vanius Zapalowski(150843)
[SCC0271] Introdução à Bioinformática Arvores Filogenéticas Estagiário PAE: Pedro Shiguihara-Juárez Professor: Dilvan de Abreu Moreira Instituto de Ciências.
1 SISTEMÁTICA DIVERSIDADE DE CRITÉRIOS DE CLASSIFICAÇÃO.
 Qualidade de Testes Diagnósticos  O bom uso de um teste diagnóstico requer, além das considerações clínicas, o conhecimento de medidas que caracterizam.
HISTÓRIA NATURAL DA DOENÇA Universidade Federal do Rio Grande do Sul Faculdade de Odontologia Disciplina de Epidemiologia Geral.
Transcrição da apresentação:

Dilvan Moreira (Baseado em material do prof. André Carvalho) FILOGENIA Dilvan Moreira (Baseado em material do prof. André Carvalho)

Leitura Introduction to Computational Genomics: A Case Studies Approach Capítulo 7

Tópicos SARS Origem e Evolução da Epidemia Análise Filogenética Construção de Árvores Filogenéticas Algoritmo Neighbor-Joining Estudo de Casos André de Carvalho - ICMC/USP 28/04/2017

Epidemia de SARS Síndrome Respiratória Aguda Grave Severe Acute Respiratory Syndrome Doença respiratória grave que atingiu o mundo em 2003 Causada pelo SARS coronavirus (SARS-COV) Termo corona vem da coroa que aparece quando o vírus é observado em um microscópio eletrônico Não é a gripe aviária André de Carvalho - ICMC/USP 28/04/2017

Epidemia de SARS Coronavirus Patógenos que causam uma grande variedade de doenças em animais Qualquer organismo capaz de causar doença infecciosa Podem apresentar mutações frequentes e, assim, infectar outras espécies Outros coronavirus foram identificados como causadores de hepatite em ratos e gastrenterite em suínos É o vírus mais comum em patologia veterinária André de Carvalho - ICMC/USP 28/04/2017

Epidemia de SARS Fevereiro de 2003 Hospital francês de Hanói, Vietnam, chamou a OMS com um relatório de uma infecção semelhante a gripe Altamente contagioso Especialista e doenças infecciosas da OMS, Dr Carlo Urbani, concluiu que era um novo e incomum patógeno André de Carvalho - ICMC/USP 28/04/2017

Epidemia de SARS Fevereiro de 2003 Durante sua estadia, Dr. Urbani coletou exames, examinou documentos do hospital e organizou quarentena de pacientes Foi o primeiro a identificar e descrever a nova doença, SARS Febre, tosse seca, falta de ar, piora progressiva do sistema respiratório, morte por falha do sistema respiratório Em 3 semanas, Dr. Urbani mais cinco outros profissionais de saúde do hospital morreram de SARS André de Carvalho - ICMC/USP 28/04/2017

Epidemia de SARS Março de 2003 OMS emitiu um alerta global, chamando SARS de risco à saúde mundial André de Carvalho - ICMC/USP 28/04/2017

Epidemia de SARS Hospital de Hanói Março de 2003 André de Carvalho - ICMC/USP 28/04/2017

Origem da Epidemia de SARS Primeiros casos ocorreram em 11/2002 na província de Guangdond, China 106 pessoas adoeceram em hospital da cidade de Guangzhou Resto do mundo não sabia disso Médico desse hospital visitou Hong Kong em 21 de fevereiro de 2003 Hospedou-se no 9o andar do hotel metrópole Adoeceu e morreu, com diagnóstico de pneumonia Várias pessoas que estiveram no 9o andar tornaram-se transmissores da doença André de Carvalho - ICMC/USP 28/04/2017

André de Carvalho - ICMC/USP 28/04/2017

Origem da Epidemia de SARS Um dos visitantes do 9o andar foi um executivo americano Primeiro paciente tratado no hospital francês de Hanói Infectou 80 pessoas antes de morrer Outros visitantes do 9o andar levaram a doença para Canadá, Cingapura e EUA Em abril de 2003, foram relatados 4300 casos com 250 mortes em 25 países André de Carvalho - ICMC/USP 28/04/2017

Origem da Epidemia de SARS Março de 2003 Início do mês, OMS coordenou pesquisa internacional Final do mês, novo vírus que causa SARS foi identificado de forma independente em: Alemanha, Canadá, EUA e Hong Kong SARS-CoV é um RNA viral (como HIV) Comum em humanos e animais, coronavírus causam ~25% de todas as infecções respiratórias superiores Ex.: gripe comum André de Carvalho - ICMC/USP 28/04/2017

SARS Número de Casos Reportados André de Carvalho - ICMC/USP 28/04/2017

SARS Estatísticas André de Carvalho - ICMC/USP 28/04/2017

Coronavirus SARS Fonte: BBC André de Carvalho - ICMC/USP 28/04/2017

Coronavirus SARS www.cell-research.com André de Carvalho - ICMC/USP 28/04/2017

Origem da Epidemia de SARS Abril de 2003 Laboratório canadense seqüência a seqüência de RNA do vírus SARS CoV Análise filogenética do vírus mostrou que o coronavirus mais próximo é o da civeta Alimento popular em Guangdong André de Carvalho - ICMC/USP 28/04/2017

Origem da Epidemia de SARS Maio de 2003 Dois artigos da Science apresentaram o genoma completo do SARS CoV Genoma contém 29.751 bp É substancialmente diferente de todos os CoVs humanos Diferentes também dos CoVs dos pássaros – nenhuma relação com gripe aviária Final de 2003 SARS se espalhou por todo o mundo André de Carvalho - ICMC/USP 28/04/2017

Análise Filogenética do SARS Análise filogenética pode responder questões como: Que tipo de vírus causou a infecção original? Qual a fonte da infecção? Quando e onde o vírus cruzou fronteiras entre espécies? Quais são as mutações chave que possibilitaram esse cruzamento? Qual a trajetória seguida para o espalhamento do vírus? André de Carvalho - ICMC/USP 28/04/2017

Análise Filogenética do SARS Para responder às perguntas anteriores, vamos: Examinar alguns algoritmos chave de análise filogenética Aplicar esses algoritmos a dados de SARS Disponíveis no GenBank e no site do livro André de Carvalho - ICMC/USP 28/04/2017

Árvores e Evolução Trajetória de avanço do SARS pode ser representada por uma árvore Todos os vírus de SARS que apareceram no mundo se originaram do vírus achado na China Novos ramos aparecem quando o vírus se espalha Tradicionalmente, história evolutiva ligando grupos de espécies tem sido representada por uma árvore Única figura no livro “ On the origin of species” de Darwin André de Carvalho - ICMC/USP 28/04/2017

Árvores Filogenéticas Fonte: Tree of the Life Website, University of Arizona Orangutan Gorilla Chimpanzee Human André de Carvalho - ICMC/USP 28/04/2017

Árvores Filogenéticas DNA mãe : tctgcctc tctgcctc gatgcctc tctgcctcggg gatgcatc gacgcctc gctgcctcggg gatgaatc gccgcctc gctaagcctcggg Espécies atuais André de Carvalho - ICMC/USP 28/04/2017

Filogenia Estudo da relação evolutiva entre vários grupos de organismos Espécies Populações Etc. Representada por diagrama em forma de árvore (árvore filogenética) Análise cladística Geralmente baseada em dados morfológicos André de Carvalho - ICMC/USP 28/04/2017

Cladísticas André de Carvalho - ICMC/USP 28/04/2017

André de Carvalho - ICMC/USP 28/04/2017

Árvores Filogenéticas Mostram os relacionamento evolutivos entre várias espécies ou indivíduos Que se acredita terem um ancestral em comum Forma de cardiograma Cada nó com descendentes representa o ancestral comum mais recente deles Tamanho das arestas corresponde a estimativas de tempo André de Carvalho - ICMC/USP 28/04/2017

Árvores Filogenéticas Cada nó é denominado uma unidade taxonômica (taxon, plural taxa) Nós internos são unidades taxonômicas hipotéticas Não podem ser diretamente observados Relacionamentos mais complexos podem assumir a forma de redes André de Carvalho - ICMC/USP 28/04/2017

Estruturas de Árvores Filogenéticas Árvores apresentam duas ou mais taxa Espécie ou indivíduo Nós externos representam taxa existentes Nós internos apresentam seus ancestrais (em geral extintos) Árvores podem ser de: Bifurcação Cada nó interno tem no máximo 2 filhos Multifurcação Cada nó interno pode ter mais que 2 filhos Árvores podem ter ou não raiz André de Carvalho - ICMC/USP 28/04/2017

Árvores Filogenéticas com Raiz Define-se um nó interno especial, chamado raiz Ancestral comum a todos os outros nós Todos os caminhos evolutivos levam à raiz Ramos são orientados da raiz aos nós externos André de Carvalho - ICMC/USP 28/04/2017

Árvores Filogenéticas com Raiz tempo Ramo ou aresta Nó intterno Nó externo (folha) Drosophila humano baiacu rato André de Carvalho - ICMC/USP 28/04/2017

Árvores Filogenéticas com Raiz André de Carvalho - ICMC/USP 28/04/2017

Árvores Filogenéticas sem Raiz Ramos não possuem orientação Mostram relacionamento topológico entre taxa, sem identificar um ancestral comum Existem métodos para definir uma raiz para uma árvore sem raiz Escolhem uma aresta para colocar nó raiz Requer informação biológica externa ou pelo menos suposição de onde por a raiz André de Carvalho - ICMC/USP 28/04/2017

Árvores Filogenéticas sem Raiz sapo humano Nó interno baiacu rato Nó externo (folha) Ramo ou aresta André de Carvalho - ICMC/USP 28/04/2017

Árvores Filogenéticas sem Raiz Raiz é geralmente definida incluindo uma ou mais taxa no conjunto de dados Que se sabe serem resultados de divisão mais antiga Relação mais distante a cada uma das taxa Essa taxon (ou taxa) externa é chamada de outgroup Ramo da árvore onde o outgroup se junta as demais taxa é considerado conter o nó raiz André de Carvalho - ICMC/USP 28/04/2017

Árvores Filogenéticas sem Raiz Drosophila raiz sapo humano Nó interno baiacu rato Nó externo Ramo ou aresta André de Carvalho - ICMC/USP 28/04/2017

Árvores Filogenéticas sem Raiz Drosophila raiz sapo humano Nó interno baiacu rato Nó externo Ramo ou aresta André de Carvalho - ICMC/USP 28/04/2017

Estruturas de Árvores Filogenéticas Rotação dos ramos de um nó interno não altera relacionamento entre taxa = A B C B A C Invariante à rotação André de Carvalho - ICMC/USP 28/04/2017

Número de Possíveis Árvores Reconstrução de árvores filogenéticas a partir de sequências de DNA Complicado pelo grande número de possíveis árvores Possíveis árvores sem raiz (n  3) Possíveis árvores com raiz (n  2) n: número de taxa André de Carvalho - ICMC/USP 28/04/2017

Representação de Árvores Existem várias formas não gráficas de representar uma árvore 9 8 7 3 6 2 1 4 5 9 8 7 8 3 6 4 5 1 2 5 - - 4 - - 3 - - 2 - - 1 - - Formato padrão popular: Newick: (((1,2),3),(4,5)) André de Carvalho - ICMC/USP 28/04/2017

Inferindo Árvores Até pouco tempo, relacionamento entre taxa era inferidos por características morfológicas Atualmente são utilizadas sequências de DNA Tecnologia de sequenciamento Mutações deixam uma trilha Árvores podem ser inferidas a partir da similaridade entre sequências homólogas André de Carvalho - ICMC/USP 28/04/2017

Inferindo Árvores Ramos da árvore podem ter tamanhos diferentes Quanto maior o número de mutações, maior o ramo André de Carvalho - ICMC/USP 28/04/2017

Inferindo Árvores Dadas seqüências homólogas de um grupo de taxa Existem vários métodos de reconstruir seus relacionamentos filogenéticos Métodos podem ser divididos em dois grupos: Os que ordenam todas as possíveis árvore por meio de algum critério para encontrar a melhor Os que constroem a árvore diretamente a partir dos dados (sem definir uma função de otimização) André de Carvalho - ICMC/USP 28/04/2017

Inferindo Árvores Métodos que ordenam as possíveis árvores Critérios que (em geral) procuram a árvore com o menor número de mutações Por causa do enorme número de possíveis árvores: Pode demorar muito para encontrar a melhor árvore Quando usa aproximações para acelerar busca, pode não encontrar melhor árvore André de Carvalho - ICMC/USP 28/04/2017

Inferindo Árvores Métodos que constroem a partir dos dados Árvore é construída por métodos filogenéticos que usam algoritmos e estatística Freqüentemente baseados na computação da distância entre pares de taxa Muito populares por serem geralmente rápidos André de Carvalho - ICMC/USP 28/04/2017

Métodos que constroem a partir dos dados Método baseado em distância mais popular é o algoritmo neighbor-joining (NJ) Apesar de não ser necessariamente tão bem comportado estatisticamente quanto outros métodos Robusto e acurado Garantido de inferir a árvore verdadeira se as distâncias usadas refletem a distância real entre seqüências Resultado não garantido por outros métodos estatisticamente mais sofisticados André de Carvalho - ICMC/USP 28/04/2017

Métodos Baseados em Distância Dadas n taxa Construir matriz de distâncias entre taxa Se os ramos da árvore têm um tamanho específico, distância entre dois nós quaisquer pode ser facilmente computada Tamanho total do caminho único unindo eles Permite especificar distância entre nós folha da árvore usando distância aditiva André de Carvalho - ICMC/USP 28/04/2017

Métodos Baseados em Distância Distância aditiva Biologicamente, aditividade é uma propriedade importante para uma matriz de distâncias Número de substituições separando duas taxa de seu último ancestral comum forma uma distância aditiva Distância sobre o caminho do nó i ao nó j Modelo de Jukes-Cantor é freqüentemente usado como modelo de substituição André de Carvalho - ICMC/USP 28/04/2017

Métodos Baseados em Distância Matriz de Distâncias 9 1 1 8 7 L1 L2 L3 L4 L5 L1 0 2 4 6 6 L2 2 0 4 6 6 L3 4 4 0 6 6 L4 6 6 6 0 4 L5 6 6 6 4 0 1 2 2 2 6 1 1 L1 L2 L3 L4 L5 André de Carvalho - ICMC/USP 28/04/2017

Algoritmo Neighbor-Joining Algoritmo guloso (greedy) Começa com uma filogenia em forma de estrela Todas as taxa estão conectadas diretamente a um único nó raiz Iterativamente combina pares de nós André de Carvalho - ICMC/USP 28/04/2017

Algoritmo Neighbor-Joining Chave para sucesso do algoritmo: Critério que define como são selecionados os nós a serem combinados a cada iteração Identifica nós que são topologicamente vizinhos na árvore Taxa selecionadas são combinadas em um táxon Uma nova matriz de distâncias é então calculada Processo repetido até que todas as taxa sejam combinadas Árvore gerada é sem raiz André de Carvalho - ICMC/USP 28/04/2017

Algoritmo Neighbor-Joining Cálculo do tamanho dos ramos Supor 3 taxa em uma árvore sem raiz Fórmula 3-pontos: Lx + Ly = dAB Lx + Lz = dAC Ly + Lz = dBC Lx = (dAB+dAC-dBC)/2 Ly = (dAB+dBC-dAC)/2 Lz = (dAC+dBC-dAB)/2 A B centro C Lx Ly Lz André de Carvalho - ICMC/USP 28/04/2017

Algoritmo Neighbor-Joining Usa condição de 4-pontos para selecionar nós vizinhos a serem combinados Supor que 1 e 2 são vizinhos d(1,2) + d(i,j) < d(i,1) + d(2,j) Ri = ∑j d(i,j) M(i,j) = (n-2)d(i,j) – Ri – Rj M(i,j) < M(i,k) para todo k  j 1 2 centro i Lx Ly Lz j Lq Grau de vizinhancidade André de Carvalho - ICMC/USP 28/04/2017

Algoritmo Neighbor-Joining Entrada: matriz nxn de distancias D e um outgroup Output: árvore filogenética T com raiz 1: Atualizar tabela M usando D e escolher menor valor de M para selecionar duas taxa para combinar 2: Combinar duas taxa ti e tj em um novo nó V e usar fórmula de 3-pontos para atualizar a matriz de distâncias D’ onde ti e tj são substituídos por V . 3: Calcular tamanho dos ramos de tk a V usando a fórmula de 3-pontos, T(V,1) = ti e T(V,2) = tj , TD(ti) = L(ti,V) e TD(ti) = L(ti,V) 4: Matriz de distâncias D’ agora tem n – 1 taxa. se existe mais 2 taxa ir para 1: se existem 2 taxa, combina-las por um ramo de tamanho d(ti,tj). 5: Definir o nó raiz como o ramo ligando o outgroup ao resto da árvore André de Carvalho - ICMC/USP 28/04/2017

UPGMA Algoritmo NJ pode ser reduzido a um método mais simples, UPGMA, quando M = D Unweighted Pair Group Method with Arithmetic Averages Um dos primeiros métodos baseados em distância Distância do nó externo para a raiz é a mesma para todos os nós externos Ultrametricidade Quase nunca é válida para sequencias de DNA Pode levar a inferência da árvore incorreta André de Carvalho - ICMC/USP 28/04/2017

UPGMA A 2 2 Unweighted Pair Group Method with Arithmetic Averages UPGMA Um dos primeiros métodos baseados em distância Comprimento do ramo assume “relógio molecular” (ultrametricidade) Cada filho tem igual comprimento em respeito ao seu pai Ultrametricidade extremamente simples para encontrar comprimento do ramo A C B 2 2 Árvores Filogenéticas

UPGMA Exemplo: (Fonte: Mona Singh – U. Princeton) Árvores Filogenéticas

UPGMA Unweighted Pair Group Method with Arithmetic Averages Árvores Filogenéticas

UPGMA Unweighted Pair Group Method with Arithmetic Averages Árvores Filogenéticas

UPGMA Unweighted Pair Group Method with Arithmetic Averages Se uma árvore com valores exatos existe? Exemplo: Árvores Filogenéticas

UPGMA Quase nunca é válida para sequências de DNA Pode levar a inferência incorreta Árvores Filogenéticas

SARS: Estudo de Caso Análise filogenética da epidemia de SARS Genoma do SARS-CoV tem 6 genes Hospedeiro: civeta O que queremos saber? Árvore epidemiológica Data de origem Área de origem André de Carvalho - ICMC/USP 28/04/2017

SARS: Como Sabemos que veio da Civeta? André de Carvalho - ICMC/USP 28/04/2017

SARS: Matriz de Distância A matriz de distância foi obtida: calculando a distância genética dos alinhamentos globais da sequencia do gene spike usando as correções de Jukes–Cantor

Árvore Epidemiológica SARS: Árvore Epidemiológica Como se Espalhou? Outliner  civeta André de Carvalho - ICMC/USP 28/04/2017

SARS: Quando começou? Com 95% de confiança, 16 de setembro de 2002 Distância Genética da SARS da Civeta X Data Coleta da Amostra

SARS: Como sabemos que começou em Guangdong? Árvore Epidemiológica mostra Guangdong Podemos verificar de outro modo? Menor variação fora da província de Guangdong André de Carvalho - ICMC/USP 28/04/2017

Perguntas?

André de Carvalho - ICMC/USP 28/04/2017

Formato Newick 1 2 3 Convenção A B C D Formato de matriz: 1 2 3 A B 1 2 3 A B C D Formato Newick: ((A, B), (C, D)); Tamanho dos ramos pode ser representado: ((A:1.0, B:1.0):2, (C:1, D:1):2); Nomes podem ser atribuídos aos nós internos: ((A, B)2, (C, D)3)1; 1 2 3 Convenção A B C D André de Carvalho - ICMC/USP 28/04/2017