Revisão de conceitos relacionados à inferência filogenética

Slides:



Advertisements
Apresentações semelhantes
Amintas engenharia.
Advertisements

Evolução e Sistemática
Problema do caixeiro viajante
Elisabete Longo Isabel Branco Árvores abrangentes.
Pesquisa em profundidade
Métodos geométricos (baseados em distância)
Máxima Parcimônia.
Busca em Profundidade Para encontrar um caminho de solução Sol, de um dado nó para algum nó objetivo Se N é um nó objetivo, então Sol=[N] Se há um nó N1.
Meta - heurísticas Prof. Aurora
GRASP Greedy Randomized Adaptative Search Procedure
Árvores.
FILOGENIA DAS ANGIOSPERMAS: PRIMEIROS PASSOS
Dárlinton B. Feres Carvalho
Reconhecimento de Padrões Segmentação
Inteligência Artificial
Evolução e Sistemática
Carolina Fonseca Neumar Ribeiro
Análise Sintática Ascendente
Reconstrução filogenética: Verossimilhança máxima
Algoritmo Evolutivo para Filogenia Palestrante: Alexandre C. B. Delbem Instituto de Ciências Matemáticas e da Computação Universidade de São Paulo ICMC-USP.
Evolução Molecular Metodologias de Análise
Inteligência Artificial
Máxima Verossimilhança
A Contribuição da Econometria para a Análise Econômica
Métodos de distância e modelos de evolução molecular
Buscas em Grafos Prof. André Renato 1º Semestre/2012
Meta - heurísticas Prof. Aurora
Seleção de modelos e miscelânea
Parcimônia e medidas de suporte
T ÓPICOS DE I.A. Métodos de Busca Busca em Espaços de Estado Prof. Mário Dantas.
Otimização por Colônia de Formigas (ACO)
Integração Numérica Integração Numérica
Evolução e Sistemática
Introdução e Busca Cega
Quadrados Mínimos.
Sistema de equações lineares
AULA COMPUTACIONAL - Síntese de Sistemas de Separação (Cap. 7) 20 DE OUTUBRO DE 2008.
Algoritmos de Busca Local
Tópicos Avançados em Inteligência Artificial
Evolução e Sistemática
SISTEMAS OPERACIONAIS I
Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Programa de Pós-graduação em Biociências Área de Concentração.
Sistemas Operacionais
Inteligência Artificial
Fontes de Erros Aula 1 Introdução; Erros em processos numéricos;
Uma Visão Geral Sobre Reconstrução Filogenética
Alinhamento de sequências
ARRANJO FÍSICO CÉLULAS
Distância Mínima de Edição Profa. Sandra de Amo Bacharelado em Ciência da Computação - UFU.
Algoritmos de Agrupamento (Clustering): Métodos Hierárquicos e k-médias Marcílio C. P. de Souto DIMAp/UFRN.
INE Fundamentos de Matemática Discreta para a Computação
Evolução e Sistemática
Métodos de Resolução Solução Analítica Solução Numérica
Alinhamento de sequências Almir R. Pepato. Homologia primária e secundária 1- Estabelecimento da matriz de caracteres (observações a respeito dos semaforontes.
Modelos de evolução molecular
EXERCÍCIOS DE SÍNTESE 12 DE NOVEMBRO DE Determine o consumo/custo máximo e mínimo de utilidades CorrenteWCp kW/ o C To o C Td o C Q1Q Q2Q2.
Redes de computadores: SubCamada de Access ao Meio (3) Prof. Dr. Amine BERQIA
Integração numérica Aula 10 Fórmulas de Newton-Cotes: Trapézios;
Busca Competitiva Disciplina: Inteligência Artificial
Controle de Processos por Computador
Algoritmo de Transportes Objecto de Aprendizagem Manuel Pina MarquesDEIG
Computação Evolutiva Nome dado ao estudo de algoritmos cuja inspiração é o processo de evolução natural das espécies. Origem: trabalho de um pesquisador.
1 Algoritmos Genéticos em Otimização de Planejamento l Planejamento ocorre em todas as atividades e envolve: PLANEJAMENTO Recursos Tarefas Tempo Objetivos.
CENTRO DE GENOMICA E FITOMELHORAMENTO Introdução à Bioinformática
Regressão Linear Simples
GEOMETRIA ANALITICA VETORES.
Validando árvoresConstruindo árvoresModelos evolutivosEncontrando homologiasAs árvoresO problema 1 Construindo filogenias Coletar os dados Localizar homologias.
Hidrodinâmica Aula 03 (1 0 Sem./2016) 1. Movimento relativo próximo a um ponto Considere que a velocidade no ponto P e no tempo t é u. Próximo a este.
Camilo Daleles Rennó Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Análise.
[SCC0271] Introdução à Bioinformática Arvores Filogenéticas Estagiário PAE: Pedro Shiguihara-Juárez Professor: Dilvan de Abreu Moreira Instituto de Ciências.
Transcrição da apresentação:

Revisão de conceitos relacionados à inferência filogenética Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados Almir R. Pepato

O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas por árvores não-enraizadas, definido pela fórmula: Os métodos de inferência filogenéticas são os que permitem a escolha, dentre todas essas hipóteses, daquela que consideramos a que melhor representa as relações de ancestralidade dentre os terminais em consideração.

Representando filogenias Ramos: N= (2i-3)= 7 Árvore não enraizada Número de árvores não enraizadas: Cada árvore que antecede a árvore com i terminais possui 2i-5 ramos, assim ela produz : Árvores. Exemplo:

Representando filogenias Árvores enraizadas: Apresentam informação temporal. Há muito mais, já que podemos inserir a raiz em qualquer nó. No exemplo:

Representando filogenias (((A, B), (C, D)), E); Bipartições ou splits

Representando filogenias Árvore aditiva: A distância entre qualquer par de OTUs é a soma dos comprimentos de ramo que as separam. Comprimentos de ramos estimados de maneira independente. Portanto devem ser calculados N= (2i-3)= 7 Ramos. Árvore ultramétrica: Todas as OTU equidistantes da raiz. Ramos a serem calculados: (i-1)=4 Pois: L1=L2+L4+L8 L4+L8 = L3+L5 L5 = L6 L7=L8

O problema Número de clados Enraizada Não-enraizada 2 1 3 4 15 5 105 6 954 7 10,395 8 135,135 9 2,027,025 10 34,459,425

Métodos de inferência A- Algoritmos- Uma série de passos que conduzem à árvore filogenética. A1-Análises de agrupamento (UPGMA) A2- Neighbour Joining B- Critérios de Otimização – Emprega uma função objetiva para comparar as hipóteses filogenéticas. B1- Máxima Parcimônia B2- Máxima Verossimilhança B3- Evolução Mínima B4- Mínimos Quadrados C- Inferência Bayesiana - Avalia a probabilidade posterior dos clados formados pelos terminais sob consideração.

Parcimônia De forma independente, Luca Cavalli-Sforza e Anthony Edwards em 1963 e Camin e Sokal em 1965 chegaram a parcimônia como critério para otimização de cladogramas em caso de conflito entre caracteres (homoplasia) William de Ockham (1288-1347 ou 1348) “entia non sunt multiplicanda praeter necessitatem”

Parcimônia Função objetiva da parcimônia:

Parcimônia

Parcimônia de Fitch G C Premissas: Caracteres não polarizados e não ordenados. Todas as mudanças de caráter com o mesmo custo. 1- Para cada terminal atribua um estado de caráter conforme a matriz à sua disposição. Estabeleça arbitrariamente uma raiz (ela não muda o comprimento da árvore). A A C

Parcimônia de Fitch Visite um nó interno para o qual se conhece o conjunto de caracteres Sk para os dois descendentes (Si, Sj) imediatos. Assinale a ele um conjunto de valores Sk conforme as regras: A- Se então , nesse caso deve-se acrescentar 1 ao comprimento da árvore; B- Se então nesse caso não se acrescenta nada ao comprimento da árvore. Comprimento: 3 A C C G Y 1 X 1 A Z W 1

Generalizando... Parcimônia de Sankoff T 1 A B C D 1 2 3 Parcimônia de Fitch Parcimônia de Dollo, caracteres ordenados: A-B-C-D A B C D 1 2 3 As matrizes de Sankoff permitem que o procedimento apresentado para a parcimônia de Fitch seja generalizado para outras situações. Parcimônia de Wagner, caracteres ordenados: A-B-C-D

Generalizando... Parcimônia de Sankoff

Métodos de distância Algorítmos de agrupamento (não otimizam uma função): 1-UPGMA (Árvores ultramétricas) 2-Neighbour Joining 3- Neighbourliness 4- “Transformed distance method” Evolução Mínima: Otimiza a função (busca a árvore que oferece a melhor nota):

UPGMA OTU A B C D dAB dAC dBC dAD DBD DCD OTU (AB) C D d(AB)C d(AB)D A raiz é posta em:

Neighbor-Joining Passo a passo: 1- Começamos com uma matriz de distância relacionando n OTUs. 2- Uma nova matriz é calculada (Matriz Q). Nessa matriz a separação de cada par de terminais é ajustada com base na sua divergência média desde todos os outros terminais. 3- Agrupe dois terminais ao acaso:

Neighbor-Joining 4- Calcule o comprimento da árvore sabendo que: Distância do par de membros ao novo nó: Distância dos demais OTUs ao novo nó:

Neighbor-Joining 5- Determine o comprimento para todas as combinações de duas OTUs. Escolha a que minimiza o comprimento da árvore. 6- Recalcule a matriz de distâncias de considerando os dois terminais escolhidos como um único táxon. 7- Repita o processo até obter uma árvore completamente resolvida.

Neighbor-Joining

Mínimos Quadrados

Mínimos Quadrados OTU A B C D dAB dAC dBC dAD DBD DCD

Algoritmos de busca B C Árvore inicial, três espécies ao acaso. 1 A Adiciona-se o próximo táxon (D) (três árvores): Impraticável para um número maior de terminais!!!!! E E E B D E D C B C E B C D E 2a 2b 2c E E E A A E A E E E Adiciona-se o quinto táxon(E) (15 árvores)....

Stepwise addition B C Árvore inicial, três espécies ao acaso. 1 A Adiciona-se o próximo táxon (D) (três árvores): E A ordem em que são acrescidos os terminais determina o resultado da busca. B D E D C B C B C D E 2a 2b 2c A A A E E Escolhe-se a melhor árvore e adiciona-se o quinto táxon(E) (5 árvores)....

Star-tree decomposition A ordem em que são agrupados os terminais determina o resultado da busca. Mais lento que o anterior: as árvores tem sempre o mesmo número de terminais.

Nearest-neighbor interchanges (NNI)

Subtree pruning and regrafting (SPR)

Tree bisection and reconnection (TBR)

Algoritmos de Busca

Novas Tecnologias Ratchet: Desenhado para maximizar o número de pontos iniciais e reduzir o tempo gasto na procura a partir de cada ponto inicial e assim examinar mais ilhas de árvores. Perturba os dados mudando o peso a eles atribuído. Tree fusing (TF): Troca de sub-grupos idênticos entre árvores diferentes. Sectorial Seaches (SS): Tipo especial de avaliação de rearranjo, que necessita de uma árvore como ponto inicial. Seleciona diferentes setores da árvore e os re-analisa separadamente. Se uma configuração melhor é encontrada, ela é substituída na árvore inicial.

Novas Tecnologias Tree Drifting (DFT): Soluções sub-ótimas são aceitas durante o rearranjo, com uma certa probabilidade. A probabilidade de aceitar uma solução sub-ótima depende da Relative Fit Difference (RFD) e a diferença de comprimento entre a nova e a velha solução. RFDAB = (F–C)/F F = Soma das diferenças de passos nas duas árvores (A e B) que melhor ajusta (fit) a árvore A C = Soma dos caracteres que melhor ajustam (fit) a árvore B

Índices Índice de consistência (CI)- É a medida de quão bem um caráter ajusta-se a uma topologia. É calculado dividindo-se o menor número possível de passos do caráter pelo número de passos observados ao longo da topologia. Ou então é uma medida de homoplasia de uma árvore, sendo dado por: CI = Número total de mudanças de estado esperado dada a matriz de dados X 100/ Número de passos na árvore CI= 6*100/7 = 85,7

Índices

Índices Índice de retenção (RI): RI = Número máximo de passos na árvore – número de mudanças de estado na árvore X 100/número máximo de passos na árvore – número de mudanças de estado nos dados

Suporte Bootstrap

Suporte Bootstrap

Suporte Suporte de Bremer: Quanta homoplasia é necessária para derrubar um clado? Ex: A menor árvore que NÃO tem o clado (A C) é dois passos mais longa que a árvore apresentada.

Problemas com a Parcimônia

Qual método empregar? Huelsenbeck et al., 1996

Qual método empregar? Huelsenbeck et al., 1996

O uso da distância para inferência filogenética 1- Há perda de informação com a conversão da matriz de caracteres em matriz de distâncias. 2- O comprimento dos ramos de uma árvore de distância não são independentes, mas calculados em relação aos demais. Assim mesmo que as distâncias sejam corrigidas com o emprego de modelos estocásticos, elas serão sub-estimativas. Qualquer “problema” relacionado a um dos ramos (mudança na frequência das bases, ramo especialmente longo) será propagado ao longo de toda a filogenia.

Substituições multiplas Distância genética p difere da distância aparente D, devido às substituições múltiplas.