Alinhamento de sequências Almir R. Pepato. Homologia primária e secundária 1- Estabelecimento da matriz de caracteres (observações a respeito dos semaforontes.

Slides:



Advertisements
Apresentações semelhantes
Clustal-W Oscar Miranda.
Advertisements

VERIFICAÇÃO FORMAL DE BLOCOS COMPLEXOS
Análise de Voz e Vídeo Reconhecimento de voz baseado em modelos de palavras conectadas André Vitor de Almeida Palhares.
ANÁLISE DISCRIMINANTE
Evolução e Sistemática
Técnicas de Teste de Software
Teste de Software.
Introdução a Sistemas Fuzzy no Matlab e uso do Simulink
CONCEITOS BÁSICOS DA META-HEURÍSTICA TABU SEARCH
Máxima Parcimônia.
Busca em Profundidade Para encontrar um caminho de solução Sol, de um dado nó para algum nó objetivo Se N é um nó objetivo, então Sol=[N] Se há um nó N1.
GRASP Greedy Randomized Adaptative Search Procedure
Metaheurísticas Prof. Aurora Pozo Departamento de Informática Universidade Federal do Paraná
FILOGENIA DAS ANGIOSPERMAS: PRIMEIROS PASSOS
Reconhecimento de Padrões Seleção de Características
ANÁLISE DOS MÉTODOS DE INTEGRAÇÃO DIRETA
Evolução e Sistemática
Construção de Compiladores
Evolução Molecular Metodologias de Análise
Máxima Verossimilhança
A Contribuição da Econometria para a Análise Econômica
Métodos de distância e modelos de evolução molecular
Seleção de modelos e miscelânea
Parcimônia e medidas de suporte
T ÓPICOS DE I.A. Métodos de Busca Busca em Espaços de Estado Prof. Mário Dantas.
AS MÚLTIPLAS FACETAS DO SALÁRIO
Informática Teórica Engenharia da Computação
Triagem É um instrumento intermediário entre o recrutamento e a seleção Identificação de candidatos que estejam em conformidade com o perfil exigido pelo.
Otimização Inteira 5a. Aula Franklina.
Cálculo Numérico / Métodos Numéricos
Professor Antônio Ruas
SOLUÇÃO DA EQUAÇÃO DE SCHRÖDINGER
Bioinformática (Alinhamento de Seqüências)
Disciplina Inteligência Artificial Defesa de Projeto Período
Centro de Informática Computação Musical ExPIHar: Uma Ferramenta para extração de padrões e indução harmônica Hugo Santana Izabel Zanforlin Márcio Dahia.
Pesquisa Científica Metodologia Científica na Ciência da Computação
Tópicos Avançados em Inteligência Artificial
Técnicas de Busca Heurística Problemas da IA complexos demais para serem solucionados por técnicas diretas: criam-se técnicas de busca aprorpiados; chamados.
Matemática e suas Tecnologias - Matemática PROBABILIDADE CONDICIONAL
Analise de Texturas Dinâmicas Baseado nos trabalhos de Gianfranco Doretto e Stefano Soatto Autor : Igor Goulenko.
Uma Visão Geral Sobre Reconstrução Filogenética
Alinhamento de sequências
Busca Combinatorial e Métodos de Heurística
Análise Computacional de Seqüências Nucleotídicas e Protéicas
Distância Mínima de Edição Profa. Sandra de Amo Bacharelado em Ciência da Computação - UFU.
1 Introdução aos Agentes Inteligentes Inventando Funções Heurísticas Flávia Barros.
Definições e tipos de alinhamento. O uso do BLAST
Evolução e Sistemática
Programação Dinâmica.
Problemas NP-completos e Programação Dinâmica
AULA 21 Profa. Sandra de Amo BCC - UFU
Modelos de evolução molecular
Campus de Caraguatatuba Aula 18: Sistemas de Equações Lineares (6)
Marcadores mais utilizados Almir R. Pepato. Definição de marcador molecular Uma sequência nucleotídica ou de aminoácidos detectável experimentalmente.
Clustering Algorithms for Gene Expression Analysis Pablo Viana Fagner Nascimento.
Domínios, Motivos, Padrões e Perfis
Algoritmos e Heurísticas para Seqüenciamento de DNA
Métodos Construtivos x Aprimoramento
Análise e Síntese de Algoritmos
Principais algoritmos de alinhamento de sequências genéticas
Alinhamentos Múltiplos
Anjolina Grisi de Oliveira
Mailson Felipe da Silva Marques Johnson Cordeiro Sarmento
Computação Evolutiva Nome dado ao estudo de algoritmos cuja inspiração é o processo de evolução natural das espécies. Origem: trabalho de um pesquisador.
Alinhamento Global de Seqüências Katia Guimarães.
Revisão de conceitos relacionados à inferência filogenética
Ant Colony Optimization Theory Rio de Janeiro 2011 Disciplina: Inteligência de Enxame Docente: José Manoel Seixas Discente: José Dilermando Costa Junior.
Gestão da Informação e do Conhecimento Aula 02 A organização do conhecimento: uma visão holística e fenomenológica de como as pessoas usam e produzem informação.
Busca Heurística Prof. Valmir Macário Filho. 2 Busca com informação e exploração Capítulo 4 – Russell & Norvig Seção 4.1 Estratégias de Busca Exaustiva.
Validando árvoresConstruindo árvoresModelos evolutivosEncontrando homologiasAs árvoresO problema 1 Construindo filogenias Coletar os dados Localizar homologias.
Transcrição da apresentação:

Alinhamento de sequências Almir R. Pepato

Homologia primária e secundária 1- Estabelecimento da matriz de caracteres (observações a respeito dos semaforontes – codificação dos caracteres e seus estados- homologia primária sensu Pinna, 1990) 2- Busca do esquema de relações filogenéticas ótima segundo algum critério, levando a proposição de hipóteses filogenéticas. De acordo com a topologia obtida caracteres codificados sob o mesmo estado podem se revelar verdadeiras sinapomorfias ou homoplasias (homologia secundária sensu Pinna, 1990).

O problema da homologia no que se refere às sequências de nucleotídeos A rose is a rose is a rose is a rose is a rose Gertrude Stein

O problema da homologia: alinhamento

Alinhamento como problema informacional 1.Custos altos para substituições : TCAG-ACG-ATTG | | | | | | | TC-GGA- GC-T- G 0 mis 7 mat 6 gaps 2. Custos altos para as inserções/deleções : TCAGACGATTG | | TCGGAGCTG–- 5 mis 4 mat 2 gaps A maior parte dos programas usa um sistema de custos para substituições, introdução de inserções/deleções e outros eventos. Como a enumeração/avaliação de todas as possibilidades seria muito custosa, os programas usam o recurso da programação dinâmica como com o algoritmo de Needleman & Wunch.

Alinhamento como problema informacional Algoritmo empregando programação dinâmica (Needleman & Wunch, 1970) i,j*AATGC * A X G-2 G-3 C-4 Preenchendo a matriz: Substituição= -1 gap= -1 Regra: F ij = max(F i − 1,j − 1 + S ij, F i,j − 1 + gap, F i − 1,j + gap) Para preencher a casa, X= F ij = max(0 + 0, -1-1, -1-1) = 0

Alinhamento como problema informacional Algoritmo empregando programação dinâmica (Needleman & Wunch, 1970) I,j*AATGC * A G G C-4-3 X Preenchendo a matriz: Substituição= -1 gap= -1 Regra: F ij = max(F i − 1,j − 1 + S i, j ), F i,j − 1 + gap, F i − 1,j + gap) Para preencher a casa, X= F ij = max(-2 + 0, -3-1, -3-1) = -2

Alinhamento como problema informacional Algoritmo empregando programação dinâmica (Needleman & Wunch, 1970) Faz-se agora o caminho de volta. Há vários que levam a um valor total de -2 para o alinhamento I,j*AATGC * A G G C

Alinhamento como problema informacional Algoritmo empregando programação dinâmica (Needleman & Wunch, 1970) Faz-se agora o caminho de volta. Há vários que levam a um valor total de -2 para o alinhamento I,j*AATGC * A G G C Caminho 1 (1 sub, 1 gap): AA T G C | | A- G G C

Alinhamento como problema informacional Algoritmo empregando programação dinâmica (Needleman & Wunch, 1970) Faz-se agora o caminho de volta. Há vários que levam a um valor total de -2 para o alinhamento I,j*AATGC * A G G C Caminho 1 (1 sub, 1 gap): AA T G C | | A- G G C Caminho 2 (1 sub., 1 gap): AA T G C | | AG - G C

Alinhamentos de múltiplas sequências Soma com pesagem de Pares WSP (Weighted Sum of Pairs): WSP= ∑ ∑ W ij D ij Complexidade informacional: O (N M ): Proporcional ao comprimento da sequência elevado ao número de sequências Poucos programas implementam (BaliBase, FastMSA), pois pode ser usado para poucas sequências! i j

Clustal Método Heurístico: Não garante que todo o espaço de respostas ao problema será examinado. Passos: 1- Faz um alinhamento empregando uma função de custos para todos os possíveis pares de sequências. 2- A partir daí monta uma matriz de distâncias para todas as sequências

Clustal 3-Daí deriva-se uma árvore de similaridade. Para cada nó da árvore é produzido um alinhamento aos pares, que produz uma sequência de consenso para o próximo alinhamento. Note que os gaps introduzidos nas sequências que são alinhadas nas primeiras etapas não podem ser modificados!

T-Coffe

Mafft e Muscle

Malign, POY e Otimização Direta O POY é um programa que implementa uma série de algoritmos para inferência filogenética, a maior parte dos quais baseado na parcimônia como critério de otimização. A Otimização Direta consiste na otimização dos caracteres das sequências diretamente, sem o passo preliminar de inferência das homologias primárias

Malign, POY e Otimização Direta Uma análise empregando a otimização direta geralmente inclui: 1- O teste do maior número possível de combinações de valores de custo, já que como qualquer outro método automático, o resultado é dependente dele. 2- A presença/ausência de clados nos diversos valores de custo é compilada. A assim chamada análise de sensibilidade é vista como uma medida da estabilidade dos clados. 3- Um regime de custos ótimo é escolhido de forma a minimizar a incongruência entre as partições de dados. A incongruência é medida através de índices como ILD, RILD, TILD etc...

Malign, POY e Otimização Direta

Alinhamento como problema biológico Mas será mesmo o alinhamento um problema informacional? Não pode ser tratado como um problema biológico onde a homologia é inferida levando em conta informações relacionadas a processos biológicos?

Alinhamento como problema biológico

Homologia molecular: sumário As inserções/deleções são inferências feitas durante o estabelecimento de relações de homologia. Tem dois impactos sobre a inferência filogenética: levam a introdução de uma certa margem de erro, intrínseca a qualquer inferência por um lado, e informação filogenética adicional por outro. Como nas análises morfológicas, o estabelecimento das homologias primárias e a construção da matriz é o alicerce sobre o qual a inferência é assentado. Pouca atenção tem sido dada a esse aspecto, no entanto. Há debate na literatura sobre cada um dos métodos descritos nessa aula. Algo mandatário, no entanto, é que as hipóteses de homologia fiquem tão explicita ao leitor de um artigo de sistemática molecular quanto o que ficaria a um que use caracteres morfológicos.