Alinhamentos Múltiplos

Slides:



Advertisements
Apresentações semelhantes
Introdução à Análise de Sistemas
Advertisements

Clustal-W Oscar Miranda.
Instituto de Computação
Estruturas de Dados Marcio Gonçalves.
ARQUITETURA DE COMPUTADORES II
Avaliação Psicomotora
Avaliação de Sistemas Operacionais
Rejane Sobrino Pinheiro Tania Guillén de Torres
Indexação e Hashing Muitas consultas referenciam apenas uma pequena porção dos registros em uma tabela. Portanto necessitamos ser capaz de localizar estes.
O Surgimento dos Sistemas de Bioinformática
Evolução Molecular Metodologias de Análise
Anderson Berg Orientador: Prof. Fernando Buarque
Modelos de Processos de Software
INF 1771 – Inteligência Artificial
Professor Fernando Luís
Tópicos Avançados em Sistemas de Informação
Análise Computacional de Seqüências Nucleotídicas e Protéicas
Gerenciamento de Ambientes Virtuais de Aprendizagem
Aprendizado Baseado em Instâncias – Algoritmo k-NN
[Clayton J Pereira] [Leonilson Kiyoshi] [Prof. Dr. Vitor Leite]
Fundamentos da Arquitetura de Computadores
Planejamento de Tutoria
Tópicos em redes e sistemas distribuídos Carlos Oberdan Rolim Ciência da Computação Sistemas de Informação.
Gerenciamento de Dados
Introdução e Busca Cega
Introdução aos Agentes Inteligentes Busca Cega (Exaustiva)
Bioinformática (Alinhamento de Seqüências)
ALINHAMENTOS LOCAIS E SEMI-GLOBAIS
Redes Bayesianas - Aplicação em Risco Operacional
FLUXOGRAMAS.
ARQUITETURA DE COMPUTADORES II
SISTEMAS OPERACIONAIS I
Sistemas Operacionais
Documentação de Software
Uma Visão Geral Sobre Reconstrução Filogenética
Alinhamento de sequências
Sistemas de Informação para Planejamento Estratégico
Análise Computacional de Seqüências Nucleotídicas e Protéicas
Relatório aula prática
 Solucionar de forma otimizada os problemas que exijam alto esforço computacional e assim assegurar a satisfação dos clientes.
Algoritmos de Agrupamento (Clustering): Métodos Hierárquicos e k-médias Marcílio C. P. de Souto DIMAp/UFRN.
RepeatMasker Aluno: Fred Ulisses maranhão Professora: Kátia S. Guimarães Algoritmos p/ processamento de Cadeias, Cin, UFPE - 1/2001.
Definições e tipos de alinhamento. O uso do BLAST
Gestão de Projetos de Software
Transferência Horizontal de Genes: um Survey de Métodos Computacionais
Resolução de Problemas de Busca
Normalmente as universidades que oferecem cursos de graduação regular exigem de seus acadêmicos, além do curso das disciplinas curriculares, horas em atividades.
Sequenciamento de Genomas
Alinhamento de sequências Almir R. Pepato. Homologia primária e secundária 1- Estabelecimento da matriz de caracteres (observações a respeito dos semaforontes.
Análise Computacional de Seqüências Nucleotídicas e Protéicas BLAST Antonio Basílio de Miranda 24/11/2004 Adaptado por Marcos Catanho 10/05/2005.
Alinhamento de Cadeias de DNA COMPARAÇÃO DE SEQÜÊNCIAS
Domínios, Motivos, Padrões e Perfis
Capítulo 9: SAD orientado a Modelo
Algoritmos e Heurísticas para Seqüenciamento de DNA
Active Directory Services Serviço de Diretório Ativo
Principais algoritmos de alinhamento de sequências genéticas
Transferência Horizontal de Genes: um Survey de Métodos Computacionais Instituto de Computação Universidade Estadual de Campinas Karina Zupo de Oliveira.
Busca Competitiva Disciplina: Inteligência Artificial
Estruturas de Dados Murilo Salgado Razoli.
PEI – Programa Educacional Individualizado
1ª Formação de Professores Coordenadores
UCSal – Bacharelado em Informática Banco de Dados Profa. Semíramis Assis
Alinhamento Global de Seqüências Katia Guimarães.
Avaliação da diversidade microbiana
Alinhamentos e Busca de Similaridade Ariane Machado Lima.
Gerenciamento de riscos
Taís Sineiro Herig Laboratório de Genômica e Expressão / UNICAMP
ANÁLISE EM LARGA ESCALA DE EXPRESSÃO GÊNICA DIFERENCIAL ENTRE DIVERSAS
Hidden Markov Models 2 de maio de K … 1 2 K … 1 2 K … … … … 1 2 K … x1x1 x2x2 x3x3 xKxK 2 1 K 2.
INTELIGÊNCIA EMPRESARIAL Aula 6 – Componentes dos Sistemas de Apoio à Decisão.
Transcrição da apresentação:

Alinhamentos Múltiplos Curso de Introdução à Bioinformática Programa de Qualificação Docente da CAPES Convênio: UFPE - UFCG - Fiocruz Alinhamentos Múltiplos Marcos Catanho Laboratório de Genômica Funcional e Bioinformática DBBM-IOC / Fiocruz

Agenda Motivação Estratégias de alinhamento múltiplo Dificuldades computacionais Métodos de alinhamento múltiplo Programas de alinhamento múltiplo Dicas importantes Alinhamento global progressivo (ClustalW)

Porque precisamos de alinhamentos múltiplos? Um alinhamento múltiplo, seja de sequências de DNA ou de proteína, pode fornecer muito mais informação do que uma única seqüência. Quando lidando com uma nova proteína, de função desconhecida, a presença de domínios similares a outros em proteínas conhecidas pode implicar em função ou estrutura semelhante.

Porque precisamos de alinhamentos múltiplos? É sabido que a pressão seletiva resulta da necessidade de se conservar uma função. Em proteínas, a manutenção da função requer uma estrutura 3D específica. Portanto, alinhamentos múltiplos de proteínas podem fornecer alguma informação sobre a estrutura 3D das mesmas.

Porque precisamos de alinhamentos múltiplos? Para revelar os relacionamentos entre um grupo de seqüências (homologia). Para caracterizar famílias protéicas – identificar regiões conservadas e determinar as regiões variáveis. Regiões similares podem indicar funções similares (por exemplo, promotores no DNA).

Porque precisamos de alinhamentos múltiplos? Planejar experimentos de mutagênese sítio-dirigida, desenhar primers e/ou sondas especiais. Construir um perfil da família, o que possibilitará buscas mais avançadas, capazes de localizar membros mais distantes da mesma família.

Porque precisamos de alinhamentos múltiplos? Alinhamentos múltiplos são utilizados por programas de modelagem protéica. Podem ajudar na predição das estruturas secundária e terciária de novas seqüências. Alinhamentos múltiplos servem de input para a construção de árvores filogenéticas.

Estratégia Alinhamento par-a-par Busca nos bancos de dados Alinhamento múltiplo

Estratégia Alinhamento múltiplo Modelagem por homologia Análise filogenética Buscas avançadas em bancos de dados: padrões, motivos, sítios

O desafio computacional dos alinhamentos múltiplos Encontrar o alinhamento ótimo de um grupo de seqüências incluindo matches, mismatches e gaps é muito difícil. Para alinhamentos par-a-par, métodos de programação dinâmica são utilizados (Needleman & Wunsch, 1970; Smith & Waterman, 1981), mas estes são inviáveis para alinhamentos múltiplos (exigem tempo de processamento muito longo, proporcional ao produto do tamanho das seqüências).

O desafio computacional dos alinhamentos múltiplos Se alinhar 2 seqüências de 300 resíduos leva 1 segundo, alinhar 3 seqüências do mesmo tamanho levaria 300 segundos, e alinhar 10 seqüências levaria 300^8 segundos, o que é superior à idade do universo!

O desafio computacional dos alinhamentos múltiplos As dificuldades de se alinhar um grupo de seqüências variam conforme o grau de similaridade entre as seqüências. Um alto grau de variação entre as seqüências implica em um grande número de alinhamentos possíveis, o que torna muito difícil encontrar o alinhamento “ótimo”.

O desafio computacional dos alinhamentos múltiplos Métodos aproximados são utilizados ao invés de métodos de programação dinâmica. Outro desafio computacional é a inserção e pontuação de gaps nas seqüências alinhadas.

Métodos aproximados Alinhamento global progressivo: rápido, requer pouca espaço de memória e oferece bom desempenho para seqüências homólogas relativamente bem conservadas.

Métodos aproximados Alinhamento global baseado em blocos: as seqüências a serem comparadas devem compartilhar blocos (domínios) conservados, separados por regiões não conservadas contendo grandes indels.

Métodos aproximados Alinhamento global baseado em motivos: as seqüências a serem comparadas devem compartilhar regiões similares sem, necessariamente, serem relacionadas globalmente.

Programas de alinhamento global progressivo ClustalW http://www.ebi.ac.uk/clustalw/ T-Cofee http://igs-server.cnrs-mrs.fr/~cnotred/Projects_home_page/t_coffee_home_page.html

Programas de alinhamento global baseado em blocos DIALIGN http://bibiserv.techfak.uni-bielefeld.de/dialign/

Programas de alinhamento global baseado em motivos BLOCKS http://blocks.fhcrc.org/blocks/ MEME http://meme.sdsc.edu/meme/intro.html

Dicas na escolha de suas seqüências Seqüências retiradas diretamente dos bancos de dados podem conter dados irrelevantes (vários genes, fragmentos de diferentes tamanhos). Cheque suas seqüências e use somente a parte relevante para o alinhamento. Edite e remova as outras partes antes do alinhamento. Tente usar seqüências com aproximadamente o mesmo tamanho para o alinhamento.

Dicas na escolha de suas seqüências De forma geral: Quanto mais seqüências, melhor. Não inclua seqüências muito similares (>80%). Os sub-grupos devem ser alinhados separadamente, e somente um membro de cada sub-grupo deve ser incluído no alinhamento múltiplo final.

O que você necessita saber sobre os programas para a construção de alinhamentos múltiplos Quase todos os programas irão alinhar quaisquer seqüências que o usuário fornecer como input. Sempre retornarão um alinhamento, mesmo que as seqüências não sejam relacionadas entre si.

O que você necessita saber sobre os programas para a construção de alinhamentos múltiplos A maioria dos programas irá inserir gaps. Entretanto, uma vez inseridos, eles estão lá para ficar. Você deve checar como o programa trata a inclusão de gaps nos finais das seqüências.

Alinhamento global progressivo O método mais comumente utilizado para a construção de alinhamentos múltiplos é o alinhamento global progressivo. Como funciona?

ClustalW O ClustalW pode criar alinhamentos múltiplos, editar alinhamentos existentes e criar árvores filogenéticas. O alinhamento pode ser feito por dois métodos: Lento e preciso Rápido e aproximado

ClustalW O seu algoritmo consiste em três etapas: 1. Alinhamentos par-a-par são feitos entre todas as seqüências no grupo em estudo. Uma matriz de distâncias é construída com base em um esquema de pontuação. Ao calcular essa matriz, o programa leva em consideração a divergência entre as seqüências.

ClustalW 2. Uma árvore “guia” (filogenética), que reflete as similaridades entre as seqüências, é construída a partir da matriz de distâncias, utilizando o método de neighbour-joining. Essa árvore-guia tem ramos de diferentes tamanhos. Seu tamanho é proporcional ao tempo de divergência estimado ao longo de cada ramo.

ClustalW 3. O alinhamento progressivo das seqüências é feito, seguindo a ordem dos ramos na árvore-guia. As seqüências são alinhadas das extremidades até a raiz. Este alinhamento é feito de acordo com as relações filogenéticas encontradas na árvore-guia.

ClustalW

ClustalW

ClustalW

ClustalX – uma interface Windows para o ClustalW