CENTRO DE GENOMICA E FITOMELHORAMENTO Introdução à Bioinformática

Slides:



Advertisements
Apresentações semelhantes
Projeto de Programação PD-I
Advertisements

Árvores CC/EC/Mestrado Teoria dos Grafos ‏ 1.
Instituto de Computação
Métodos Iterativos.
INTRODUÇÃO AO ESTUDO DAS MATRIZES
Métodos para representação de estruturas hierárquicas
CONCEITOS BÁSICOS DA META-HEURÍSTICA TABU SEARCH
Análise Projeto de Algoritmos
Meta - heurísticas Prof. Aurora
GRASP Greedy Randomized Adaptative Search Procedure
Metaheurísticas Prof. Aurora Pozo Departamento de Informática Universidade Federal do Paraná
PROBLEMA DE ROTEAMENTO DE VEíCULOS COM DIVISÃO DE ENTREGA
1 Busca Heurística - Informada Estratégias de Busca Exaustiva (Cega) encontram soluções para problemas pela geração sistemática de novos estados, que são.
Geometria Computacional Interseção de Segmentos
Dárlinton B. Feres Carvalho
Computação Evolutiva: Programação Genética
Estrutura e movimento a partir de imagens
Busca Heurística - Informada
Busca Heurística - Informada
Inteligência Artificial
Algoritmos Genéticos Rômulo Ferreira Douro.
O Surgimento dos Sistemas de Bioinformática
Meta - heurísticas Prof. Aurora
Informática Teórica Engenharia da Computação
1 Introdução aos Agentes Inteligentes Flávia Barros.
Intr. à Biologia Computacional ALINHAMENTO DE SEQÜÊNCIAS.
I Iterated Local Search Helena R. Lorenço, Olivier Martinz
Capítulo 12: Tratamento de Restrições
Matemática para Economia III
Professora: Ana Cristina G. e Silva Natal-RN
Otimização Inteira 5a. Aula Franklina.
Resolução de sistemas lineares Métodos Numéricos para Engenharia I
GRASP Disciplina: ODST Professores: José Oliveira e Maria Carravilla
Introdução e Busca Cega
Introdução aos Agentes Inteligentes Busca Cega (Exaustiva)
Introdução aos Agentes Inteligentes Busca Heurística (Informada)
Sistema de equações lineares
Bioinformática (Alinhamento de Seqüências)
Tópicos Avançados em Inteligência Artificial
Algoritmos Genéticos Ricardo Prudêncio.
Construção e Análise de Algoritmos
Busca Combinatorial e Métodos de Heurística
Equações algébricas e transcendentais
Distância Mínima de Edição Profa. Sandra de Amo Bacharelado em Ciência da Computação - UFU.
Definições e tipos de alinhamento. O uso do BLAST
Resolução de Problemas de Busca
Busca com Informação e Exploração “Busca heurística”
Métodos de Resolução Solução Analítica Solução Numérica
1 Introdução aos Agentes Inteligentes Resolução de Problemas de Busca Flávia Barros.
Programação Dinâmica.
Problemas NP-completos e Programação Dinâmica
Alinhamento de sequências Almir R. Pepato. Homologia primária e secundária 1- Estabelecimento da matriz de caracteres (observações a respeito dos semaforontes.
Alinhamento de Cadeias de DNA COMPARAÇÃO DE SEQÜÊNCIAS
Artigo: Berth allocation planning in the public berth system by genetic algorithms Akio Imai, Etsuko Nishimura, Stratos Papadimitriou, Heurística.
Geometria Computacional Fecho Convexo
Campus de Caraguatatuba Aula 18: Sistemas de Equações Lineares (6)
Exercícios de Fluxo em Redes
Algoritmos e Heurísticas para Seqüenciamento de DNA
Análise e Síntese de Algoritmos
Principais algoritmos de alinhamento de sequências genéticas
Alinhamentos Múltiplos
Análise e Síntese de Algoritmos Algoritmos GreedyCLRS, Cap. 16.
Algoritmos Genéticos Ricardo Prudêncio.
CÁLCULO NUMÉRICO Aula 5 – Sistema de Equações lineares.
Computação Evolutiva Nome dado ao estudo de algoritmos cuja inspiração é o processo de evolução natural das espécies. Origem: trabalho de um pesquisador.
              Investigação Operacional Métodos de Programação Linear: Gráfica, Simplex (Mestrado) Engenharia Industrial
Alinhamento Global de Seqüências Katia Guimarães.
1 Algoritmos Genéticos em Otimização de Planejamento l Planejamento ocorre em todas as atividades e envolve: PLANEJAMENTO Recursos Tarefas Tempo Objetivos.
Abordagens para Problemas Intratáveis Katia S. Guimarães
Transcrição da apresentação:

CENTRO DE GENOMICA E FITOMELHORAMENTO Introdução à Bioinformática Universidade Federal de Pelotas Faculdade de Agronomia Eliseu Maciel Programa de Pós-Graduação em Agronomia CENTRO DE GENOMICA E FITOMELHORAMENTO Introdução à Bioinformática Professores: Luciano Maia Antonio Costa de Oliveira

ALINHAMENTO GLOBAL Luciano Maia

PARA TODAS ESTAS ESTRATÉGIAS SÓ EXISTE UM CAMINHO… Comparação entre seqüências... GENOMA GENE PROTEÍNA RNA PARA TODAS ESTAS ESTRATÉGIAS SÓ EXISTE UM CAMINHO… ...O ALINHAMENTO E ENTRE SEQüÊNCIAS ENTRE DNA, RNA e PROTEÍNAS

?

Comparação de Seqüências Alinhamento de seqüências... Comparação de Seqüências A função de distância d(x,y) pode ser entendida como o menor número de operações (inserção, remoção e/ou substituição) que sejam capazes de transformar a seqüência x na seqüência y. (Levenshtein, 1966)

Duas das mais típicas distâncias de edição utilizadas Alinhamento de seqüências... Duas das mais típicas distâncias de edição utilizadas • distância de edição de Levenshtein – considera três operações de edição: Inserção Deleção Substituição • distância de edição de Damerau – considera quatro operações de edição: Transposição entre adjacentes

ALGORITIMO INGÊNUO - Formula de Stirling Alinhamento de seqüências... Não é tão simples... ALGORITIMO INGÊNUO - Formula de Stirling Joel Pothier - Université Paris

The Traveling Salesman Problem Alinhamento de seqüências... Qual o caminho mais fácil?? The Traveling Salesman Problem O caixeiro viajante

Alinhamento de seqüências... Melhor solução computacional = Programação dinâmica Programação dinâmica Técnica de programação aplicável quando um grande número de passos pode ser estruturado numa sucessão de cada um destes passos. Um passo contém uma ou um número de soluções parciais. Cada passo pode ser calculado por recorrência a um número fixo de soluções parciais de passos anteriores.

Programação dinâmica e recursividade Algoritmos em bioinformática Algoritmo mais apropriado é: Programação dinâmica e recursividade A programação dinâmica é aplicável sempre que um grande espaço de procura pode ser estruturado numa successão de passos, de tal forma que: • o passo inicial contém as soluções triviais dos sub-problemas; • cada solução parcial num passo posterior pode ser calculada por recorrência a um número fixo de soluções parciais de passos anteriores; • o passo final contém a solução global. DE MANEIRA SIMPLÓRIA: isso quer dizer…. Dá o primeiro passo e ver o resultado dele…utiliza o resultado do primeiro passo para direcionar o segundo passo…utiliza o resultado do segundo passo para direcionar o terceiro passo…etc… DINAMICA = FAZER UMA COISA DE CADA VEZ, MAs…FAZER TODAS RECURSIVIDADE = OLHAR UM PASSO ANTEIOR COMO ORIENTAÇÃO PARA O PRÓXIMO

para um determinado esquema de “score” Algoritmos em bioinformática Algoritmos exatos para um determinado esquema de “score” determinam o alinhamento correspondente ao “score optimo” alinhamento global Algoritmos heurísticos métodos aproximados, não existe garantia de obter alinhamento correspondente ao “score optimo” blast (não o alinhamento local, mas sim o programa BLAST!!!)

E O QUE ISSO TEM A VER COM MINHAS SEQUENCIAS DE DNA??? Algoritmos em bioinformática E O QUE ISSO TEM A VER COM MINHAS SEQUENCIAS DE DNA??? R: Diferentes problemas…diferentes soluções! Procura Exaustiva (Exhaustive Search) Analisa todas as soluções; Algoritmos muito lentos, com aplicação a problemas de pequena dimensão Ex. Aplicação: DNA restriction mapping Pesquisa de motivos Algoritmos gananciosos (Greedy algorthms) Em cada interação, escolhe uma solução de acordo com um determinado critério, a solução “mais atractiva” nessa iteração. Não existe garantia de obter uma “boa” solução final! Ex. Aplicação: Rearranjamento de cromossomos Programação Dinâmica (Dynamic Programming) Alinhamento Global Alinhamento Local Divisão e Conquista (Divide-and-Conqer) Particiona o problema em subproblemas de menor dimensão que consegue resolver. Combina as soluções dos subproblemas para obter a solução do problema inicial Ex: programa Blast (alinhamento local) Algoritmos Aleatórios (Randomized Algrithms) Realizam escolhas aleatoriamente. Ex: Pesquisa de motivos (Gibbs Sampling)

? QUERIDA ROSA VERMELHA QUERO UM AMOROSO VERME Alinhamento de seqüências... QUERIDA ROSA VERMELHA QUERO UM AMOROSO VERME ? ESTAS DUAS FRASES SÃO PARECIDAS? QUANTO ENTRE ELAS É PARECIDO?

MUITO CUIDADO NOS ALINHAMENTOS Comparação entre seqüências... 1-QUERIDAROSAVERMELHA 2-QUEROUMAMOROSOVERME MUITO CUIDADO NOS ALINHAMENTOS   

Alinhamento de seqüências... Alinhamento Global Alinhamento Local

DIFERENÇAS ENTRE AS DUAS ABORDAGENS VISÃO GERAL DIFERENÇAS ENTRE AS DUAS ABORDAGENS    

A-----TCCGGAATGCG ACGCGCTGGGGAAT-CG >Seq1 ATCCGGAATGCG Alinhamento de seqüências... COMPONENTES DE UM ALINHAMENTO >Seq1 ATCCGGAATGCG >Seq2 ACGCGCTGGGGAATCG MISMATCH GAP EXTENSION GAP OPEN A-----TCCGGAATGCG ACGCGCTGGGGAAT-CG MATCH GAP OPEN

Substituição(Mismatch): Alinhamento de seqüências... COMPONENTES DE UM ALINHAMENTO Identidade(Match): duas letras idênticas numa mesma posição no alinhamento Substituição(Mismatch): duas letras diferentes numa mesma posição no alinhamento InDel Gap(buraco): GAP OPEN espaços únicos ou consecutivos em entre duas seqüência (gap extension)

Por quê InDel???? Inserção ou deleção?? COMPONENTES DE UM ALINHAMENTO Alinhamento de seqüências... COMPONENTES DE UM ALINHAMENTO Por quê InDel???? Inserção ou deleção??

ATCGGGTTAACCC ATCGGGTTAACCC ATCGGGTTAACCC ATCG-GTTAACCC Alinhamento de seqüências... COMPONENTES DE UM ALINHAMENTO AVÓS ATCGGGTTAACCC ATCGGGTTAACCC PAI ATCGGGTTAACCC MÃE ATCG-GTTAACCC FILHO NESTE CASO PODEMOS SABER QUE OS GENITORES CONTINHAM O NUCLEOTIDEO e NO FILHO ESTE NUCLEOTIDEO FOI PERDIDO. (DELEÇÃO)

ATCGTTAACCC ATCGTTAACCC ATCGTTAACCC ATCGGGTTAACCC Alinhamento de seqüências... COMPONENTES DE UM ALINHAMENTO AVÓS ATCGTTAACCC ATCGTTAACCC PAI ATCGTTAACCC MÃE ATCGGGTTAACCC FILHO NESTE CASO PODEMOS SABER QUE OS GENITORES NÃO CONTINHAM O NUCLEOTIDEO e NO FILHO ESTE NUCLEOTIDEO FOI ADICIONADO. (INSERÇÃO)

ATCG TTAACCC ATCGGGTTAACCC Por quê InDel???? Alinhamento de seqüências... COMPONENTES DE UM ALINHAMENTO Por quê InDel???? JOÃZINHO - Brasil MARY - Inglaterra ATCG TTAACCC ATCGGGTTAACCC NÃO TEMOS COMO SABER, QUEM GANHOU ou QUEM PERDEU!!!! INDEL

ATCG TTAACCC ATCGGGTTAACCC COMPONENTES DE UM ALINHAMENTO Alinhamento de seqüências... COMPONENTES DE UM ALINHAMENTO ATCG TTAACCC ATCGGGTTAACCC NÃO TEMOS COMO SABER, QUEM GANHOU ou QUEM PERDEU!!!! INDEL

ATCGGGTTAACCC ATCGTTAACCC ATCGTTAACCC COMPONENTES DE UM ALINHAMENTO Alinhamento de seqüências... COMPONENTES DE UM ALINHAMENTO ATCGGGTTAACCC ATCGTTAACCC ATCGTTAACCC AQUI PODEMOS VER QUE O HOMEM GANHOU 2 NUCLEOTIDEOS (INSERÇÃO)

ATCGGGTTAACCC ATCGTGAACCC ATCGTTAACCC Por quê InDel???? Alinhamento de seqüências... Por quê InDel???? ATCGGGTTAACCC ATCGTGAACCC ATCGTTAACCC SE NÃO CONHECEMOS O MODELO DE EVOLUÇÃO NÃO PODEMOS DIZER SE É DELEÇÃO ou INSERÇÃO

Assim existem 4 possibilidades: Alinhamento de seqüências... VISÃO GERAL Assim existem 4 possibilidades: Inserção de uma base é contabilizada negativamente Remoção de uma base é contabilizada negativamente Substituição de uma base por outra contabilizada negativamente Coincidência de bases é contabilizada positivamente

ALINHAMENTO GLOBAL

Alinhamento Global

>> ALGOTIRIMO DE NEEDLEMAN e WUNSCH COMO É CONSTRUIDO UM Alinhamento Global ? >> ALGOTIRIMO DE NEEDLEMAN e WUNSCH

Alinhamento Global Alinhamento Global: Algoritmo Needleman-Wunsh (1969) Idéia: Construir um alinhamento, utilizando a cada passo as soluções obtidas anteriormente para o trecho da subseqüência já alinhada • Constrói uma matriz M com índices i e j, um para cada seqüência • O valor M(i,j) representa a melhor solução obtida pela função de mérito para o alinhamento de x1...i com y1...j

Alinhamento Global – Algoritmo de Needleman-Wunsch Considere duas sequencias a serem alinhadas: 1)Dadas as sequencias: A = GGATCGA B = GAATTCAGTTA j = tamanho de A ► 7 i = tamanho de B ► 11 2)Criar matriz M com coordenadas X[j+1] e Y[i+1]; x y

Alinhamento Global – Algoritmo de Needleman-Wunsch 2)Criar matriz M com coordenadas X[j+1] e Y[i+1]

Alinhamento Global – Algoritmo de Needleman-Wunsch 3) Preencher as posições da matriz (M) com as sequencias A = GGATCGA B = GAATTCAGTTA

Alinhamento Global – Algoritmo de Needleman-Wunsch 4) Preencher as posições X-1 ate Xj e Y-1 ate Yj com valor nulo (0) A = GGATCGA B = GAATTCAGTTA

Alinhamento Global – Algoritmo de Needleman-Wunsch match +1 mismatch -1 Selecionar o MAIOR VALOR Qdo valores IGUAIS seleciona a DIAGONAL 5a) Preencher posiçoes da matriz TESTAR SE 1x = 1y 1x (G)= 1y (G)? SIM Some 1 aos valores dos adjacentes 0 + 1 = 1 0 + 1 = 1 0 + 1 = 1

Alinhamento Global – Algoritmo de Needleman-Wunsch 5b) Preencher posiçoes da matriz TESTAR SE 1x = 2y 1x (G)= 2y (A)? NAO SOME -1 AOS ADJACENTES 1 - 1 = 0 0 - 1 = -1 match +1 mismatch -1 Selecionar o MAIOR VALOR Qdo valores IGUAIS seleciona a DIAGONAL 0 - 1 = -1

Alinhamento Global – Algoritmo de Needleman-Wunsch 5c) Preencher posiçoes da matriz 1x (G)= 1y (G)? s 0 + 1 = 1 1x (G)= 2y (A) ? n 1 - 1 = 0 0 - 1 = -1 match +1 mismatch -1 Selecionar o MAIOR VALOR Qdo valores IGUAIS seleciona a DIAGONAL

Alinhamento Global – Algoritmo de Needleman-Wunsch 5d) Preencher posiçoes da matriz 1x (G)= 1y (G)? s 0 + 1 = 1 1x (G)= 2y (A) ? n 1 - 1 = 0 0 - 1 = -1 1x (G)= 3y (A) ? 1x (G)= 4y (T) ? -1 - 1 = -2 1x (G)= 5y (C) ? match +1 mismatch -1 Selecionar o MAIOR VALOR Qdo valores IGUAIS seleciona a DIAGONAL

Alinhamento Global – Algoritmo de Needleman-Wunsch 5e) Preencher posiçoes da matriz TUDO CALCULADO…….. match +1 mismatch -1

Alinhamento Global – Algoritmo de Needleman-Wunsch 6) BACK-TRACKING caminhamento contrario buscando os maiores valores

Alinhamento Global – Algoritmo de Needleman-Wunsch 6) BACK-TRACKING – caminhamento contrario buscando os maiores valores SELECIONAR O MELHOR CAMINHAMENTO BACK TRACKING

SE VALORES IGUAIS, SELECIONA A DIAGONAL Alinhamento Global – Algoritmo de Needleman-Wunsch 6) BACK-TRACKING – caminhamento contrario buscando os maiores valores 5 5 4 SE VALORES IGUAIS, SELECIONA A DIAGONAL

SE VALORES IGUAIS, SELECIONA A DIAGONAL Alinhamento Global – Algoritmo de Needleman-Wunsch 6) BACK-TRACKING – caminhamento contrario buscando os maiores valores SE VALORES IGUAIS, SELECIONA A DIAGONAL

SE VALORES IGUAIS, SELECIONA A DIAGONAL Alinhamento Global – Algoritmo de Needleman-Wunsch 6) BACK-TRACKING – caminhamento contrario buscando os maiores valores 6 4 SE VALORES IGUAIS, SELECIONA A DIAGONAL 4

SE VALORES IGUAIS, SELECIONA A DIAGONAL Alinhamento Global – Algoritmo de Needleman-Wunsch 6) BACK-TRACKING – caminhamento contrario buscando os maiores valores SE VALORES IGUAIS, SELECIONA A DIAGONAL

Alinhamento Global – Algoritmo de Needleman-Wunsch 6) BACK-TRACKING – caminhamento contrario buscando os maiores valores SELECIONAR O MELHOR CAMINHAMENTO BACK TRACKING

Alinhamento Global – Algoritmo de Needleman-Wunsch 6) BACK-TRACKING – caminhamento contrario buscando os maiores valores SELECIONAR O MELHOR CAMINHAMENTO BACK TRACKING

Alinhamento Global – Algoritmo de Needleman-Wunsch 7) Montar o alinhamento Trazer para Y’ as bases de Y

Alinhamento Global – Algoritmo de Needleman-Wunsch 7) Montar o alinhamento Trazer para Y’ as bases de Y

Alinhamento Global – Algoritmo de Needleman-Wunsch 7) Montar o alinhamento NESTE CASO? QDO DOIS PASSOS ACONTECEM NA MESMA LINHA

Alinhamento Global – Algoritmo de Needleman-Wunsch 7) Montar o alinhamento NESTE CASO? QDO DOIS PASSOS ACONTECEM NA MESMA LINHA

Alinhamento Global – Algoritmo de Needleman-Wunsch 8) Montar o alinhamento NESTE CASO? QDO DOIS PASSOS ACONTECEM NA MESMA LINHA R: inserir um GAP…

Alinhamento Global – Algoritmo de Needleman-Wunsch 8) Montar o alinhamento Finalmente, fazer o alinhamento… SOBREPOR DUAS SEQUENCIAS…

Alinhamento Global – Algoritmo de Needleman-Wunsch 8) Montar o alinhamento

Alinhamento Global – Algoritmo de Needleman-Wunsch 8) Montar o alinhamento

Alinhamento Global – Algoritmo de Needleman-Wunsch 8) Montar o alinhamento

Alinhamento Global – Algoritmo de Needleman-Wunsch 8) Montar o alinhamento

Alinhamento Global – Algoritmo de Needleman-Wunsch RESULTADO

Alinhamento Global – Algoritmo de Needleman-Wunsch RESULTADO Tamanho = 12 Match = 6 IDENTIDADE = 6/12 = 50

score = [(9 ·1)+ (1·(-1) )+ (1·(-2) ]= 6 Alinhamento Global – Algoritmo de Needleman-Wunsch DANDO VALORES (PESO) Score de um Alinhamento G A - C G G A T T A G G A T C G G A A T A G score = [(9 ·1)+ (1·(-1) )+ (1·(-2) ]= 6 match 1*9 mismatch -1*1 gap -2*1

Score de um Alinhamento Alinhamento Global – Algoritmo de Needleman-Wunsch Score de um Alinhamento G A - - - - C G G A T T A G G A T T T T C G G A A T A G match 1 * 9 mismatch -1 * 1 gap -2 * 1 gapextension -0.5 * 4 score = [(9 *1)+ (1*(-1) )+ (1*(-2)) + 4*(-0.5)]= 4

Alinhamento Global – Algoritmo de Needleman-Wunsch OS PROGAMAS POSSIBILITAM MAIS DE UM ALINHAMENTO!!!

LETRAS (CARACTERES)??? CORES? http://www.ebi.ac.uk/help/formats.html

AVFPMILW RED small, hydrophobic, aromatic DE BLUE acidic RK MAGENTA basic. STYHCNGQ GREEN hydroxyl, amine, amide, basic CONSENSUS SYMBOLS: * = means that the residues or nucleotides in that column are identical in all sequences in the alignment. : = conserved . = semi-conserved http://www.ebi.ac.uk/help/formats.html

* = identical : = conserved . = semi-conserved AVFPMILW RED DE BLUE RK MAGENTA STYHCNGQ GREEN * = identical : = conserved . = semi-conserved

???!!!! lucianoc.maia@gmail.com