A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

CENTRO DE GENOMICA E FITOMELHORAMENTO Introdução à Bioinformática

Apresentações semelhantes


Apresentação em tema: "CENTRO DE GENOMICA E FITOMELHORAMENTO Introdução à Bioinformática"— Transcrição da apresentação:

1 CENTRO DE GENOMICA E FITOMELHORAMENTO Introdução à Bioinformática
Universidade Federal de Pelotas Faculdade de Agronomia Eliseu Maciel Programa de Pós-Graduação em Agronomia CENTRO DE GENOMICA E FITOMELHORAMENTO Introdução à Bioinformática Professores: Luciano Maia Antonio Costa de Oliveira

2 ALINHAMENTO GLOBAL Luciano Maia

3 PARA TODAS ESTAS ESTRATÉGIAS SÓ EXISTE UM CAMINHO…
Comparação entre seqüências... GENOMA GENE PROTEÍNA RNA PARA TODAS ESTAS ESTRATÉGIAS SÓ EXISTE UM CAMINHO… ...O ALINHAMENTO E ENTRE SEQüÊNCIAS ENTRE DNA, RNA e PROTEÍNAS

4 ?

5 Comparação de Seqüências
Alinhamento de seqüências... Comparação de Seqüências A função de distância d(x,y) pode ser entendida como o menor número de operações (inserção, remoção e/ou substituição) que sejam capazes de transformar a seqüência x na seqüência y. (Levenshtein, 1966)

6 Duas das mais típicas distâncias de edição utilizadas
Alinhamento de seqüências... Duas das mais típicas distâncias de edição utilizadas • distância de edição de Levenshtein – considera três operações de edição: Inserção Deleção Substituição • distância de edição de Damerau – considera quatro operações de edição: Transposição entre adjacentes

7 ALGORITIMO INGÊNUO - Formula de Stirling
Alinhamento de seqüências... Não é tão simples... ALGORITIMO INGÊNUO - Formula de Stirling Joel Pothier - Université Paris

8 The Traveling Salesman Problem
Alinhamento de seqüências... Qual o caminho mais fácil?? The Traveling Salesman Problem O caixeiro viajante

9 Alinhamento de seqüências...
Melhor solução computacional = Programação dinâmica Programação dinâmica Técnica de programação aplicável quando um grande número de passos pode ser estruturado numa sucessão de cada um destes passos. Um passo contém uma ou um número de soluções parciais. Cada passo pode ser calculado por recorrência a um número fixo de soluções parciais de passos anteriores.

10 Programação dinâmica e recursividade
Algoritmos em bioinformática Algoritmo mais apropriado é: Programação dinâmica e recursividade A programação dinâmica é aplicável sempre que um grande espaço de procura pode ser estruturado numa successão de passos, de tal forma que: • o passo inicial contém as soluções triviais dos sub-problemas; • cada solução parcial num passo posterior pode ser calculada por recorrência a um número fixo de soluções parciais de passos anteriores; • o passo final contém a solução global. DE MANEIRA SIMPLÓRIA: isso quer dizer…. Dá o primeiro passo e ver o resultado dele…utiliza o resultado do primeiro passo para direcionar o segundo passo…utiliza o resultado do segundo passo para direcionar o terceiro passo…etc… DINAMICA = FAZER UMA COISA DE CADA VEZ, MAs…FAZER TODAS RECURSIVIDADE = OLHAR UM PASSO ANTEIOR COMO ORIENTAÇÃO PARA O PRÓXIMO

11 para um determinado esquema de “score”
Algoritmos em bioinformática Algoritmos exatos para um determinado esquema de “score” determinam o alinhamento correspondente ao “score optimo” alinhamento global Algoritmos heurísticos métodos aproximados, não existe garantia de obter alinhamento correspondente ao “score optimo” blast (não o alinhamento local, mas sim o programa BLAST!!!)

12 E O QUE ISSO TEM A VER COM MINHAS SEQUENCIAS DE DNA???
Algoritmos em bioinformática E O QUE ISSO TEM A VER COM MINHAS SEQUENCIAS DE DNA??? R: Diferentes problemas…diferentes soluções! Procura Exaustiva (Exhaustive Search) Analisa todas as soluções; Algoritmos muito lentos, com aplicação a problemas de pequena dimensão Ex. Aplicação: DNA restriction mapping Pesquisa de motivos Algoritmos gananciosos (Greedy algorthms) Em cada interação, escolhe uma solução de acordo com um determinado critério, a solução “mais atractiva” nessa iteração. Não existe garantia de obter uma “boa” solução final! Ex. Aplicação: Rearranjamento de cromossomos Programação Dinâmica (Dynamic Programming) Alinhamento Global Alinhamento Local Divisão e Conquista (Divide-and-Conqer) Particiona o problema em subproblemas de menor dimensão que consegue resolver. Combina as soluções dos subproblemas para obter a solução do problema inicial Ex: programa Blast (alinhamento local) Algoritmos Aleatórios (Randomized Algrithms) Realizam escolhas aleatoriamente. Ex: Pesquisa de motivos (Gibbs Sampling)

13 ? QUERIDA ROSA VERMELHA QUERO UM AMOROSO VERME
Alinhamento de seqüências... QUERIDA ROSA VERMELHA QUERO UM AMOROSO VERME ? ESTAS DUAS FRASES SÃO PARECIDAS? QUANTO ENTRE ELAS É PARECIDO?

14 MUITO CUIDADO NOS ALINHAMENTOS
Comparação entre seqüências... 1-QUERIDAROSAVERMELHA 2-QUEROUMAMOROSOVERME MUITO CUIDADO NOS ALINHAMENTOS

15 Alinhamento de seqüências...
Alinhamento Global Alinhamento Local

16 DIFERENÇAS ENTRE AS DUAS ABORDAGENS
VISÃO GERAL DIFERENÇAS ENTRE AS DUAS ABORDAGENS    

17 A-----TCCGGAATGCG ACGCGCTGGGGAAT-CG >Seq1 ATCCGGAATGCG
Alinhamento de seqüências... COMPONENTES DE UM ALINHAMENTO >Seq1 ATCCGGAATGCG >Seq2 ACGCGCTGGGGAATCG MISMATCH GAP EXTENSION GAP OPEN A-----TCCGGAATGCG ACGCGCTGGGGAAT-CG MATCH GAP OPEN

18 Substituição(Mismatch):
Alinhamento de seqüências... COMPONENTES DE UM ALINHAMENTO Identidade(Match): duas letras idênticas numa mesma posição no alinhamento Substituição(Mismatch): duas letras diferentes numa mesma posição no alinhamento InDel Gap(buraco): GAP OPEN espaços únicos ou consecutivos em entre duas seqüência (gap extension)

19 Por quê InDel???? Inserção ou deleção?? COMPONENTES DE UM ALINHAMENTO
Alinhamento de seqüências... COMPONENTES DE UM ALINHAMENTO Por quê InDel???? Inserção ou deleção??

20 ATCGGGTTAACCC ATCGGGTTAACCC ATCGGGTTAACCC ATCG-GTTAACCC
Alinhamento de seqüências... COMPONENTES DE UM ALINHAMENTO AVÓS ATCGGGTTAACCC ATCGGGTTAACCC PAI ATCGGGTTAACCC MÃE ATCG-GTTAACCC FILHO NESTE CASO PODEMOS SABER QUE OS GENITORES CONTINHAM O NUCLEOTIDEO e NO FILHO ESTE NUCLEOTIDEO FOI PERDIDO. (DELEÇÃO)

21 ATCGTTAACCC ATCGTTAACCC ATCGTTAACCC ATCGGGTTAACCC
Alinhamento de seqüências... COMPONENTES DE UM ALINHAMENTO AVÓS ATCGTTAACCC ATCGTTAACCC PAI ATCGTTAACCC MÃE ATCGGGTTAACCC FILHO NESTE CASO PODEMOS SABER QUE OS GENITORES NÃO CONTINHAM O NUCLEOTIDEO e NO FILHO ESTE NUCLEOTIDEO FOI ADICIONADO. (INSERÇÃO)

22 ATCG TTAACCC ATCGGGTTAACCC Por quê InDel????
Alinhamento de seqüências... COMPONENTES DE UM ALINHAMENTO Por quê InDel???? JOÃZINHO - Brasil MARY - Inglaterra ATCG TTAACCC ATCGGGTTAACCC NÃO TEMOS COMO SABER, QUEM GANHOU ou QUEM PERDEU!!!! INDEL

23 ATCG TTAACCC ATCGGGTTAACCC COMPONENTES DE UM ALINHAMENTO
Alinhamento de seqüências... COMPONENTES DE UM ALINHAMENTO ATCG TTAACCC ATCGGGTTAACCC NÃO TEMOS COMO SABER, QUEM GANHOU ou QUEM PERDEU!!!! INDEL

24 ATCGGGTTAACCC ATCGTTAACCC ATCGTTAACCC COMPONENTES DE UM ALINHAMENTO
Alinhamento de seqüências... COMPONENTES DE UM ALINHAMENTO ATCGGGTTAACCC ATCGTTAACCC ATCGTTAACCC AQUI PODEMOS VER QUE O HOMEM GANHOU 2 NUCLEOTIDEOS (INSERÇÃO)

25 ATCGGGTTAACCC ATCGTGAACCC ATCGTTAACCC Por quê InDel????
Alinhamento de seqüências... Por quê InDel???? ATCGGGTTAACCC ATCGTGAACCC ATCGTTAACCC SE NÃO CONHECEMOS O MODELO DE EVOLUÇÃO NÃO PODEMOS DIZER SE É DELEÇÃO ou INSERÇÃO

26 Assim existem 4 possibilidades:
Alinhamento de seqüências... VISÃO GERAL Assim existem 4 possibilidades: Inserção de uma base é contabilizada negativamente Remoção de uma base é contabilizada negativamente Substituição de uma base por outra contabilizada negativamente Coincidência de bases é contabilizada positivamente

27 ALINHAMENTO GLOBAL

28 Alinhamento Global

29 >> ALGOTIRIMO DE NEEDLEMAN e WUNSCH
COMO É CONSTRUIDO UM Alinhamento Global ? >> ALGOTIRIMO DE NEEDLEMAN e WUNSCH

30 Alinhamento Global Alinhamento Global: Algoritmo Needleman-Wunsh (1969) Idéia: Construir um alinhamento, utilizando a cada passo as soluções obtidas anteriormente para o trecho da subseqüência já alinhada • Constrói uma matriz M com índices i e j, um para cada seqüência • O valor M(i,j) representa a melhor solução obtida pela função de mérito para o alinhamento de x1...i com y1...j

31 Alinhamento Global – Algoritmo de Needleman-Wunsch
Considere duas sequencias a serem alinhadas: 1)Dadas as sequencias: A = GGATCGA B = GAATTCAGTTA j = tamanho de A ► 7 i = tamanho de B ► 11 2)Criar matriz M com coordenadas X[j+1] e Y[i+1]; x y

32 Alinhamento Global – Algoritmo de Needleman-Wunsch
2)Criar matriz M com coordenadas X[j+1] e Y[i+1]

33 Alinhamento Global – Algoritmo de Needleman-Wunsch
3) Preencher as posições da matriz (M) com as sequencias A = GGATCGA B = GAATTCAGTTA

34 Alinhamento Global – Algoritmo de Needleman-Wunsch
4) Preencher as posições X-1 ate Xj e Y-1 ate Yj com valor nulo (0) A = GGATCGA B = GAATTCAGTTA

35 Alinhamento Global – Algoritmo de Needleman-Wunsch
match mismatch -1 Selecionar o MAIOR VALOR Qdo valores IGUAIS seleciona a DIAGONAL 5a) Preencher posiçoes da matriz TESTAR SE 1x = 1y 1x (G)= 1y (G)? SIM Some 1 aos valores dos adjacentes 0 + 1 = 1 0 + 1 = 1 0 + 1 = 1

36 Alinhamento Global – Algoritmo de Needleman-Wunsch
5b) Preencher posiçoes da matriz TESTAR SE 1x = 2y 1x (G)= 2y (A)? NAO SOME -1 AOS ADJACENTES 1 - 1 = 0 0 - 1 = -1 match mismatch -1 Selecionar o MAIOR VALOR Qdo valores IGUAIS seleciona a DIAGONAL 0 - 1 = -1

37 Alinhamento Global – Algoritmo de Needleman-Wunsch
5c) Preencher posiçoes da matriz 1x (G)= 1y (G)? s 0 + 1 = 1 1x (G)= 2y (A) ? n 1 - 1 = 0 0 - 1 = -1 match mismatch -1 Selecionar o MAIOR VALOR Qdo valores IGUAIS seleciona a DIAGONAL

38 Alinhamento Global – Algoritmo de Needleman-Wunsch
5d) Preencher posiçoes da matriz 1x (G)= 1y (G)? s 0 + 1 = 1 1x (G)= 2y (A) ? n 1 - 1 = 0 0 - 1 = -1 1x (G)= 3y (A) ? 1x (G)= 4y (T) ? = -2 1x (G)= 5y (C) ? match mismatch -1 Selecionar o MAIOR VALOR Qdo valores IGUAIS seleciona a DIAGONAL

39 Alinhamento Global – Algoritmo de Needleman-Wunsch
5e) Preencher posiçoes da matriz TUDO CALCULADO…….. match mismatch -1

40 Alinhamento Global – Algoritmo de Needleman-Wunsch
6) BACK-TRACKING caminhamento contrario buscando os maiores valores

41 Alinhamento Global – Algoritmo de Needleman-Wunsch
6) BACK-TRACKING – caminhamento contrario buscando os maiores valores SELECIONAR O MELHOR CAMINHAMENTO BACK TRACKING

42 SE VALORES IGUAIS, SELECIONA A DIAGONAL
Alinhamento Global – Algoritmo de Needleman-Wunsch 6) BACK-TRACKING – caminhamento contrario buscando os maiores valores 5 5 4 SE VALORES IGUAIS, SELECIONA A DIAGONAL

43 SE VALORES IGUAIS, SELECIONA A DIAGONAL
Alinhamento Global – Algoritmo de Needleman-Wunsch 6) BACK-TRACKING – caminhamento contrario buscando os maiores valores SE VALORES IGUAIS, SELECIONA A DIAGONAL

44 SE VALORES IGUAIS, SELECIONA A DIAGONAL
Alinhamento Global – Algoritmo de Needleman-Wunsch 6) BACK-TRACKING – caminhamento contrario buscando os maiores valores 6 4 SE VALORES IGUAIS, SELECIONA A DIAGONAL 4

45 SE VALORES IGUAIS, SELECIONA A DIAGONAL
Alinhamento Global – Algoritmo de Needleman-Wunsch 6) BACK-TRACKING – caminhamento contrario buscando os maiores valores SE VALORES IGUAIS, SELECIONA A DIAGONAL

46 Alinhamento Global – Algoritmo de Needleman-Wunsch
6) BACK-TRACKING – caminhamento contrario buscando os maiores valores SELECIONAR O MELHOR CAMINHAMENTO BACK TRACKING

47 Alinhamento Global – Algoritmo de Needleman-Wunsch
6) BACK-TRACKING – caminhamento contrario buscando os maiores valores SELECIONAR O MELHOR CAMINHAMENTO BACK TRACKING

48 Alinhamento Global – Algoritmo de Needleman-Wunsch
7) Montar o alinhamento Trazer para Y’ as bases de Y

49 Alinhamento Global – Algoritmo de Needleman-Wunsch
7) Montar o alinhamento Trazer para Y’ as bases de Y

50 Alinhamento Global – Algoritmo de Needleman-Wunsch
7) Montar o alinhamento NESTE CASO? QDO DOIS PASSOS ACONTECEM NA MESMA LINHA

51 Alinhamento Global – Algoritmo de Needleman-Wunsch
7) Montar o alinhamento NESTE CASO? QDO DOIS PASSOS ACONTECEM NA MESMA LINHA

52 Alinhamento Global – Algoritmo de Needleman-Wunsch
8) Montar o alinhamento NESTE CASO? QDO DOIS PASSOS ACONTECEM NA MESMA LINHA R: inserir um GAP…

53 Alinhamento Global – Algoritmo de Needleman-Wunsch
8) Montar o alinhamento Finalmente, fazer o alinhamento… SOBREPOR DUAS SEQUENCIAS…

54 Alinhamento Global – Algoritmo de Needleman-Wunsch
8) Montar o alinhamento

55 Alinhamento Global – Algoritmo de Needleman-Wunsch
8) Montar o alinhamento

56 Alinhamento Global – Algoritmo de Needleman-Wunsch
8) Montar o alinhamento

57 Alinhamento Global – Algoritmo de Needleman-Wunsch
8) Montar o alinhamento

58 Alinhamento Global – Algoritmo de Needleman-Wunsch
RESULTADO

59 Alinhamento Global – Algoritmo de Needleman-Wunsch
RESULTADO Tamanho = 12 Match = 6 IDENTIDADE = 6/12 = 50

60 score = [(9 ·1)+ (1·(-1) )+ (1·(-2) ]= 6
Alinhamento Global – Algoritmo de Needleman-Wunsch DANDO VALORES (PESO) Score de um Alinhamento G A - C G G A T T A G G A T C G G A A T A G score = [(9 ·1)+ (1·(-1) )+ (1·(-2) ]= 6 match 1*9 mismatch -1*1 gap -2*1

61 Score de um Alinhamento
Alinhamento Global – Algoritmo de Needleman-Wunsch Score de um Alinhamento G A C G G A T T A G G A T T T T C G G A A T A G match * 9 mismatch * 1 gap * 1 gapextension -0.5 * 4 score = [(9 *1)+ (1*(-1) )+ (1*(-2)) + 4*(-0.5)]= 4

62 Alinhamento Global – Algoritmo de Needleman-Wunsch
OS PROGAMAS POSSIBILITAM MAIS DE UM ALINHAMENTO!!!

63 LETRAS (CARACTERES)??? CORES?

64

65 AVFPMILW RED small, hydrophobic, aromatic
DE BLUE acidic RK MAGENTA basic. STYHCNGQ GREEN hydroxyl, amine, amide, basic CONSENSUS SYMBOLS: * = means that the residues or nucleotides in that column are identical in all sequences in the alignment. : = conserved . = semi-conserved

66 * = identical : = conserved . = semi-conserved
AVFPMILW RED DE BLUE RK MAGENTA STYHCNGQ GREEN * = identical : = conserved . = semi-conserved

67 ???!!!!


Carregar ppt "CENTRO DE GENOMICA E FITOMELHORAMENTO Introdução à Bioinformática"

Apresentações semelhantes


Anúncios Google