ALINHAMENTOS LOCAIS E SEMI-GLOBAIS

Slides:



Advertisements
Apresentações semelhantes
Algoritmos em Grafos (Parte 2)
Advertisements

HASHING Katia Guimarães julho/2002
Projeto de Patrocínio Site Agenda do Samba & Choro
Análise de Voz e Vídeo Reconhecimento de voz baseado em modelos de palavras conectadas André Vitor de Almeida Palhares.
Katia S. Guimarães QUICKSORT Katia S. Guimarães
Grafos Introdução
Ansiedade, Medo e Depressão
Hotel do Sol Bahia Atlântico
2 Dezembro de 2005Simulação com Modelos Diferenciais1 Jorge Cruz DI/FCT/UNL Programação para as Ciências Experimentais 1º Semestre 2005/2006.
1 Complexidade de Algoritmos Complexidade de pior caso Complexidade de melhor caso de uso bem menos freqüente em algumas situações específicas Complexidade.
ÓPTICA Abordar assuntos introdutórios sobre óptica que darão um pouco de base para a palestra sobre metrologia óptica Conceitos como reflexão, refração.
O Impacto dos programas Bolsa Escola Simon Schwartzman Instituto de Estudos do Trabalho e Sociedade Dezembro de 2004.
Qualiti Courses :: Documento de Requisitos. {icc2, jmmn, mmc2, CIn-UFPE Equipe Ivan Cordeiro Cardim Julio Maravitch Maurício.
O uso de questionários em trabalhos científicos
Complexidade de Computação Para avaliar a qualidade de um algoritmo usamos como critério o espaço e o tempo de execução. Ao.
Introdução à NP-completude
Backtracking Katia Guimarães.
Metodologia da Pesquisa em Ensino de Ciências I
Projeto de Recursos Humanos Outubro 2011
Metodologia da Pesquisa em Ensino de Ciências I
Metodologia da Pesquisa em Ensino de Ciências I
Publicidade com banner
Programa de Cargos e Salários
Neoliberalismo e Crise da Educação Pública
Silogística Tudo o que os artistas fazem é arte.
Aula prática 6 Vetores e Matrizes
Intr. à Biologia Computacional
Intr. à Biologia Computacional
Intr. à Biologia Computacional ALINHAMENTO DE SEQÜÊNCIAS.
Cálculo Numérico / Métodos Numéricos
Metodologia da Pesquisa em Ensino de Ciências I
Metodologia da Pesquisa em Ensino de Ciências I
Metodologia da Pesquisa em Ensino de Ciências I
FABER Cirurgia & Implantes.
LÓGICA FILOSÓFICA. Teoria Obj: Construir um conceito de lógica
PLATÃO MITO DA CAVERNA 02/04/2017
Nazi-fascismo 02/04/2017
Aula prática 6 Vetores e Matrizes
MÉTODOS E SISTEMAS ADMINISTRATIVOS - I
Bioinformática (Alinhamento de Seqüências)
ALINHAMENTOS LOCAIS E SEMI-GLOBAIS
Introdução à NP-completude Katia S. Guimarães
Algoritmos Gulosos em Grafos
Katia S. Guimarães Busca em Grafos Katia S. Guimarães
Abordagens para problemas NP-completos
Árvores Binárias e Encaminhamentos
Katia S. Guimarães Heaps Katia S. Guimarães
Remoção e Inserção em Heaps
Katia S. Guimarães Heapsort Katia S. Guimarães
Ferramentas de Planejamento
CASE: O POSTGRESQL EM BI Milhares de operações diárias consolidadas "near-real-time" PGDay Campinas Wagner Correa Ramos Anderson.
Metodologia da Pesquisa em Ensino de Ciências I
Julho Fabrício Murai – Sobre dois fenômenos em redes P2P do tipo BitTorrent Fabrício Murai CTD 2012 Orientadores:Daniel.
Outubro  Apresentar através de debates o perfil e papel dos Multiplicadores e Área de O & M / Processos.  Implantar.
MANUAIS NA EMPRESA
Auditório SUCESU-SP 27/03/2007 Marco Antonio Terlizzi
A Economia Açucareira 10/04/2017
RepeatMasker Aluno: Fred Ulisses maranhão Professora: Kátia S. Guimarães Algoritmos p/ processamento de Cadeias, Cin, UFPE - 1/2001.
Anjolina Grisi de Oliveira obs: muitos slides foram cedidos por Adolfo Almeida Duran (UFBA) 2005.
Definições e tipos de alinhamento. O uso do BLAST
Melhorando Alinhamentos Locais Katia Guimarães
Alinhamento de Cadeias de DNA COMPARAÇÃO DE SEQÜÊNCIAS
Intr. à Biologia Computacional ALINHAMENTOS ÓTIMOS GLOBAIS.
Estruturas de Dados e Algoritmos para Inferência de Motifs Katia Guimarães.
Algoritmos e Heurísticas para Seqüenciamento de DNA
Principais algoritmos de alinhamento de sequências genéticas
Alinhamentos Múltiplos
 O que são arrays:  estruturas de dados homogêneas  coleção de elementos do mesmo tipo referenciada por um nome comum  um array pode ser imaginado.
Alinhamento Global de Seqüências Katia Guimarães.
PROFESSOR: CÉZAR AUGUSTO PEREIRA DOS SANTOS 1.
Transcrição da apresentação:

ALINHAMENTOS LOCAIS E SEMI-GLOBAIS Katia Guimarães

Montagem de Fragmentos Dadas duas cadeias de comprimentos similares, identificar “boas similaridades” entre o início de uma e o final da outra, ou vice-versa. Ex: - - - - - - - - CAGCACTTGGATTAGAC TACCTGCGCAGCG - TTG - - - - - - - - - Teremos 7 matches, 1 mismatch e 17 spaces. katia@cin.ufpe.br

Tentando Alinhamento Global Considerando toda a cadeia (ALINH. GLOBAL): TA - C - CTGCGCAGCGTGG - CAGCACT - TGGA – TTAGAC Teremos 7 matches, 7 mismatches e 5 spaces Levando a um score global de –3. katia@cin.ufpe.br

Alinhamento Semi-global - - - - - - - - CAGCACTTGGATTAGAC TACCTGCGCAGCG - TTG - - - - - - - - - Se não considerarmos os custos dos gaps iniciais e finais, este alinhamento teria apenas: 7 matches, 1 mismatch e 1 space, dando um score de 11. katia@cin.ufpe.br

Achando o alinhamento semi-global Para não computar o custo dos espaços iniciais em s, o que precisamos fazer? Ex: s = - - - - - - - - CAGCA t = TACCTGCGCAGCG katia@cin.ufpe.br

Achando o alinhamento semi-global Para não computar os espaços iniciais em s, precisamos não computar o custo dos gaps iniciais. Ex: s = - - - - - - - - CAGCA t = TACCTGCGCAGCG Como obter este efeito na tabela? katia@cin.ufpe.br

Achando o alinhamento semi-global Ex: s = - - - - - - - - CAGCA t = TACCTGCGCAGCG Para não computar as inserções no início do alinhamento, incializaremos a primeira linha com zeros. katia@cin.ufpe.br

Achando o alinhamento semi-global Para não computar os espaços após o último caracter de t, ignoramos o sufixo de s que casa com aqueles espaços. Ex: s = CAGCACTTGGATTAGAC t = CAGCG - TTG - - - - - - - - - Como obter este efeito na tabela? katia@cin.ufpe.br

Achando o alinhamento semi-global Ex: s = CAGCACTTGGATTAGAC t = CAGCG - TTG - - - - - - - - - Note que depois que t termina, o score vai apenas diminuindo. katia@cin.ufpe.br

Achando o alinhamento semi-global Ou seja, não devemos nos preocupar com a continuação do alinhamento depois que a cadeia t termina (última coluna). Logo, devemos tomar o maior valor na última coluna de M, isto é: sim(s, t) = máx i =1..m M[i, n] katia@cin.ufpe.br

Achando o alinhamento semi-global De maneira similar, poderíamos ter o alinhamento semi-global começando com remoções. Ex: s = TACCTGCGCAGCG t = - - - - - - - - CAGCA Para não computar as remoções no início do alinhamento, incializaremos a primeira coluna com zeros. katia@cin.ufpe.br

Achando o alinhamento semi-global E ao final não podemos nos preocupar com as inserções no final. Ex: Ex: s = CAGCACTTG - - - - - - - - - t = CAGCG - TTGTACCTGCG Para focar no final de s olhamos o maior valor da última linha. katia@cin.ufpe.br

Achando o alinhamento semi-global Ou seja, não devemos nos preocupar com a continuação do alinhamento depois que a cadeia s termina (última linha). Logo, devemos tomar o maior valor na última linha de M, isto é: sim(s, t) = máxj=1..n M[m, j] katia@cin.ufpe.br

Achando o alinhamento semi-global Considerando este maior valor na última linha de M: sim(s, t) = máxj=1..n M[m, j] Para conseguir o alinhamento é só começar a busca numa célula (m, k) da matriz, onde k é tal que sim(s, t) = M[m, k]. katia@cin.ufpe.br

Alinhamento Local Dadas duas seqüências s e t, identificar o alinhamento de melhor score entre um substring de s e um substring de t. O algoritmo será o mesmo que usamos para alinhamento global, com algumas alterações. katia@cin.ufpe.br

Alinhamentos Locais Ainda teremos uma matriz (m+1)  (n+1) mas cada entrada (i, j) vai conter o maior score de um alinhamento entre um sufixo de s[1..i] e um sufixo de t[1..j]. Para isso, a primeira linha e a primeira coluna vão ser inicializadas com zeros. katia@cin.ufpe.br

Observação Para qualquer entrada (i, j) há sempre o alinhamento entre os sufixos vazios de s[1..i] e de t[1..j], que tem score zero. Portanto, este array terá todas as entradas maiores ou iguais a zero. katia@cin.ufpe.br

Usaremos ainda Programação Dinâmica M (i, j) = max M (i, j-1) - 2 (último passo = I) M (i-1, j-1) + p(i,j) (último passo = S/M) M (i-1, j) - 2 (último passo =R) 0 (alinhamento vazio) katia@cin.ufpe.br

No final ... Encontrar a maior entrada em todo o array. Este será o score de um alinhamento local ótimo. O alinhamento é obtido a partir dali, seguindo de volta, e parando quando não houver aresta saindo (ou seja, onde o score for zero). katia@cin.ufpe.br

Alinhamento Local - Exemplo  C A G C A C T C A T  0 0 0 0 0 0 0 0 0 0 0 T 0 0 0 0 0 0 0 1 0 0 1 C 0 1 0 0 1 0 1 0 2 0 0 C 0 1 0 0 1 0 1 0 1 1 0 A 0 0 2 0 0 2 0 0 0 2 0 G 0 0 0 3 1 0 1 0 0 0 1 C 0 1 0 1 4 2 1 0 1 0 0 T 0 0 0 0 2 3 1 2 0 0 1 C 0 1 0 0 1 1 4 2 3 1 0 G 0 0 0 1 0 0 2 3 1 2 0 katia@cin.ufpe.br

Alinhamento Local - Exemplo  C A G C A C T C A T . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . : G 0 0 0 3 1 0 1 0 0 0 1 C 0 1 0 1 4 2 1 0 1 0 0 T 0 0 0 0 2 3 1 2 0 0 1 C 0 1 0 0 1 1 4 2 3 1 0 G 0 0 0 1 0 0 2 3 1 2 0 CAGCACTCAT TCCAGCTCG - katia@cin.ufpe.br

Alinhamento Local - Exemplo  C A G C A C T C A T  . . . T 0 0 . . . CAGCACTCAT C 0 1 0 . . . TCCAGCTCG C 0 1 0 0 . . . A 0 0 2 0 0 2 0 0 0 2 0 G 0 0 0 3 1 0 1 0 0 0 1 C 0 1 0 1 4 2 1 0 1 0 0 T 0 0 0 0 2 3 1 2 0 0 1 C 0 1 0 0 1 1 4 2 3 1 0 G 0 0 0 1 0 0 2 3 1 2 0 katia@cin.ufpe.br

Achando o alinhamento semi-global INICIALIZAÇÃO. Para não penalizar por gaps no início das cadeias, ao invés de penalizar com (i . g) ou (j . g), inicializamos a primeira linha e a primeira coluna com zeros. katia@cin.ufpe.br