Intr. à Biologia Computacional ALINHAMENTO DE SEQÜÊNCIAS.

Slides:



Advertisements
Apresentações semelhantes
Conferencia Perspectivas del Arbitraje Comercial Internacional en Chile y Brasil Procedencia del Arbitraje con Empresas.
Advertisements

Algoritmos em Grafos (Parte 2)
HASHING Katia Guimarães julho/2002
Métodos Iterativos.
ALINHAMENTOS LOCAIS E SEMI-GLOBAIS
Katia S. Guimarães QUICKSORT Katia S. Guimarães
Grafos Introdução
Ansiedade, Medo e Depressão
Determinantes Determinante é um número real associado a uma matriz quadrada. Notação: det A ou |A|. Determinante de uma Matriz Quadrada de 1ª Ordem. Seja.
1 Complexidade de Algoritmos Complexidade de pior caso Complexidade de melhor caso de uso bem menos freqüente em algumas situações específicas Complexidade.
Reconhecimento de Padrões EigenFaces
Qualiti Courses :: Documento de Requisitos. {icc2, jmmn, mmc2, CIn-UFPE Equipe Ivan Cordeiro Cardim Julio Maravitch Maurício.
O uso de questionários em trabalhos científicos
Complexidade de Computação Para avaliar a qualidade de um algoritmo usamos como critério o espaço e o tempo de execução. Ao.
Introdução à NP-completude
Backtracking Katia Guimarães.
Projeto de Recursos Humanos Outubro 2011
Publicidade com banner
Projeto de racionalização e padronização de processos SCI – Sistema de Controles Internos Outubro
Programa de Cargos e Salários
Neoliberalismo e Crise da Educação Pública
Diagnóstico de processos
Silogística Tudo o que os artistas fazem é arte.
Academia Snooker Clube Sorocaba - SP Paulo Dirceu Dias
Intr. à Biologia Computacional
Intr. à Biologia Computacional
Professora: Ana Cristina G. e Silva Natal-RN
Aula 02 Variáveis, Matrizes, Gráficos
Metodologia da Pesquisa em Ensino de Ciências I
FABER Cirurgia & Implantes.
LÓGICA FILOSÓFICA. Teoria Obj: Construir um conceito de lógica
COMPORTAMENTO DO CONSUMIDOR
Instituto de Aplicação Fernando Rodrigues da Silveira (CAp/UERJ)
Bioinformática (Alinhamento de Seqüências)
ALINHAMENTOS LOCAIS E SEMI-GLOBAIS
Introdução à NP-completude Katia S. Guimarães
Algoritmos Gulosos em Grafos
Katia S. Guimarães Busca em Grafos Katia S. Guimarães
Abordagens para problemas NP-completos
Árvores Binárias e Encaminhamentos
Katia S. Guimarães Heaps Katia S. Guimarães
Remoção e Inserção em Heaps
Katia S. Guimarães Heapsort Katia S. Guimarães
Ferramentas de Planejamento
Fundamentos de Programação
Vetores e Matrizes Ameliara Freire
CASE: O POSTGRESQL EM BI Milhares de operações diárias consolidadas "near-real-time" PGDay Campinas Wagner Correa Ramos Anderson.
Metodologia Análise e Solução de Problemas
1 A COMPUTAÇÃO MODERNA Valdemar W. Setzer Depto. de Ciência da Computação da USP
Metodologia da Pesquisa em Ensino de Ciências I
Outubro  Apresentar através de debates o perfil e papel dos Multiplicadores e Área de O & M / Processos.  Implantar.
MANUAIS NA EMPRESA
Distância Mínima de Edição Profa. Sandra de Amo Bacharelado em Ciência da Computação - UFU.
Tabela Hash Alunos : Gustavo Jorge Zanin nºUSP
Definições e tipos de alinhamento. O uso do BLAST
Transformada de Hough Processamento global para a detecção de linhas retas numa imagem Nenhum conhecimento é necessário a respeito da posição das linhas.
A Classe NP Teoria da Computação Profa. Sandra de Amo.
Resolução de Problemas de Busca
Programação Dinâmica.
Alinhamento de Cadeias de DNA COMPARAÇÃO DE SEQÜÊNCIAS
Intr. à Biologia Computacional ALINHAMENTOS ÓTIMOS GLOBAIS.
Complexidade de Computação Katia Guimarães. Avaliando a Qualidade de um Algoritmo É preciso ter bem definido –O que é dado de entrada e –O que é esperado.
Algoritmos e Heurísticas para Seqüenciamento de DNA
Linguagem de Programação II Parte VI Professora: Flávia Balbino da Costa.
Principais algoritmos de alinhamento de sequências genéticas
Ponteiros. Programação II Professora: Mai-Ly vanessa horário: ter 9h-11h; sex 11h-13h Aula 1.
Alinhamento Global de Seqüências Katia Guimarães.
CENTRO DE GENOMICA E FITOMELHORAMENTO Introdução à Bioinformática
Abordagens para Problemas Intratáveis Katia S. Guimarães
Álgebra Linear Prof(a):Janaína F. Lacerda A matemática não precisa ser uma tortura.
Transcrição da apresentação:

Intr. à Biologia Computacional ALINHAMENTO DE SEQÜÊNCIAS

Alinhamento de Seqüências Problema: Dadas duas seqüências sobre o mesmo alfabeto, com aproximadamente o mesmo tamanho, encontrar o melhor alinhamento entre estas duas seqüências.

Alinhamento de Seqüências O melhor alinhamento entre duas seqüências: G A - C G G A T T A G G A T C G G A AT A G é dado por um score que é a soma dos valores associados a cada posição, de acordo com o critério pré-definido.

Alinhamento de Seqüências O score que é a soma dos valores associados a cada posição, de acordo com o grau de similaridade entre os elementos correspondentes. Ex: match +1 mismatch -1 space -2

Score de um Alinhamento Ex: match +1 (good) mismatch -1 (bad) space -2 (worse) G A - C G G A T T A G G A T C G G A AT A G score = 9 ·1+ 1·(-1) + 1·(-2) = 6

Programação Dinâmica O número de possíveis alinhamentos é exponencial no tamanho das seqüências. (Logo, não podemos experimentar todos.) Abordagem alternativa: Sejam s e t duas seqüências, com |s|=m e |t|=n, construir uma matriz (m+1) x (n+1), onde M(i, j) contém a similaridade entre s[1..i] e t[1..j].

Programação Dinâmica Esta é uma abordagem indutiva, onde são definidos os scores para as seqüências menores, e a partir dessas, novos scores são computados os scores de cadeias maiores. Ex: G A - C A T T G G A T C A AT G G custa -2; GA custa -4; G G custa +1; G GA custa -2;

Programação Dinâmica 1a. linha e1a. coluna fáceis de computar: G A C A T T G G -2 A -4 T -6 C -8 A -10 A -12 T -14 G -16

Programação Dinâmica Dado que eu sei computar os scores dos melhores alinhamentos entre prefixos de s e t com tamanhos menores que i e j, respectivamente, como eu posso calcular o melhor alinhamento de s[1..i] com t[1..j]?

Programação Dinâmica O score do melhor alinhamento será calculado em função do último passo de uma transformação de s[1..i] em t[1..j]. Um passo pode ser I (inserção), R (remoção), S (substituição) ou M (match)

Programação Dinâmica 1. Se do último passo for I (inserção): Ex: G A G C A T T C G A - C A A T C G Solução: Alinhe s[1..i] com t[1..j-1] e case um espaço com t[j] i s: G A G C A T T C t: G A - C A A T C G j-1 j

Programação Dinâmica 2. Se do último passo for M (match) ou S (substituição): Solução: Alinhe s[1..i-1] com t[1..j-1] e case s[i] com t[j] i-1 i s: G A G C A T T C t: G A - C A A T C j-1 j

Programação Dinâmica 3. Se do último passo for R (remoção): Solução: Alinhe s[1..i-1] com t[1..j] e case s[i] com um espaço i-1 i s: G A G C A T T C G t: G A - C A A T C j-1 j

Programação Dinâmica M (i, j) = max M (i, j-1) - 2 (último passo = I) M (i-1, j-1) + p(i,j) (último passo = S/M) M (i-1, j) - 2 (último passo =R)