Identificação dos Genes de uma cadeia de DNA com a ferramenta GENSCAN

Slides:



Advertisements
Apresentações semelhantes
Geração da diversidade de anticorpos
Advertisements

Organização Gênica de Eucariotos
PROCESSAMENTO DO RNA Biologia Molecular
PROJETOS GENOMA E PROTEOMA HUMANOS
Biologia Prof. Fláudio.
MUTAÇÃO revisão.
TRANSCRIÇÃO Biologia Molecular Profª Marília Scopel Andrighetti.
Profª Marília Andrighetti
Poliadenilação - Presente em eucariotos: enzima Poli-A polimerase
Síntese Proteica Profª Viviane Gadotti.
Eukaryotic and prokaryotic promoter prediction using hybrid approach Hao Lin Qian-Zhong Li Theory in Biosciences, 2011.
Genética bacteriana.
FIGURA 5. 2Eventos precoces na transcrição procariótica
Transcrição do RNA em Organismos Procariotos
Transcrição do RNA em Organismos Procariotos
Regulação da Expressão Gênica
Regulação da Expressão Gênica em Procariotos
Regulação da Expressão Gênica em Organismos Eucariotos
SMIL 1.0 Gaspare Giuliano Bruno. Historico Dec 1995: Towards a Real-Time Multimedia Web, 4th WWW conference, Boston Nov 1997: Primeiro Draft SMIL 1.0.
TRANSCRIÇÃO processo pelo qual são sintetizados todos os RNAs da célula Cópia de uma região específica do DNA = RNA m reflete o estado fisiológico da.
Identificar e caracterizar todos os genes Genscan, FGENES and MZEF
Introdução à expressão gênica
DNA e RNA.
Regulação da Expressão Genética
GAUSS COM PIVOTEAMENTO
Biologia volume único 3.ª edição Armênio Uzunian Ernesto Birner.
QBQ 0102 – Educação Física Carlos Hotta Transcrição 04/06/13.
O Portal do Estudante de Computação
Transcription and Translation
GENÉTICA MOLECULAR Tanto em organismos procariontes como em organismos eucariontes, qualquer classe de moléculas deve preencher certos requisitos básicos.
Regulação da Expressão Gênica em Procariotos
das atividades celulares
ÁCIDO DESOXIRRIBONUCLEICO
ÁCIDOS NUCLEICOS.
Transcrição em Eucariotos
Replicação, transcrição e tradução
Transcrição e processamento de RNA em eucariotos
ESTRUTURA DO GENOMA HUMANO
QBQ 0102 – Educação Física Carlos Hotta Controle da expressão gênica
Bancos de dados para análise de sequências de DNA
Gerenciamento de Tempo do projeto
Inteligência Artificial
Síntese de proteínas - Tradução Professor Gabriel Cestari Vilardi.
Predição computacional de genes
Bancos de Dados Natália F. Martins. BD de Seqüências Há uma quantidade gigantesca de informação sobre biomoléculas em BD públicos Mais de 348 BD –BD de.
Síntese protéica.
Estrutura do DNA Transcrição e Tradução
Estrutura e função de ácidos nucleicos, Replicação de DNA, transcrição e processamento de RNA, expressão gênica.
Introdução à Biologia Molecular História Cadeias de DNA e de Proteínas.
Termos e nomenclaturas
RepeatMasker Aluno: Fred Ulisses maranhão Professora: Kátia S. Guimarães Algoritmos p/ processamento de Cadeias, Cin, UFPE - 1/2001.
Identificação dos Genes de uma cadeia de DNA com a ferramenta GENSCAN Lauro Didier Lins Junho de 2001.
GenScan Katia Guimarães.
A INFORMAÇÃO ADQUIRE FORMA BIOLÓGICA PROFA. GISELLE MOURA MESSIAS
Prof. André Luis Roland Tancredo Engenheiro da Computação e Pesquisador em Desenvolvimento Tecnológico para Semicondutores pelo CNPq Especialista em Microeletrônica.
IF803 - Introdução à Biologia Molecular Computacional Katia Guimarães 2008/2.
Metabolismo De Construção
O código genético.
Dogma Central da Biologia Molecular
Síntese de Proteínas.
Bioinformática Felipe G. Torres.
GENES E GENOMAS TRANSCRIÇÃO. Genes  1. Codificam proteínas mRNA mRNA  2. Codificam RNA ribossomal rRNA rRNA  3. Codificam RNA transportador tRNA tRNA.
1 Eletrônica II Germano Maioli Penello Aula 05 II_ html.
ÁCIDOS NUCLEICOS: DNA e RNA
Dogma Central da Biologia Molecular
DNA / RNA Ácido Desoxirribonucleico Ácido Ribonucleico
CITOGENÉTICA.
Preparatório ENEM 2009.
EXPRESSÃO GÊNICA.
DNA. histórico Pensava-se: proteínas possuíam o material genético. A partir de 1950: ácidos nucléicos possuíam o material genético Nas células procarióticas,
Transcrição da apresentação:

Identificação dos Genes de uma cadeia de DNA com a ferramenta GENSCAN Lauro Didier Lins Junho de 2001

O que é mesmo ... DNA ... DNA? ... Gene? ... Identificação de Gene? ... Genscan? Identificação Gene Genscan

Como identificar o que é e o que não é Gene numa cadeia de DNA Como identificar o que é e o que não é Gene numa cadeia de DNA? (parte 1) Analogia de um DNA com um programa... Os Genes seriam blocos responsáveis por uma única rotina do programa. DNA ... // esta rotina define a cor dos olhos da pessoa. begin // a cor dos olhos será azul cor_dos_olhos = AZUL end // esta rotina define se a pessoa escreve com // a mão esquerda ou direita. // esta pessoa aqui será canhota! escreve_com_a_mao = ESQUERDA Gene

Como identificar o que é e o que não é Gene numa cadeia de DNA Como identificar o que é e o que não é Gene numa cadeia de DNA? (parte 2) Num programa todo bloco... ... começa com um begin ... ... e termina com um end ... // esta rotina define a cor dos olhos da pessoa. begin // a cor dos olhos será azul cor_dos_olhos = AZUL; end // esta rotina define se a pessoa escreve com // a mão esquerda ou direita. // esta pessoa aqui será canhota! escreve_com_a_mao = ESQUERDA; Marcador de início de bloco Marcador de fim de bloco

Como identificar o que é e o que não é Gene numa cadeia de DNA Como identificar o que é e o que não é Gene numa cadeia de DNA? (parte 3) No programa todo bloco pode ser identificado simplesmente procurando as palavras begin e end. Será que todo gene também tem uma “palavra begin” e uma “palavra end”? Empiricamente podemos dizer que sim! Agora vem a pergunta mais importante: Será que é possível definir como é a “palavra begin” e a “palavra end” de um gene para possamos indentificá-los assim como no programa (nossa analogia)? Definir exatamente ainda não é possível. Porém sabemos mais ou menos a “cara” do begin e do end de um gene e utilizamos este conhecimento para identificar estatisticamente (não é 100%) onde estão os genes de uma cadeia de DNA.

O que sabemos... (parte 1) O Gene está situado em uma das fitas do DNA e é base para a codificação de um tipo de proteína.

O que sabemos...(parte 2) Identificar um Gene é equivalente a saber exatamente: Em que fita do DNA se encontra o Gene. Onde estão seus Exons

O que sabemos...(parte 3) Alguns detalhes de como são “mais ou menos”os sinais begin e end de um Gene: Antes do início de um Gene existe a região promotora rica em TATA (pares de Timina Adenina). Num dos exons iniciais existe um códon (tripla de nucleotídeos) normalmente ATG que será o marcador do início da tradução, ou seja, o próximo códon já definirá um aminoácido na proteína que será sintetizada. Entre um exon e um intron existe a chamada região de corte doadora (donor splice site ou 5’ splice site). Entre um intron e um exon existe a chamada região de corte aceitadora (acceptor splice site ou 3’ splice site). No último exon do Gene existe um códon de parada, a partir do qual nenhum aminoácido entrará mais na proteína que está sendo sintetizada. A região após o último exon do gene é rica em A’s (Adenina) chamada cauda polyA

GENSCAN Ferramenta para identificação de genes numa cadeia de DNA baseda num modelo probabilistico para a estrutura do Gene descrito por Chris Burge e Samuel Karlin, ambos do departamento de matemática da universidade de Stanford. Modelo adequado para eucariotos. Modelo baseado num Generalized Hidden Markov Model (GHMM).

Características do GENSCAN Identificação da estrutura completa de intron/exon de um Gene numa cadeia de DNA. Capacidade de identificar múltiplos genes, genes parciais e genes completos. Capacidade de identificar um conjunto de Genes ocorrendo em ambas as fitas do DNA. Capacidade de identificar tanto exons otimais quanto exons sub-otimais (em relação ao modelo)

Como usar o GENSCAN GENSCAN Pedaço contíguo de uma fita de DNA: ACGAAGGTTCATATC... GENSCAN Matriz de Parâmetros (três opções): Vertebrados Arabidopsis Maize Estrutura de Genes estimada pelo GENSCAN para o DNA dado como entrada. Sub-Optimal cutoff: {1.00, 0.50, 0.25, 0.10, 0.05, 0.02, 0.01} (se for 1.00 só gera á melhor saída do modelo).

Exemplo (parte 1) Identificar os genes da seqüência X66401, que contém 66109 bp. Esta seqüência está presente no cromossomo 6 do homem e se sabe que ela contém 5 genes (4 na fita que está registrada e 1 na fita oposta).

Exemplo (parte 2) A saída detalhada do GENSCAN tem a seguinte forma (apenas o primeiro gene downstream)... (reading frame) Um códon na fita pra frente que termina na posição X tem frame x módulo 3 (net phase) Len módulo 3 Score do sinal de início ou do 3’ splice site (só definido para exons) Número do gene, número do exon no gene Score do splice site 5’ ou do sinal de término (só só definido para exons) Tipo: Init – exon inicial Intr – exon interno Term – terminal exon Sngl – único exon de um gene Prom – sinal promotor PlyA – sinal poli-A (Coding Region Score) Score da região codificante (só para exons) Strand – fita do DNA + = fita entrada - = fita oposta Probabilidade do exon (só definida para exons) Posição inicial do exon/sinal (posição relativa a fita de DNA dada como entrada) Exon score, depende de {Len, I/Ac, Do/T e CodRg} Posição final do exon/sinal (posição relativa a fita de DNA dada como entrada) Comprimento do exon/sinal: Len = End – Begin + 1 Os scores têm a seguinte interpretação: > 100, é muito bom 50–100, é bom 0-50, é regular < 0, é ruim

Referências Transparência on-line (autor: Terry Speed) Papers http://www.ludwig.edu.au/CRCCGF/bioinformatics/recog/index.htm Papers Burge,C. and Karlin,S. (1997) Prediction of complete gene structures in human genomic DNA. J. Mol. Biol., 268,78--94. Burge,C. and Karlin,S. (1998) Finding the genes in genomic DNA. Current Opinion in Structural Biology, 8:346-354. Site do GENSCAN no MIT http://genes.mit.edu/GENSCAN.html

The state-of-the-art program for finding Genes GENSCAN The state-of-the-art program for finding Genes