Seqüenciamento parcial de transcritos

Slides:



Advertisements
Apresentações semelhantes
Instituto de Computação
Advertisements

Organização Gênica de Eucariotos
Aplicações de Bioinformática (Epigenética)
Amplificação (clonagem) dos genes e seu armazenamento
BIBLIOTECAS DE DNA ou BANCOS DE DNA FABIANA SEIXAS
Replicação da molécula de DNA
TRANSCRIÇÃO Biologia Molecular Profª Marília Scopel Andrighetti.
Universidade Federal de Viçosa
Montagem e análise de genomas
Uso da bioinformática na análise genômica
Uso da bioinformática na análise genômica
Introduction of RefSeq and LocusLink: resources at the NCBI
Sequenciamento inicial e análises do genoma humano
Genética bacteriana.
Transcrição do RNA em Organismos Procariotos e Eucariotos
Prof. Odir A. Dellagostin
Anotação de SAGE Tags Rodrigo Martins Brandão.
Introdução à expressão gênica
Serial Analysis of Gene Expression (SAGE)
Next – Generation Sequencing Era Illumina Genome Analyzer
Seqüenciamento parcial de transcritos
Uma das atividades em bioinformática é formar aglomerados de todas as sequências geradas no projeto (as figurinhas de um álbum) Podemos saber quantas.
Seqüência e qualidade. Seqüência e qualidade Uso da bioinformática na análise genômica.
Miguel www. cromatina. icb. ufmg. br. Miguel www. cromatina. icb. ufmg. br.
Seqüenciamento e montagem do genoma humano e análise de transcriptoma
Tecnologia do DNA recombinante
Michelle A. Graham, Kevin A. T. Silverstein, Steven B
Métodos de Análise de Expressão Gênica
Análise Computacional de Seqüências Nucleotídicas e Protéicas
QBQ 0102 – Educação Física Carlos Hotta Transcrição 04/06/13.
Genômica funcional e metagenômica
QBQ 0102 – Educação Física Carlos Hotta Tecnologia do DNA recombinante
Polimorfismos de nucleotídeos únicos em espécies poliplóides
[Clayton J Pereira] [Leonilson Kiyoshi] [Prof. Dr. Vitor Leite]
Análise de genomas e transcriptomas
Uso da bioinformática na análise genômica TAGAGCATCGATCGATGCTGCAGATGATGCTAGCATCGGCTAGGCGACG ATCTCGTAGCTA ATCTCGTAGCTAGCTACGACGTCTA ATCTCGTAGCTAGCTA ATCTCGTAGCTAG.
ÁCIDO DESOXIRRIBONUCLEICO
Genômica e Proteômica 1) Genômica Estrutural O que é Genômica ?
Replicação, transcrição e tradução
Organização Gênica de Eucariotos
Construção de bibliotecas de cDNA
Dept. Entomologia, Fitopatologia e Zoologia Agrícola
IF803 - Introdução à Biologia Molecular Computacional Profa. Katia Guimarães 2007/2.
A genética e os genes.
Bancos de Dados Natália F. Martins. BD de Seqüências Há uma quantidade gigantesca de informação sobre biomoléculas em BD públicos Mais de 348 BD –BD de.
Estrutura e função de ácidos nucleicos, Replicação de DNA, transcrição e processamento de RNA, expressão gênica.
Análises de sequências
Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro
Marcílio C. P. de Souto DIMAp/UFRN
Seqüenciamento e genômica
Definições e tipos de alinhamento. O uso do BLAST
Sequenciamento de Genomas
Gene Projects Marcelo Falsarella Carazzolle Laboratório de Genômica e Proteômica Unicamp.
Marcelo Falsarella Carazzolle Laboratório de Genômica e Proteômica
BIOINFORMÁTICA UFMG A T G C. A T G C Performance de anotação automática com grupos de ortólogos KOG Se vc conhece os grupos de ortólogos de MO E vc pode.
Análise Computacional de Seqüências Nucleotídicas e Protéicas BLAST Antonio Basílio de Miranda 24/11/2004 Adaptado por Marcos Catanho 10/05/2005.
RNA-SEQ: CONCEITO E APLICAÇÕES
IF803 - Introdução à Biologia Molecular Computacional Katia Guimarães 2008/2.
BIOINFORMÁTICA UFMG A T G C. A T G C Performance de anotação automática com grupos de ortólogos KOG Se vc conhece os grupos de ortólogos de MO E vc pode.
Marcadores mais utilizados Almir R. Pepato. Definição de marcador molecular Uma sequência nucleotídica ou de aminoácidos detectável experimentalmente.
Alinhamentos Múltiplos
Síntese de Proteínas.
* Com o avanço das descobertas acerca dos Ácidos Nucléicos e das Proteínas surgiu o Dogma da biologia Molecular; * Surgimento dos métodos de sequenciamento.
Bioinformática Felipe G. Torres.
Avaliação da diversidade microbiana
BASE CROMOSSÔMICA DA HEREDITARIEDADE Profª Giselle Moura Messias.
Alinhamentos e Busca de Similaridade Ariane Machado Lima.
Combinatorial Pattern Matching BLAST. Tópicos Introdução Repetições Gênicas Combinatorial Pattern Matching – Exact Pattern Matching – Approximate Pattern.
ANÁLISE EM LARGA ESCALA DE EXPRESSÃO GÊNICA DIFERENCIAL ENTRE DIVERSAS
EXPRESSÃO GÊNICA.
Transcrição da apresentação:

Seqüenciamento parcial de transcritos

EST (Etiqueta de Seqüência Expressa) Objetivo: Documentar a existência de transcritos gênicos num transcriptoma [otorrin... e ...damonh...] EST (Etiqueta de Seqüência Expressa) sequenciamento único de cada cDNA extremidades 5’ ou 3’ ORESTES (ESTs ricas em ORFs) seqüenciamento único do amplicon derivado de cDNA por PCR inespecífico centro do cDNA prevalece (região conservada)

Um mRNA & suas ESTs 5’EST 3’EST 5’EST 3’EST mRNA AUG ATG cDNA (fita +) ATCATGACTTACGGGCGCGCGAT AAATTTATTATCC (T)18 5’EST cDNA (fita -) 3’EST mRNA AUG cDNA (fita +) (A)200 (A)18 GGCGCGCGATATCC AAATTTATTATCCATCTACG (T)18 5’EST cDNA (fita -) 3’EST

PCR inespecífico & seu ORESTES amplicon (fita -) amplicon (fita +) PCR (60ºC) +ORESTES (outros iniciadores) mRNA amplicon (fita +) AUG GGGCGCGCGATATCGAAAAATTTATAAGGCTAG (A)200 CCCCGGCGGCTCGGCCGGGGAGATCGATCATGAC AGATCGATCATGACTTACGGGCGCGCGATATCG ORESTES cDNA (fita -) Iniciador (60ºC 37ºC)

Qualidade das bibliotecas (100 primeiras ESTs) Boa biblioteca ? Número de vezes que uma EST foi amostrada

Aglomerados Uma das atividades da bioinformática é formar aglomerados (clusters) de todas as sequências que foram geradas no projeto Além de validar bibliotecas Podemos saber quantas vezes um gene foi sequenciado e detectar os mais freqüentes E quantos genes já foram detectados

Programas para aglomerar Icatools Phrap Cap3 Swat BLAST MegaBLAST Um aglomerado = Um gene

UniGene É um sistema que parte as sequências do GenBank em um conjunto não-redundante de aglomerados Cada aglomerado do UniGene contém as sequências que representam um gene único E também informações relacionadas, como em que tecidos o gene é expresso E onde foi mapeado MegaBLAST #megablast -W 40 -F m -D 3 ...

MegaBLAST gera o UniGene Todas ESTs contra todas Detecção de homologia > 96% de identidade > 70% do potencial Aglomerar

Anotação funcional convencional Hardware 4 GB RAM Multiprocessado 2 MB cache HD com alta capacidade (bancos de dados) Solaris Intel

Alinhamento local Identifica, numa coleção de seqüências, as que apresentam alinhamento com cada EST. O algorítimo vai utilizar fragmentos da EST e alinhar com as sequências do banco de dados. Ele vai descartando todas as pesquisas com pontuação pequena (score baixo) e vai alinhar a vizinhança daquelas com pontuação boa até chegar ao máximo valor. É fácil verificar que algumas regiões de certos genes alinham bem mas outras, pouco conservadas, não. O Alinhador Local não quer chegar ao alinhamento final, ele só quer identificar sequências com alguma coisa (de tamanho significativo) em comum

Alinhamento local O fundamento teórico é que a função gênica está quase sempre confinada em domínios contínuos de uma proteína Já ouviram falar que exons representam domínios funcionais distintos, que teriam evoluído de genes ancestrais individuais? Se não fosse assim, não teria sentido usar

Programas Blast & Bancos Há vários Programas Blast úteis Alguns são usados quando a sua sequência é de nucleotídeos (blastn, blastx e tblastx) Outros são usados quando a sua sequência é de aminoácidos (blastp e tblastn) E vários bancos de dados para escolher (nr, pdb, dbEST, yeast, month, etc...) Ou usa-se limites

Blastn e Blastx A EST identifica o gene homólogo ou uma EST de outro organismo: Blastn A EST identifica proteína ortóloga de outro organismo - a evolução conservou a proteína enquanto o DNA divergiu: Blastx Blastx: a EST traduzida em seis proteínas 1 existe, 5 não... O mundo Blast é assim

Tblastx Tblastx traduz sua sequência de nucleotídeos para proteína nas 6 possibilidades, exatamente como Blastx Depois pesquisa com essas 6 proteínas deduzidas, um banco de dados de nucleotídeos também traduzido dessa maneira Pra que serve? Pois imagine que a telomerase de Euplotes seja parecida com a telomerase humana, mas os dois DNA não! Traduzindo a sequência pesquisada e o banco de dados dbEST foi possível encontrar sequências da telomerase humana

Bioinformática e anotação reversa Genes pré-escolhidos Categorias funcionais Proteínas TBLASTn sua proteína contra as ESTs traduzidas em seis fases de leitura

O formato FASTA é anotado >Gene5 EST com homologia... ACTATTACGGCGTAGCTGTAGCTACGTAGCTAGCTGATGCTGACTGATCGTAGCTAGCTGACTGATCGTACGTAGTGTTTTTTTACGTGCGTATTTCTagctagtc

Processamento de seqüências PHRED - basecall and quality values cgtaAGCTGATCTaCGTGTgCGCGTATCGGTCAGCacgATGTTGTTa CROSSMATCH - retira vetor TGTgCGCGTATCGGTCAGCacgATGTT PHRAP - consenso com qualidade

Programas UNIX (Solaris Intel, Tru64, Linux) MegaBLAST Validação de Bibliotecas UniGene: um aglomerado - um gene - um spot Anotação funcional BLASTn, BLASTx, tBLASTx (dbEST) Base de dados nr e dbEST Anotação reversa (seq. completo?) tBLASTn e base de dados de mineradora genômica Processamento de seqüências PHRED, CROSS-MATCH, PHRAP Servidor BLAST na Web

Ambiente Baseado em estrutura do CENAPAD Replicação de bases de dados em servidores Ambiente colaborativo Automatização de serviços Diablos, agentes computacionais Bancos de dados Oracle/Domino