Estratégias de sequenciamento : genoma e transcriptoma

Slides:



Advertisements
Apresentações semelhantes
Organização Gênica de Eucariotos
Advertisements

Estudos de expressão gênica: análise e quantificação de RNA
PROJETOS GENOMA E PROTEOMA HUMANOS
GeneQuant Determinação da concentração e da pureza do DNA
Amplificação (clonagem) dos genes e seu armazenamento
BIBLIOTECAS DE DNA ou BANCOS DE DNA FABIANA SEIXAS
Novas tecnologias no seqüenciamento de dna
Sequenciamento de DNA em MegaBACE DNA Analysis Systems
Profª Marília Andrighetti
Genoma funcional: identificar genes diferencialmente expressos
Construção de uma Biblioteca
Universidade Federal de Viçosa
Montagem e análise de genomas
Características do DNA
Seqüenciamento parcial de transcritos
Uso da bioinformática na análise genômica
Sequenciamento inicial e análises do genoma humano
Genética bacteriana.
Polymerase Chain Reaction (PCR)
Transcrição do RNA em Organismos Procariotos
ORGANIZAÇÃO do GENOMA - 2
Clonagem Gênica 1-Introduçao 2-Estratégia geral de clonagem gênica
Construção de Biblioteca Gênica
Prof. Odir A. Dellagostin
Introdução à expressão gênica
Serial Analysis of Gene Expression (SAGE)
Tecnologia do DNA recombinante
Molecular markers closely linked to fusarium resistance genes in chickpea show siginificant alignments to pathogenes-related genes located on arabidopsis.
Desenho de primer e otimizações de PCR Éderson Kido
Genômica É a caracterização de genomas inteiros. Tenta compreender a organização molecular e as informações que ela traz.
Métodos de Análise de Expressão Gênica
Genômica funcional e metagenômica
QBQ 0102 – Educação Física Carlos Hotta Tecnologia do DNA recombinante
Polimorfismos de nucleotídeos únicos em espécies poliplóides
Análise de genomas e transcriptomas
Genômica e Proteômica 1) Genômica Estrutural O que é Genômica ?
ENZIMAS DE RESTRIÇÃO O interesse por estas enzimas de restrição aumentou em 1973 quando se percebeu que elas poderiam ser usadas para fragmentar o DNA.
A ORGANIZAÇÃO DO MATERIAL GENÉTICO
Genómica Licenciatura em Ciências Biomédicas Departamento de Ciências da Saúde, UCP Fevereiro 2013.
Construção de bibliotecas de cDNA
Engenharia Genética.
Real Time PCR.
Biologia Molecular Básica e Aplicada
PLANTAS TRANSGÊNICAS: DE ONDE VEM, PARA AONDE VÃO?
IF803 - Introdução à Biologia Molecular Computacional Profa. Katia Guimarães 2007/2.
Predição computacional de genes
Extração de DNA e RNA Enzimas de Restrição
GENÉTICA Aula 7: Fundamentos das Tecnologias do DNA Recombinante
Análises de sequências
TECNOLOGIA DO DNA RECOMBINANTE
Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro
Marcílio C. P. de Souto DIMAp/UFRN
Seqüenciamento e genômica
Clusterização de sequências biológicas : PHRAP e CAP3
Tecnologia do DNA recombinante I:
Sequenciamento de Genomas
Gene Projects Marcelo Falsarella Carazzolle Laboratório de Genômica e Proteômica Unicamp.
Um cromossomo eucariotico tem tipicamente ~ 50 a 200 Mbp Como sequenciar um genoma ?
Número de clones teoricamente necessários para representar o genoma
Bioinformática e O Projeto GENOMA EST da CANA
Avaliação da diversidade microbiana
Transferência da Informação Biológica
RT-PCR em Tempo Real Especificidade Sensibilidade Reproductibilidade
Projeto de Doutorado Direto e Resultados Parciais
ANÁLISE EM LARGA ESCALA DE EXPRESSÃO GÊNICA DIFERENCIAL ENTRE DIVERSAS
ANÁLISE EM LARGA ESCALA
Fundamentos de ENGENHARIA GENÉTICA.
Vetores de entrada para clonagem gênica Os plasmídios devem possuir uma região designada origem de replicação (ORI), que é essencial para a sua replicação.
PCR Polymerase Chain Reaction
DNA. histórico Pensava-se: proteínas possuíam o material genético. A partir de 1950: ácidos nucléicos possuíam o material genético Nas células procarióticas,
Transcrição da apresentação:

Estratégias de sequenciamento : genoma e transcriptoma mcarazzo@lge.ibi.unicamp.br Marcelo Falsarella Carazzolle Laboratório de Genômica e Proteômica Unicamp

Resumo Estratégias de sequenciamento DNA ESTs Introdução à genômica Estratégias de sequenciamento DNA ESTs Tecnologias de sequenciamento Sanger sequencing Pirosequenciamento

Introdução à genômica Genômica Ciência que estuda o genoma, ou o conjunto do material genético de um organismo. Ex.: Genoma da Xylella fastidiosa é composto pelo DNA cromossomal mais o DNA plasmidial.

Através de seqüenciamento de DNA : Como ??? Através de seqüenciamento de DNA : Determinação da sua seqüência nucleotídica (ACGTs). Duas tecnologias de sequenciamento : Sanger sequencing (Megabace, 377, ...) Pirosequenciamento (454)

Projetos genoma e transcriptoma Seqüenciamento de material genético, DNA e RNA, de organismo e anotação de estruturas dos genes encontrados Ex.: Seqüenciamento do genoma humano; do cromossomo IV de S. cerevisiae; de ESTs de diferentes espécies de Eucalyptus.

Tipos de projeto DNA – seqüenciamento de estruturas do genoma ou de trechos destas. Ex.: Genoma humano ESTs – sequenciamento de cDNA, feitos à partir de bibliotecas de mRNA. Ex.: ESTs de cana-de-açúcar SAGE – sequenciamento de fragmentos em torno de 20 pb do cDNA

Diferenças entre as metodologias Sequenciamento de DNA, feito de forma aleatória, fornece : Informações sobre regiões codantes (genes) e promotores. Mas gera sequências em regiões inter-gênicas (a princípio sem nenhuma função) Sequenciamento de mRNA fornece : Informação direta sobre os genes e também sobre a expressão gênica. Mas genes pouco expressos são mais raros de serem sequenciados por essa técnica SAGE fornece informação sobre a expressão gênica de forma mais eficiente que ESTs, mas é útil apenas quando o genoma completo do organismo for conhecido A situação ideal para um projeto genoma é sequenciar ambos DNA e cDNA

Estratégias de sequenciamento - DNA Shotgun de genoma inteiro Shotgun em pedaços do genoma clonados em BACs Primer walking - ESTs RNA oriundos de diferentes tecidos ou condições Biblioteca subtrativa

Shotgun do genoma inteiro DNA genômico Quebrar em pedaços aleatórios ~2000pb (shotgun) reads clonar em vetor sequenciamento

Reconstrução do DNA original a partir do fragmentos (clusterização) reads Sequência consensu (DNA original) A reconstrução é feita a partir de sobreposição dos fragmentos

Shotgun de pedaços do genoma Quebrar em pedaços aleatoriamente desde 50Kpb até 300Kpb DNA genômico Clonar em BAC’s e sequenciar apenas as pontas de cada fragmento ~800 bp ~800 bp Quebrar em pedaços de 2000pb clonar em vetor e sequenciar os fragmentos

Primer Walking Vector Clone to sequence Primer Sequence New Primer Sequence Repeat Sempre desenhar o primer de forma que a sequência amplificada tenha sobreposição com a anterior (tipicamente 100 pb de sobreposição)

Expressed sequence tags (ESTs) Extrair RNA de diferentes tecidos/condições sequenciamento 3’ EST 5’ EST Síntese de cDNA clonar em vetor

Extração de RNA e síntese de cDNA Controle Tratado Extração de RNA e síntese de cDNA Construção da biblioteca e sequenciamento sequenciamento sequenciamento Sequência consensu clusterização Expressão gênica : tratado = 2x controle Artigo : audic e claverie

Biblioteca subtrativa Adaptors Driver Driver and Tester Tester No amplificated Exponential Amplification Linear Amplification Eliminated Enriched Tester 1-cDNA synthesis 2-cDNA digestion with 4 cutter enzyme 3-Adaptor ligation to tester sample 4-Tester/ driver hybridization 5-PCR with primers that anneal specifically to adaptor previously ligated to tester sample 6-Enrichment of cDNA library in genes preferentially expressed in tester sample Control Treated RNA Pools

Tecnologias de sequenciamento Sanger sequencing PNAS 74 (1977), n. 12, 5463-5467 Sequenciador MegaBACE (1Mpb/24 horas) Pirosequenciamento Science 281 (1998), n. 5375, 363-365 Nature 437 (2005), 362-7 Sequenciador 454 (150Mpb/24 horas)

Sanger sequencing anelamento dos primers denaturação

Exemplo de gel utilizado nos seqüenciadores de gel (ex. : 377) Exemplo de gel utilizado nos seqüenciadores de gel (ex.: 377). A diferença de tamanho permite a separação dos grupos de fragmentos, e esta “distribuição normal” da passagem dos fragmentos é representada pelo eletroferograma (ou cromatograma) de cada seqüência (read). Filme sequenciamento

O programa PHRED lê o chromatograma identificando e dando uma nota para cada base que forma a sequência : 0 0 5 6 7 10 10 9 12 15 20 20 30 30 35 40 41 45 50 56 56 50 40 ... Genome Research 8 (3) (1998), 175-185

background A identificação dos picos é feita através de uma transformada de fourier do sinal A nota é ligada com a resolução entre os picos vizinhos e a altura do background

Analisando o cromatograma Região de qualidade alta Picos bem definidos e grandes. Linha de base boa. Distância entre picos anterior e posterior constante.

Região de qualidade média – poucas ambigüidades Picos razoavelmente bem definidos e de tamanho médio. Linha de base boa a razoável. Distância entre picos anterior e posterior razoável.

Região de qualidade baixa – baixa confiabilidade Picos mal definidos e de tamanho pequeno. Linha de base confusa. Distância entre picos anterior e posterior inconstante.

- Sequenciamento produz seqüências da ordem de 500 pb Onde q é a nota phred e P é a probabilidade encontrar uma base errada : - Nota phred = 20 => 1 base errada a cada 100 (99%) - Nota phred = 30 => 1 base errada a cada 1000 (99.9%)

Pirosequenciamento Reação de degradação Filme sequenciamento Fita simples Câmera de CCD Reação de degradação Filme sequenciamento Science 281 (1998), n. 5375, 363-365

Shotgun do genoma inteiro DNA genômico Quebrar em pedaços aleatórios ~2000pb (shotgun) Ligação do adaptador e separação em fita simples

O adaptador permite que o DNA se ligue em grânulos minúsculos (diâmetro de 28 mm). Apenas um DNA é ligado em cada grânulo Os grânulos são envolvidos em gotas de óleo que contêm todos os reagentes necessários para amplificar o DNA Cada gota contendo o grânulo é mantida isolada para evitar contaminação e consegue produzir 10 milhões de cópias numa reação de pirosequenciamento Um pmol de DNA numa reação de pirosequenciamento produz 1011 moléculas de ATP gerando mais de 109 fótons, num comprimento de onda de 560 nm, e num período de 3-4 segundos. Facilmente detectado por uma câmera de CCD Nature 437 (2005), 326-327

O sequenciador 454 Nature 437 (2005), 376-380 Computador Câmara de fluxo contendo as amostras e as fibras ópticas (1,6 milhões/slide) Bombeamento de fluídos Câmera de CCD Computador Nature 437 (2005), 376-380

Pirograma Linearidade é mantida até homopolímeros de 8 nt

São obtidas seqüências de até 100-120 b

Sanger vs Pirosequenciamento Depende de clonagem em bactéria (2 semanas de trabalho) Não há clonagem 25 milhões de bp em 4 horas (100x mais rápido) 1 milhão de pb em 24 horas Reads de ~700 bp Reads de ~100 bp Clones de fita dupla permitem seqüenciamento em ambas direções (facilita orientação e montagem) Fragmentos fita simples não permitem seqüenciamento em ambas direções 6 meses de sequenciamento, 24 horas por dia, para sequenciar o genoma de um fungo 24 horas para sequenciar o genoma de um fungo Conclusão : a união faz a força PNAS 103 (2006), 11240

END

Path that was used for genome sequencing map (MBP) YACs BACs or Cosmids map (200kBP) m13, plasmid sequence (kbp)