Sequenciamento de DNA em MegaBACE DNA Analysis Systems Prof. Dr. Luciano da Silva Pinto TGTGAACACACGTGTGGATTGG... ls_pinto@hotmail.com
Sequenciamento do DNA Definição Importância Identificação da ordem exata dos pares de bases (A, T, G e C) em um segmento de DNA. Importância O conhecimento da seqüência de bases de um gene fornece importantes informações sobre sua estrutura, função e relação evolutiva com outros genes (de um mesmo organismo ou de organismos diferentes).
Análise do fluxo da informação celular pela pesquisa genômica
Histórico – O sequenciamento de DNA no tempo Watson & Crick Nobel 1962
Histórico – O sequenciamento de DNA no tempo Frederick Sanger Prêmio Nobel de medicina e fisiologia em 1980 J. Mol. Biol. v.94, p. 441-448, 1975 Walter Gilbert Prêmio Nobel de medicina e fisiologia em 1980 PNAS, vol. 74 No. 2 p. 560-564, 1977
Seqüenciamento de DNA Projeto Genoma Humano
Tecnologias de sequenciamento Maxam & Gilbert, método químico- 1972 Sanger sequencing PNAS 74 (1977), n. 12, 5463-5467 Sequenciador MegaBACE (1Mpb/24 horas) Pirosequenciamento Science 281 (1998), n. 5375, 363-365 Nature 437 (2005), 362-7 Sequenciador 454 (150Mpb/24 horas)
Método de Sanger Reação de seqüenciamento amplificação linear Eletroforese em gel de acrilamida em placa capilar Leitura da seqüencia manual automática
Reação de seqüenciamento fragmento de DNA (fita simples) 1 primer DNA polimerase dNTPs ddNTPs OH H
Eletroforese em placa capilar
Reação de sequenciamento e marcação do DNA Leitura das sequências -Automática Leitura das sequências -Manual Radioisótopos Fluoresceínas
Leitura da seqüência de DNA G A T C Manual
Leitura da seqüência de DNA Automática
Reação de sequenciamento e leitura automatizada anelamento dos primers denaturação
Organizando as Seqüências de DNA ATGCTTCTGGCAGATCTGAACAGTGTTACTGAT 5’ 3’ ATGCTTCTGGCAGATCTGAACAGTGT ATGCTTCTGGCAGATCTGAACAGTGTTACTGATATTGCTT ATGCTTCTGGCAGATCTGAACAGTGTTACTGATAT ATGCTTCTGGCAGATCTGAACAGTGTTACT ATGCTTCTGGCAGATCTGAACAGT ATGCTTCTGGCAGATCTGAACAGTGTTACTGATATTGCT ATGCTTCTGGCAGATCTGAACAGTGTTACTGATATT ATGCTTCT ATGCTTCTGGCAGATCT ATGCTTCTGGCAGATCTGAACAGTGTTACTGATATTGCTT ATGCTTCTGGCAGATCTGAACAGTGTT ATGCTTCTGGCAGAT |||||||||||||||||||||||||||||||||||||||| TACGAAGACCGTCTAGACTTGTCACAATGACTATAACGAA
Exemplo de gel utilizado nos seqüenciadores de gel (ex. : 377) Exemplo de gel utilizado nos seqüenciadores de gel (ex.: 377). A diferença de tamanho permite a separação dos grupos de fragmentos, e esta “distribuição normal” da passagem dos fragmentos é representada pelo eletroferograma (ou cromatograma) de cada seqüência (read).
- + Generic Sequencing Instrument Electrical Field Laser GCTATAGTTGATTCCT
DYEnamic ET Terminators – Pré Mix Energy Transfer Dyes Fluorescein Donor Dye Standard Rhodamine Acceptor Dyes Fluorescein-R110-ddGTP Fluorescein-R6G-ddTTP Fluorescein-TAMRA-ddATP Fluorescein-ROX-ddCTP
Transferência de energia aumenta a fluorescência Ar + Laser O CO 2 - N ddNTP OH Radiationless Energy Transfer Transferência de energia aumenta a fluorescência
Normalized Fluorescence Emission (Excitation at 488 nm) DYEnamic ET terminator - espectro de emissão Normalized Fluorescence Emission (Excitation at 488 nm) Fluorescein-R110-ddGTP Fluorescein-R6G-ddTTP Fluorescein-TAMRA-ddATP Fluorescein-ROX-ddCTP 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 500 550 600 650 700 Wavelength (nm)
Leitura da seqüência de DNA
Análise dos resultados por Bioinformática
Montagem Limpeza das seqüências: remoção de seqüências ribossômicas remoção de seqüências de vetor remoção da região de poliA corte por qualidade eliminação das derrapagens
Shotgun do genoma inteiro DNA genômico Quebrar em pedaços aleatórios ~2000pb (shotgun) reads clonar em vetor sequenciamento
Reconstrução do DNA original a partir do fragmentos (clusterização) reads Sequência consenso (DNA original) A reconstrução é feita a partir de sobreposição dos fragmentos
Shotgun de pedaços do genoma Quebrar em pedaços aleatoriamente desde 50Kpb até 300Kpb DNA genômico Clonar em BAC’s e sequenciar apenas as pontas de cada fragmento ~800 bp ~800 bp Quebrar em pedaços de 2000pb clonar em vetor e sequenciar os fragmentos
O programa PHRED lê o chromatograma identificando e dando uma nota para cada base que forma a sequência : 0 0 5 6 7 10 10 9 12 15 20 20 30 30 35 40 41 45 50 56 56 50 40 ... Genome Research 8 (3) (1998), 175-185
background A identificação dos picos é feita através de uma transformada de fourier do sinal A nota é ligada com a resolução entre os picos vizinhos e a altura do background
Analisando o cromatograma Região de qualidade alta Picos bem definidos e grandes. Linha de base boa. Distância entre picos anterior e posterior constante.
Região de qualidade média – poucas ambigüidades Picos razoavelmente bem definidos e de tamanho médio. Linha de base boa a razoável. Distância entre picos anterior e posterior razoável.
Região de qualidade baixa – baixa confiabilidade Picos mal definidos e de tamanho pequeno. Linha de base confusa. Distância entre picos anterior e posterior inconstante.
- Sequenciamento produz seqüências da ordem de 500 pb Onde q é a nota phred e P é a probabilidade encontrar uma base errada : - Nota phred = 20 => 1 base errada a cada 100 (99%) - Nota phred = 30 => 1 base errada a cada 1000 (99.9%)
Pirosequenciamento Science 281 (1998), n. 5375, 363-365
Shotgun do genoma inteiro DNA genômico Quebrar em pedaços aleatórios ~2000pb (shotgun) Ligação do adaptador e separação em fita simples
Pirosequenciamento O adaptador permite que o DNA se ligue em grânulos minúsculos (diâmetro de 28 mm). Apenas um DNA é ligado em cada grânulo Os grânulos são envolvidos em gotas de óleo que contêm todos os reagentes necessários para amplificar o DNA Cada gota contendo o grânulo é mantida isolada para evitar contaminação e consegue produzir 10 milhões de cópias numa reação de pirosequenciamento Um pmol de DNA numa reação de pirosequenciamento produz 1011 moléculas de ATP gerando mais de 109 fótons, num comprimento de onda de 560 nm, e num período de 3-4 segundos. Facilmente detectado por uma câmera de CCD Nature 437 (2005), 326-327
O sequenciador 454 Nature 437 (2005), 376-380 Computador Câmara de fluxo contendo as amostras e as fibras ópticas (1,6 milhões/slide) Bombeamento de fluídos Câmera de CCD Computador Nature 437 (2005), 376-380
Pirograma Linearidade é mantida até homopolímeros de 8 nt
São obtidas seqüências de até 100-120 b
Sanger vs Pirosequenciamento Depende de clonagem em bactéria (2 semanas de trabalho) Não há clonagem 25 milhões de bp em 4 horas (100x mais rápido) 1 milhão de pb em 24 horas Reads de ~700 bp Reads de ~100 bp Clones de fita dupla permitem seqüenciamento em ambas direções (facilita orientação e montagem) Fragmentos fita simples não permitem seqüenciamento em ambas direções 6 meses de sequenciamento, 24 horas por dia, para sequenciar o genoma de um fungo 24 horas para sequenciar o genoma de um fungo Conclusão : a união faz a força PNAS 103 (2006), 11240
Os organismos possuem padrões
As moléculas também.
Similaridade X Homologia Evolução Caracteres morfológicos Macadores moleculares Sequências Daehhhh! Similaridade X Homologia A homologia deve ser uma conclusão feita pela observação da similaridade. Transferência horizontal Um alto índice de similaridade entre as sequências justifica a conclusão de que elas são homólogas?
1859: Charles Darwin A Origem das Espécies 1831-1836: Viagem do Beagle
2004-2006: Viagem do Sorcerer II
Animações http://www.dnalc.org/ddnalc/resources/sangerseq.html http://www.dnalc.org/ddnalc/resources/cycseq.html