Minicurso “Da Genômica à Biotecnologia” - IV Semana de Química/ 2004 Identificando a programação genética da célula através do uso dos microchips de DNA Ana Carolina Deckmann Laboratório de Genômica e Expressão Depto. Genética e Evolução - Instituto de Biologia - Unicamp
Projetos Genoma: o que nos dizem? Projetos Genoma: deciframento das sequências de DNA, sua organização e estrutura. Ao decifrar um genoma, resta a dúvida: se todas as células de um organismo carregam o mesmo genoma, O QUE as torna diferentes umas das outras???
Estudos funcionais
Introdução aos chips de DNA
Os Biochips e sua importância Os chips de DNA fornecem um método conveniente para explorar o genoma em um nível molecular. Análise de milhares de informações genéticas em um único experimento. A utilização desta técnica suporta muitas possibilidades e novas aplicações surgem diariamente.
Os Biochips e sua importância Atualmente, as principais aplicações são: Genômica funcional (um genoma) Genômica comparativa (vários genomas) Genotipagem (SNPs) Estudo da cromatina (ChIP-ON-CHIP)
Fundamentos teóricos
Fundamentos Teóricos PROPRIEDADE 1) a estrutura em dupla hélice é mantida unida pela complementariedade entre as bases nucleotídicas.
Consequência: hibridização Fundamentos Teóricos Consequência: hibridização DNA fita dupla DNA desnaturado hibridização
DOGMA CENTRAL DA BIOLOGIA MOLECULAR Fundamentos Teóricos PROPRIEDADE 2) a produção de proteínas depende de etapas intermediárias em que o DNA é transcrito em moléculas de RNAm COMPLEMENTARES à sequência do gene! DOGMA CENTRAL DA BIOLOGIA MOLECULAR
Fundamentos Teóricos Consequência: a função gênica pode ser estudada através das etapas de transcrição! COMO? Medindo quantos híbridos se formam entre DNA e mRNA, e assim quantificando a expressão gênica numa situação de interesse, p.ex., câncer! COMO QUANTIFICAR A FORMAÇÃO DE HÍBRIDOS?
Fundamentos Teóricos expressão do gene A DNA RNAm célula Proteína A genoma gene A expressão do gene A DNA CGATTAGC transcrição RNAm GCUAAUCG célula tradução Proteína A transcrição reversa transcrição reversa na presença de bases marcadas CGATTAGC cDNA marcado cDNA CGATTAGC
Fundamentos Teóricos DNA marcado por radioatividade Estudos clássicos de expressão gênica (caso a caso). Ex: Northern blotting. 1) isolar as mensagens produzidas em uma célula (mRNA) e imobilizá-las em um suporte sólido. 2) marcar a sequência do gene de interesse durante a reação de polimerização. 3) Hibridizar!
Fundamentos Teóricos Northern blotting C 1h 3h 6h 12h 48h Gene -MHC rRNA 28S rRNA 18S Northern blotting
Fundamentos Teóricos DNA marcado por fluorescência: macro- e microarrays isolar um grande número de genes (BIBLIOTECA DE cDNA) e organizá-los lado a lado em um suporte sólido. 2) marcar as mensagens produzidas em uma célula com radioatividade ou fluorescência durante a reação de transcrição reversa. 3) Hibridizar!
Fundamentos Teóricos Chip Cp Chip Rn
Fabricação dos biochips de DNA
PRODUÇÃO DOS MICROARRANJOS BIBLIOTECA DE cDNA fita molde produtos X ciclos AMPLIFICAÇÃO Placas 384 Eletroforese dos insertos da biblioteca de cDNA de coração de rato.
PRODUÇÃO DOS MICROARRANJOS ESPOTAGEM Organização da biblioteca em microplacas 384. Fonte: Genomics Solutions. http://www.genomicsolutions.com Flexys Robot (Perkin Elmer) Deposição automatizada dos clones em posições pré-determinadas.
PRODUÇÃO DOS MICROARRANJOS SÍNTESE DAS SONDAS FLUORESCENTES MARCAÇÃO DAS SONDAS C 1 3 6 12 48 RNA total RNA[controle] Cy3 Cy5 x RNA[exp]
PRODUÇÃO DOS MICROARRANJOS HIBRIDAÇÃO GRADE MICROARRANJO SPOT DNA fita simples SCANNER GeneTAC 2000 (Perkin Elmer) Fonte: Genomics Solutions. http://www.genomicsolutions.com Hibridação com as sondas desnaturadas
PRODUÇÃO DOS MICROARRANJOS EXCITAÇÃO DAS SONDAS E CAPTURA DOS SINAIS fonte de luz absorção emissão 550nm Cy3 570nm 649nm Cy5 670nm
PRODUÇÃO DOS MICROARRANJOS PROCESSAMENTO DA IMAGEM 1 2 3 4 1 2 3 4 5 6 7 8 9 10 11 A B C D E F G H a b c d e f g h i j k Estimativa computacional das intensidades de fluorescência emitidas por Cy3 e por Cy5 e cálculo da razão. A1.a2 A1.a7 Esquema do endereçamento dos pontos na imagem.
Geração de dados de Expressão Gênica
Geração de dados de Expressão Gênica intensidade Cy5 intensidade Cy3 = razão de expressão Razão > 1 (gene induzido Cy5) Razão = 1 Razão < 1 (gene induzido Cy3)
Data mining
Data mining Ao considerar cada um dos n chips produzidos como uma das n observações para um dado gene, é possível aplicar técnicas de análise multivariada para extrair significados biológicos dos experimentos de microarranjos de DNA. Clustering algorithms: reconhecer padrões nas distribuições de dados, normalmente através de métricas de distância. Tipos: Aglomerativos: Hierarchical Divisivos: k-means, SOMs Outros: Principal Component Analysis (PCA)
Data mining Razão 0,5 ------ Log0,5 = -1 Razão 1,0 ------ Log1 = 0 Razão 2,0 ------ Log2 = 1 Distância=1,0 Distância=0,5 Distância=1,0 A representação gráfica assume a forma de uma curva normal. A transformação logarítmica permite representar repressões e induções de igual magnitude como valores numericamente iguais mas de sinais diferentes. Eisen e col. (1998): LOG positivo = vermelho (gene induzido) LOG negativo = verde (gene reprimido)
Os elementos da matriz são distâncias entre pares (pairwise distance). Gene1 Gene2 Gene3 Gene4 Gene5 Gene6 Data mining Após o cálculo da distância, o ponto de partida dos algoritmos de clustering é gerar uma matriz de distância. Gene1 0 1.5 1.2 0.25 0.75 1.4 Gene2 1.5 0 1.3 0.55 2.0 1.5 Gene3 1.2 1.3 0 1.3 0.75 0.3 Gene4 0.25 0.55 1.3 0 0.25 0.4 Gene5 0.75 2.0 0.75 0.25 0 1.2 Gene6 1.4 1.5 0.3 0.4 1.2 0 Os elementos da matriz são distâncias entre pares (pairwise distance).
Aplicações Cluster analysis and display of genome-wide expression patterns. PNAS, 95 (1998) Michael B. Eisen, Paul T. Spellman, Patrick O. Brown, and David Botstein
Aplicações The Transcriptional Program of Sporulation in Budding Yeast Science, 282 (1998) S. Chu, J. DeRisi, M. Eisen, J. Mulholland, D. Botstein, P. O. Brown, I. Herskowitz
Aplicações Molecular Classification of Cancer: Class Discovery and Class Prediction by Gene Expression Monitoring. Science, 286 (1999) T. R. Golub, D. K. Slonim, P. Tamayo, et al.
Biochips de oligonucleotídeos
Biochips de Oligonucleotídeos Principais áreas em que a aplicação dos chips de oligonucleotídeos podem acelerar os estudos em genômica: Expressão gênica Genotipagem Mapeamento de bibliotecas genômicas
Biochips de Oligonucleotídeos Técnica de microimpressão: FOTOLITOGRAFIA Esta técnica de fabricação in situ foi desenvolvida pela empresa americana Affymetrix, que utiliza para fabricar os GeneChips.
Biochips de Oligonucleotídeos
Biochips de Oligonucleotídeos
Biochips de Oligonucleotídeos Diferenciais: 1) alta densidade permite representação de genomas completos. 2) refinamento da técnica de microimpressão permite criar mutações (mismatchs) de sequências conhecidas. 3) quantificações mais precisas/ alta sensibilidade.
Biochips de Oligonucleotídeos
Biochips de Oligonucleotídeos Gene A Extração DNA cromossômico Amplificação por PCR na presença de fluoróforo Cópias marcadas do gene A Hibridização com chip de oligos
Biochips de Oligonucleotídeos Gene A Padrão normal Padrão afetado MISMATCH SINAL 1A C G G T A C T a G A G G C T A 1 + 1G C G G T A C T g G A G G C T A 1 + 1C C G G T A C T c G A G G C T A 1 + 1T C G G T A C T t G A G G C T A 0 ++ 1A C G G T A C T T a A G G C T A 1 + 1G C G G T A C T T g A G G C T A 0 ++ 1C C G G T A C T T c A G G C T A 1 + 1T C G G T A C T T t A G G C T A 1 + 1A C G G T A C T T G a G G C T A 0 ++ 1G C G G T A C T T G g G G C T A 1 + 1C C G G T A C T T G c G G C T A 1 + 1T C G G T A C T T G t G G C T A 1 + 1A C G G T A C T T G A a G C T A 1 + 1G C G G T A C T T G A g G C T A 0 ++ 1C C G G T A C T T G A c G C T A 1 + 1T C G G T A C T T G A t G C T A 1 + 1 2 3 4 A G C T Pessoa 1: normal
Biochips de Oligonucleotídeos Gene A Padrão normal Padrão afetado MISMATCH SINAL 1A C G G T A C T a G A G G C T A 1 + 1G C G G T A C T g G A G G C T A 1 + 1C C G G T A C T c G A G G C T A 0 ++ 1T C G G T A C T t G A G G C T A 1 + 1A C G G T A C T T a A G G C T A 2 - 1G C G G T A C T T g A G G C T A 1 + 1C C G G T A C T T c A G G C T A 2 - 1T C G G T A C T T t A G G C T A 2 - 1A C G G T A C T T G a G G C T A 1 + 1G C G G T A C T T G g G G C T A 2 - 1C C G G T A C T T G c G G C T A 2 - 1T C G G T A C T T G t G G C T A 2 - 1A C G G T A C T T G A a G C T A 2 - 1G C G G T A C T T G A g G C T A 1 + 1C C G G T A C T T G A c G C T A 2 - 1T C G G T A C T T G A t G C T A 2 - A G C T 1 2 3 4 Pessoa 2: afetada
ChIP-on-CHIP Chromatin Imunnoprecipitation microarrays
Chromatin Imunnoprecipitation microarrays Normalmente, nos biochips estão representadas as partes codificantes do genoma (ESTs, cDNAs).
Chromatin Imunnoprecipitation microarrays Objetivo: identificar no DNA genômico os sítios de ligação a TFs, histonas e polimerases. Biochips de oligonucleotídeos longos (60 pb) de ORFs e regiões intergênicas. Representação de genomas completos (~40Mb) Sondas: DNA imunoprecipitado x controle (precipitação sem anticorpo) mais fragmentos do DNA correpondente ligados nas proteína de interesse confirmação da especificidade da ligação! Maior sinal
Chromatin Imunnoprecipitation microarrays (~1kb)
Projetos em andamento
LGE
LGE
LGE
GeneProjects - interface microarrays
GeneProjects - interface microarrays
GeneProjects - interface microarrays
GeneProjects - interface microarrays
GeneProjects - interface microarrays
GeneProjects - interface microarrays
GeneProjects - interface microarrays
Perspectivas LGE Implementar ferramenta que faça o caminho inverso. Consolidar procedimentos para produção de chips para screening e chips para investigação direcionada. Definir protocolos alternativos para marcação das sondas. Implementar sistema de Facility.
LGE/Unicamp - Inst. Biologia E-mail: ana@lge.ibi.unicamp.br