Seqüenciamento e montagem do genoma humano e análise de transcriptoma

Slides:



Advertisements
Apresentações semelhantes
Instituto de Computação
Advertisements

Organização Gênica de Eucariotos
PROJETOS GENOMA E PROTEOMA HUMANOS
Amplificação (clonagem) dos genes e seu armazenamento
BIBLIOTECAS DE DNA ou BANCOS DE DNA FABIANA SEIXAS
Organização Gênica de Eucariotos
Estrutura e função do RNA
BIOLOGIA MOLECULAR Aula 4
Genética Molecular em Análises Clinicas
TRANSCRIÇÃO Biologia Molecular Profª Marília Scopel Andrighetti.
Organização Gênica dos Seres Vivos
Construção de uma Biblioteca
Universidade Federal de Viçosa
Montagem e análise de genomas
BIOTECNOLOGIA E ENGENHARIA GENÉTICA
Seqüenciamento parcial de transcritos
Uso da bioinformática na análise genômica
Uso da bioinformática na análise genômica
Introduction of RefSeq and LocusLink: resources at the NCBI
Sequenciamento inicial e análises do genoma humano
Genética bacteriana.
Genômica e Proteômica Montagem de genomas.
Transcrição do RNA em Organismos Procariotos e Eucariotos
ORGANIZAÇÃO do GENOMA - 2
Construção de Biblioteca Gênica
Regulação da Expressão Gênica em Organismos Eucariotos
Prof. Odir A. Dellagostin
Genome sequence.
TRANSCRIÇÃO processo pelo qual são sintetizados todos os RNAs da célula Cópia de uma região específica do DNA = RNA m reflete o estado fisiológico da.
Seqüência e qualidade. Seqüência e qualidade Uso da bioinformática na análise genômica.
Miguel www. cromatina. icb. ufmg. br. Miguel www. cromatina. icb. ufmg. br.
Tecnologia do DNA recombinante
Análise Computacional de Seqüências Nucleotídicas e Protéicas
Organização Gênica dos Seres Vivos
Análise de genomas e transcriptomas
Uso da bioinformática na análise genômica TAGAGCATCGATCGATGCTGCAGATGATGCTAGCATCGGCTAGGCGACG ATCTCGTAGCTA ATCTCGTAGCTAGCTACGACGTCTA ATCTCGTAGCTAGCTA ATCTCGTAGCTAG.
Genômica e Proteômica 1) Genômica Estrutural O que é Genômica ?
Transcrição em Eucariotos
Replicação, transcrição e tradução
ENGENHARIA GENÉTICA.
Transcrição e processamento de RNA em eucariotos
Genómica Licenciatura em Ciências Biomédicas Departamento de Ciências da Saúde, UCP Fevereiro 2013.
Genómica Licenciatura em Ciências Biomédicas
Construção de bibliotecas de cDNA
Profa. Ana Paula Miranda Guimarães
PLANTAS TRANSGÊNICAS: DE ONDE VEM, PARA AONDE VÃO?
A genética e os genes.
Código genético e síntese protéica.
Bancos de Dados Natália F. Martins. BD de Seqüências Há uma quantidade gigantesca de informação sobre biomoléculas em BD públicos Mais de 348 BD –BD de.
Estrutura dos Ácidos Nucléicos, Replicação e Transcrição
Estrutura e função de ácidos nucleicos, Replicação de DNA, transcrição e processamento de RNA, expressão gênica.
Estratégias de sequenciamento : genoma e transcriptoma
Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro
Seqüenciamento e genômica
Sequenciamento de Genomas
Gene Projects Marcelo Falsarella Carazzolle Laboratório de Genômica e Proteômica Unicamp.
BIOINFORMÁTICA UFMG A T G C. A T G C Performance de anotação automática com grupos de ortólogos KOG Se vc conhece os grupos de ortólogos de MO E vc pode.
RNA-SEQ: CONCEITO E APLICAÇÕES
BIOINFORMÁTICA UFMG A T G C. A T G C Performance de anotação automática com grupos de ortólogos KOG Se vc conhece os grupos de ortólogos de MO E vc pode.
Organização Gênica dos Seres Vivos
Número de clones teoricamente necessários para representar o genoma
Dogma Central da Biologia Molecular
* Com o avanço das descobertas acerca dos Ácidos Nucléicos e das Proteínas surgiu o Dogma da biologia Molecular; * Surgimento dos métodos de sequenciamento.
GENES E GENOMAS TRANSCRIÇÃO. Genes  1. Codificam proteínas mRNA mRNA  2. Codificam RNA ribossomal rRNA rRNA  3. Codificam RNA transportador tRNA tRNA.
Dogma central da biologia molecular
CENTRO DE GENOMICA E FITOMELHORAMENTO Introdução à Bioinformática
Gene Discovery em Eucalipto Doutoranda: Marcela Mendes Salazar
Dogma Central da Biologia Molecular
ANÁLISE EM LARGA ESCALA DE EXPRESSÃO GÊNICA DIFERENCIAL ENTRE DIVERSAS
EXPRESSÃO GÊNICA.
Transcrição da apresentação:

Seqüenciamento e montagem do genoma humano e análise de transcriptoma

Seqüenciamento do Genoma Humano Embate: Consórcio público x Celera genomics: Consórcio público: mapeamento físico, shotgun hieráriquico. Celera genomics: whole genome shotgun Em fevereiro de 2001 foi publicada de forma independendente versão draft ou preliminar ambos grupos.

Seqüenciamento do Genoma Humano 2003: Consórcio público apresenta versão final do seqüenciamento do genoma humano Comprimento total: 3 bilhões pb 99% deste total foi seqüenciado Erro de seqüenciamento estimado em 1/10.000 nt 99.9% não apresenta diferenças entre indivíduos. 25.000 genes Genes codificadores de proteínas correspondem a apenas 2% do genoma 50 % do genoma consiste de regiões repetitivas (D.melanogaster 3%, C.elegans 7%)

Celera Genomics – Iniciativa privada Whole genome shotgun (WGS) Genoma Biblioteca genômica Plasmídeo (inserto 10 kb) BAC (inserto 100 kb) Leituras ou reads Seqüenciamento das extremidades do inserto

Celera Genomics – Iniciativa privada Whole genome shotgun (WGS) – Montagem Contig Mate pairs AGCGTTA GTTACAAC AGCGTTACAAC

Celera Genomics – Iniciativa privada Whole genome shotgun (WGS) – Montagem Mate pairs Contig Contig

Celera Genomics – Iniciativa privada Whole genome shotgun (WGS) – Montagem Mate pairs BAC contendo inserto de maior comprimento Contig Contig

Celera Genomics – Iniciativa privada Whole genome shotgun (WGS) – Montagem Mate pairs Contig Contig Mate pairs Scaffold Contig Contig

Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo Biblioteca genômica em BAC (inserto 100Kb) Fragmento cromossômico Biblioteca genômica em BAC

Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo Biblioteca genômica em BAC (inserto 100Kb) Fragmento cromossômico Biblioteca genômica em BAC

Consórcio público Mapeamento físico, shotgun hierárquico - Montagem BAC Biblioteca Plasmídeo (inserto 10 kb) Leituras ou reads Seqüenciamento das extremidades do inserto

Consórcio público Mapeamento físico, shotgun hierárquico - Montagem Mate pairs AGCGTTA GTTACAAC AGCGTTACAAC Contig

Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo Biblioteca genômica em BAC (inserto 100 kb)

Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo Biblioteca genômica em BAC (inserto 100 kb)

Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo Biblioteca genômica em BAC (inserto 100 kb)

Avaliação de estratégias de seqüenciamento Vantagens WGS Estratégia mais simples com menos etapas. Vantagens Shotgun Hierárquico Menos vulnerável que a estratégia WGS em relação a montagem de regiões repetitivas.

Avaliação de estratégias de seqüenciamento Repetições no genoma Processo de montagem é suscetível a erros quando empregado em genomas com alto índice de repeticões. Genoma Montagem Cenário I X X X WGS: Montagem de 3 bilhões de bases (todo genoma). Shotgun hierárquico: Montagem de 100 mil bases (inserto de cada BAC).

In silico

Base-calling Geração de uma seqüência de nucleotídeos através da análise dos chromatogramas PHRED gaattcggcacgagagttctcccggagacgctccgtgcgaagattatggaggccgtcaatgtggtcggttcccgccactttgctcgcctgcgcatcgatgtaacagtccgtggtgacgaagtcataccgttaagtattacgtttttgttgtcgttgttgcagcaatagtagaggacgggcgcttttttttttgtcaagagaaagggggaggggcgtactaccgctttatcgaggttggtattatttcttatatataaagggaaagagcaacgtgaagcgggtaagggaagagtgaaagtcgag

Mascaramento Eliminar fragmentos de vetor cross_match >5’ gctccaccgcggtggcggccgctctagaactagtggatcccccgggctgcaggaattcggcacgagagttctcccggagacgctccgtgcgaagattatggaggccgtcaatgtggtcggttcccgccactttgctcgcctgcgcatcgatgtaacagtccgtggtgacgaagtcataccgttaagtattacgtttttgttgtcgttgttgca >3’ gcaatagtagaggacgggcgcttttttttttgtcaagagaaagggggaggggcgtactaccgctttatcgaggttggtattatttcttatatataaagggaaagagcaacgtgaagcgggtaagggaagagtgaaagtcgagggggggcccggtacccaattc

Montagem Produzir uma seqüência contígua através de seqüências menores que possuam regiões de sobreposição PHRAP, Celera Assembler, Arachne leituras contig

Anotação Localizar na seqüencia genômica final: Genes que codificam proteínas e RNAs não traduzidos (tRNA, rRNA, snRNA) Determinar, se possível, o produto provável de cada gene encontrado. Associar cada gene à uma categoria funcional ou via metabólica. Ex.: síntese de lipídeos, maquinaria de tradução, fosforilação oxidativa, etc.

Anotação Streptococcus pneumoniae R6

Anotação Automática contig Glimmer RBSfinder GeneMark tRNAscan CDS

Anotação Automática Anotação manual BLAST contra KEGG BLAST contra COG PSORT BLAST contra GenBank Interpro Anotação manual

Alinhamento Determinar o grau de similaridade entre duas ou mais seqüências, ou entre fragmentos de seqüências. Inferir homologia entre genes: parálogos, ortólogos.

Alinhamento local Similaridade pode se ater a regiões de cada seqüência

BLAST BLAST (Basic Local Alignment Search Tool) Bancos de seqüências COG KEGG > SEQ1 atgggcacgagagttctcccggagac gctccgtgcgaagattatggagg ccgtcaatgtggtcggttcccg ccactttgctcgcctg BLAST GenBank Nucleotídeos GenBank Proteínas

BLAST BLAST it! (Basic Local Alignment Search Tool) Aldolase Trypanosoma cruzi .........1.........2.........3.........4.........5.........6.........7.........8.........9.........10 acaagctggagctcccgcggtggtcggcgctctagaactagtggatcccccgggctgcaggaattcggcacgagaacaacttcaaccgcgtctggaaggc gccacgccgcccgtttgagaaggaacgccttgaccgcgagatgaaactctgcggccagtacggccttcngttgcaacgcgtgagatttggcgccgtgaac atgacgctctccaagatgcgtcgtaccgcccgtctgttgttgacgttgccggagaaccacccgcgccggcagctggagggttccgccatcatgcgccgct gccacgactacggcttcctcgagggggggcccggtacccaattcgccctatagtgagtcgtattacannattcactggccgntcgntnntttacaacgtc gntnngactgggnannaaaccctggnnncgttacccaacttaatcgcctt BLAST it!

Anotação Automática Anotação manual BLAST contra KEGG BLAST contra COG PSORT BLAST contra GenBank Interpro Anotação manual

Interpro Procura na seqüências por domínios, assinaturas ou motivos conhecidos. Se utiliza de outros bancos de domínios para produzir seu relatório final. PFAM, SMART, PROSITE, etc Aldolase Trypanosoma cruzi .........1.........2.........3.........4.........5.........6.........7.........8.........9.........10 acaagctggagctcccgcggtggtcggcgctctagaactagtggatcccccgggctgcaggaattcggcacgagaacaacttcaaccgcgtctggaaggc gccacgccgcccgtttgagaaggaacgccttgaccgcgagatgaaactctgcggccagtacggccttcngttgcaacgcgtgagatttggcgccgtgaac atgacgctctccaagatgcgtcgtaccgcccgtctgttgttgacgttgccggagaaccacccgcgccggcagctggagggttccgccatcatgcgccgct gccacgactacggcttcctcgagggggggcccggtacccaattcgccctatagtgagtcgtattacannattcactggccgntcgntnntttacaacgtc gntnngactgggnannaaaccctggnnncgttacccaacttaatcgcctt Interpro

Anotação Automática Anotação manual BLAST contra KEGG BLAST contra COG PSORT BLAST contra GenBank Interpro Anotação manual

Anotação Streptococcus pneumoniae R6

Sabiá LNCC – Coordenação do Projeto Genoma Brasileiro System for Automated Bacterial Integrated Annotation LNCC – Coordenação do Projeto Genoma Brasileiro Gerenciamento de todos softwares de Base-calling, Mascaramento, Montagem e Anotação automática. Disponibilização da Anotação automática dos resultados via Web possibilitando a realização da Anotação manual por pesquisadores distribuídos geograficamente. Exemplo Sabiá Mapa Antes Mapa Depois

Análise do transcriptoma Projetos que precedem seqüenciamento do genoma nuclear: Identificação de novos genes. Estimativa do perfil de expressão da linhagem celular, estágio de desenvolvimento ou tecido avaliado Estrutral em foram de disco onde são armazenadas inúmeras cópias do DNA mitocondrial

Transcrição e Transcriptoma EST RNA total mRNA 5’ 3’ CAP cístron Poli A

Transcrição e Transcriptoma EST Poli A cDNA Poli A Poli A Poli A Vetor + cDNA

Transcrição e Transcriptoma EST ~ 800 pb Sequenciamento extremidades Vetor 5’ 3’ Poli A Vetor cDNA completo Vetor 5’ 3’ Poli A Vetor

X X X Transcrição e Transcriptoma EST EST Remoção Sequencia de vetor (cross_match, Lucy) Vetor 5’ 3’ Poli A Vetor X Remoção Poli A (Script Perl) 5’ 3’ Poli A EST 5’ 3’

Análise do transcriptoma EST – Anotação 5’ 3’ Bancos de seqüências GenBank Nucleotídeos >clone_23 5’ ggcacgagagttctcccggagac gctccgtgcgaagattatggagg ccgtcaatgtggtcggttcccg ccactttgctcgcctg BLASTX E BLASTN Consiste na procura por sequencias similares Cluster ou sequencia individual GenBank Proteínas clone_23 5’ = amastina

Análise do transcriptoma EST – Anotação = amastina >clone_23 5’ ggcacgagagttctcccggagac gctccgtgcgaagattatggagg ccgtcaatgtggtcggttcccg ccactttgctcgcctg Agrupamento de seqüência similares ou agrupamento via anotação Cell Surface and Membrane Cell cycle Cell Motility DNA Metabolism Energy Metabolism Heat-shock proteins and chaperonins Kinases and phophatases Other Metabolism Proteases and proteasome Número de ESTs Anotação 4 amastina 6 TcMUC II

Transcrição e Transcriptoma Transcriptoma de amastigotas Histonas Proteinas ribossomicas Proteinas associadas a fosforilacao oxidativa 3 proteinas de superfície gp85, amastin e mucinas

Transcrição e Transcriptoma Transcriptoma de amastigotas Assim como em outros trabalhos proteinas associadas maquinaria de traducao, proteinas ribossomicas, correspondem a grande parte da expressao