A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Seqüenciamento e montagem do genoma humano e análise de transcriptoma

Apresentações semelhantes


Apresentação em tema: "Seqüenciamento e montagem do genoma humano e análise de transcriptoma"— Transcrição da apresentação:

1 Seqüenciamento e montagem do genoma humano e análise de transcriptoma

2 Seqüenciamento do Genoma Humano
Embate: Consórcio público x Celera genomics: Consórcio público: mapeamento físico, shotgun hieráriquico. Celera genomics: whole genome shotgun Em fevereiro de 2001 foi publicada de forma independendente versão draft ou preliminar ambos grupos.

3 Seqüenciamento do Genoma Humano
2003: Consórcio público apresenta versão final do seqüenciamento do genoma humano Comprimento total: 3 bilhões pb 99% deste total foi seqüenciado Erro de seqüenciamento estimado em 1/ nt 99.9% não apresenta diferenças entre indivíduos. genes Genes codificadores de proteínas correspondem a apenas 2% do genoma 50 % do genoma consiste de regiões repetitivas (D.melanogaster 3%, C.elegans 7%)

4 Celera Genomics – Iniciativa privada
Whole genome shotgun (WGS) Genoma Biblioteca genômica Plasmídeo (inserto 10 kb) BAC (inserto 100 kb) Leituras ou reads Seqüenciamento das extremidades do inserto

5 Celera Genomics – Iniciativa privada
Whole genome shotgun (WGS) – Montagem Contig Mate pairs AGCGTTA GTTACAAC AGCGTTACAAC

6 Celera Genomics – Iniciativa privada
Whole genome shotgun (WGS) – Montagem Mate pairs Contig Contig

7 Celera Genomics – Iniciativa privada
Whole genome shotgun (WGS) – Montagem Mate pairs BAC contendo inserto de maior comprimento Contig Contig

8 Celera Genomics – Iniciativa privada
Whole genome shotgun (WGS) – Montagem Mate pairs Contig Contig Mate pairs Scaffold Contig Contig

9 Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo
Biblioteca genômica em BAC (inserto 100Kb) Fragmento cromossômico Biblioteca genômica em BAC

10 Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo
Biblioteca genômica em BAC (inserto 100Kb) Fragmento cromossômico Biblioteca genômica em BAC

11 Consórcio público Mapeamento físico, shotgun hierárquico - Montagem
BAC Biblioteca Plasmídeo (inserto 10 kb) Leituras ou reads Seqüenciamento das extremidades do inserto

12 Consórcio público Mapeamento físico, shotgun hierárquico - Montagem
Mate pairs AGCGTTA GTTACAAC AGCGTTACAAC Contig

13 Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo
Biblioteca genômica em BAC (inserto 100 kb)

14 Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo
Biblioteca genômica em BAC (inserto 100 kb)

15 Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo
Biblioteca genômica em BAC (inserto 100 kb)

16 Avaliação de estratégias de seqüenciamento
Vantagens WGS Estratégia mais simples com menos etapas. Vantagens Shotgun Hierárquico Menos vulnerável que a estratégia WGS em relação a montagem de regiões repetitivas.

17 Avaliação de estratégias de seqüenciamento
Repetições no genoma Processo de montagem é suscetível a erros quando empregado em genomas com alto índice de repeticões. Genoma Montagem Cenário I X X X WGS: Montagem de 3 bilhões de bases (todo genoma). Shotgun hierárquico: Montagem de 100 mil bases (inserto de cada BAC).

18 In silico

19 Base-calling Geração de uma seqüência de nucleotídeos através da análise dos chromatogramas PHRED gaattcggcacgagagttctcccggagacgctccgtgcgaagattatggaggccgtcaatgtggtcggttcccgccactttgctcgcctgcgcatcgatgtaacagtccgtggtgacgaagtcataccgttaagtattacgtttttgttgtcgttgttgcagcaatagtagaggacgggcgcttttttttttgtcaagagaaagggggaggggcgtactaccgctttatcgaggttggtattatttcttatatataaagggaaagagcaacgtgaagcgggtaagggaagagtgaaagtcgag

20 Mascaramento Eliminar fragmentos de vetor cross_match >5’
gctccaccgcggtggcggccgctctagaactagtggatcccccgggctgcaggaattcggcacgagagttctcccggagacgctccgtgcgaagattatggaggccgtcaatgtggtcggttcccgccactttgctcgcctgcgcatcgatgtaacagtccgtggtgacgaagtcataccgttaagtattacgtttttgttgtcgttgttgca >3’ gcaatagtagaggacgggcgcttttttttttgtcaagagaaagggggaggggcgtactaccgctttatcgaggttggtattatttcttatatataaagggaaagagcaacgtgaagcgggtaagggaagagtgaaagtcgagggggggcccggtacccaattc

21 Montagem Produzir uma seqüência contígua através de seqüências menores que possuam regiões de sobreposição PHRAP, Celera Assembler, Arachne leituras contig

22 Anotação Localizar na seqüencia genômica final:
Genes que codificam proteínas e RNAs não traduzidos (tRNA, rRNA, snRNA) Determinar, se possível, o produto provável de cada gene encontrado. Associar cada gene à uma categoria funcional ou via metabólica. Ex.: síntese de lipídeos, maquinaria de tradução, fosforilação oxidativa, etc.

23 Anotação Streptococcus pneumoniae R6

24 Anotação Automática contig Glimmer RBSfinder GeneMark tRNAscan CDS

25 Anotação Automática Anotação manual BLAST contra KEGG BLAST contra COG
PSORT BLAST contra GenBank Interpro Anotação manual

26 Alinhamento Determinar o grau de similaridade entre duas ou mais seqüências, ou entre fragmentos de seqüências. Inferir homologia entre genes: parálogos, ortólogos.

27 Alinhamento local Similaridade pode se ater a regiões de cada seqüência

28 BLAST BLAST (Basic Local Alignment Search Tool) Bancos de seqüências
COG KEGG > SEQ1 atgggcacgagagttctcccggagac gctccgtgcgaagattatggagg ccgtcaatgtggtcggttcccg ccactttgctcgcctg BLAST GenBank Nucleotídeos GenBank Proteínas

29 BLAST BLAST it! (Basic Local Alignment Search Tool)
Aldolase Trypanosoma cruzi acaagctggagctcccgcggtggtcggcgctctagaactagtggatcccccgggctgcaggaattcggcacgagaacaacttcaaccgcgtctggaaggc gccacgccgcccgtttgagaaggaacgccttgaccgcgagatgaaactctgcggccagtacggccttcngttgcaacgcgtgagatttggcgccgtgaac atgacgctctccaagatgcgtcgtaccgcccgtctgttgttgacgttgccggagaaccacccgcgccggcagctggagggttccgccatcatgcgccgct gccacgactacggcttcctcgagggggggcccggtacccaattcgccctatagtgagtcgtattacannattcactggccgntcgntnntttacaacgtc gntnngactgggnannaaaccctggnnncgttacccaacttaatcgcctt BLAST it!

30 Anotação Automática Anotação manual BLAST contra KEGG BLAST contra COG
PSORT BLAST contra GenBank Interpro Anotação manual

31 Interpro Procura na seqüências por domínios, assinaturas ou motivos conhecidos. Se utiliza de outros bancos de domínios para produzir seu relatório final. PFAM, SMART, PROSITE, etc Aldolase Trypanosoma cruzi acaagctggagctcccgcggtggtcggcgctctagaactagtggatcccccgggctgcaggaattcggcacgagaacaacttcaaccgcgtctggaaggc gccacgccgcccgtttgagaaggaacgccttgaccgcgagatgaaactctgcggccagtacggccttcngttgcaacgcgtgagatttggcgccgtgaac atgacgctctccaagatgcgtcgtaccgcccgtctgttgttgacgttgccggagaaccacccgcgccggcagctggagggttccgccatcatgcgccgct gccacgactacggcttcctcgagggggggcccggtacccaattcgccctatagtgagtcgtattacannattcactggccgntcgntnntttacaacgtc gntnngactgggnannaaaccctggnnncgttacccaacttaatcgcctt Interpro

32 Anotação Automática Anotação manual BLAST contra KEGG BLAST contra COG
PSORT BLAST contra GenBank Interpro Anotação manual

33 Anotação Streptococcus pneumoniae R6

34 Sabiá LNCC – Coordenação do Projeto Genoma Brasileiro
System for Automated Bacterial Integrated Annotation LNCC – Coordenação do Projeto Genoma Brasileiro Gerenciamento de todos softwares de Base-calling, Mascaramento, Montagem e Anotação automática. Disponibilização da Anotação automática dos resultados via Web possibilitando a realização da Anotação manual por pesquisadores distribuídos geograficamente. Exemplo Sabiá Mapa Antes Mapa Depois

35 Análise do transcriptoma
Projetos que precedem seqüenciamento do genoma nuclear: Identificação de novos genes. Estimativa do perfil de expressão da linhagem celular, estágio de desenvolvimento ou tecido avaliado Estrutral em foram de disco onde são armazenadas inúmeras cópias do DNA mitocondrial

36 Transcrição e Transcriptoma
EST RNA total mRNA 5’ 3’ CAP cístron Poli A

37 Transcrição e Transcriptoma
EST Poli A cDNA Poli A Poli A Poli A Vetor + cDNA

38 Transcrição e Transcriptoma
EST ~ 800 pb Sequenciamento extremidades Vetor 5’ 3’ Poli A Vetor cDNA completo Vetor 5’ 3’ Poli A Vetor

39 X X X Transcrição e Transcriptoma EST EST Remoção Sequencia de vetor
(cross_match, Lucy) Vetor 5’ 3’ Poli A Vetor X Remoção Poli A (Script Perl) 5’ 3’ Poli A EST 5’ 3’

40 Análise do transcriptoma
EST – Anotação 5’ 3’ Bancos de seqüências GenBank Nucleotídeos >clone_23 5’ ggcacgagagttctcccggagac gctccgtgcgaagattatggagg ccgtcaatgtggtcggttcccg ccactttgctcgcctg BLASTX E BLASTN Consiste na procura por sequencias similares Cluster ou sequencia individual GenBank Proteínas clone_23 5’ = amastina

41 Análise do transcriptoma
EST – Anotação = amastina >clone_23 5’ ggcacgagagttctcccggagac gctccgtgcgaagattatggagg ccgtcaatgtggtcggttcccg ccactttgctcgcctg Agrupamento de seqüência similares ou agrupamento via anotação Cell Surface and Membrane Cell cycle Cell Motility DNA Metabolism Energy Metabolism Heat-shock proteins and chaperonins Kinases and phophatases Other Metabolism Proteases and proteasome Número de ESTs Anotação 4 amastina 6 TcMUC II

42 Transcrição e Transcriptoma
Transcriptoma de amastigotas Histonas Proteinas ribossomicas Proteinas associadas a fosforilacao oxidativa 3 proteinas de superfície gp85, amastin e mucinas

43 Transcrição e Transcriptoma Transcriptoma de amastigotas
Assim como em outros trabalhos proteinas associadas maquinaria de traducao, proteinas ribossomicas, correspondem a grande parte da expressao


Carregar ppt "Seqüenciamento e montagem do genoma humano e análise de transcriptoma"

Apresentações semelhantes


Anúncios Google