A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr.

Apresentações semelhantes


Apresentação em tema: "Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr."— Transcrição da apresentação:

1 Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr Arthur Gruber Instituto de Ciências Biológicas

2 O termo Metagenômica foi usado primeiramente em 1998 por Jo Handelsman (Universidade de Wiscosin – EUA) D r. Anand Kumar & D r. R. A. Siddique

3 METAGENOMA É o genoma coletivo da microbiota total, encontrada em um determinado habitat. METAGENOMA É o genoma coletivo da microbiota total, encontrada em um determinado habitat. METAGENOMA É o genoma coletivo da microbiota total, encontrada em um determinado habitat METAGENÔMICA É a análise genômica das comunidades de microrganismos de um determinado ambiente por técnicas independentes de cultivo. METAGENÔMICA É a análise genômica das comunidades de microrganismos de um determinado ambiente por técnicas independentes de cultivo. Introdução D r. Anand Kumar & D r. R. A. Siddique

4 Handelsman, 2004

5 Metatranscritoma Permite a identificação de genes que estão ou não sendo expressos Metatranscritoma Permite a identificação de genes que estão ou não sendo expressos Metaproteômica Permite uma melhor caracterização funcional da comunidade microbiana Metagenômica Fornece a informação da capacidade metabólica e funcional da comunidade microbiana Metagenômica Fornece a informação da capacidade metabólica e funcional da comunidade microbiana D r. Anand Kumar & D r. R. A. Siddique

6 Metagenômica aplicada D r. Anand Kumar & D r. R. A. Siddique

7 Metagenômica fornece Informação genética sobre possíveis novos biocatalizadores ou enzimas Conexões genômicas entre função e filogenia de organismos não cultiváveis Perfis evolutivos de função e estrutura de comunidades Novas hipóteses de funções microbiais Thomas et al, 2012

8 JCSetubal, 2012

9

10

11 Desenho do Estudo Amostragem Fracionamento da amostra Extração de DNA Sequenciamen to de DNA MontagemAnotação Análises Estatísticas Armazenamen to de dados Compartilham ento de dados Binning Thomas et al, 2012

12 Handelsman, 2004

13 Amostragem Isolar o DNA Depende do tipo de amostras Clonar DNA Inserir dentro de um vetor (plasmídio, cosmídio, BAC) Biblioteca Screening e sequenciamento Daniel, 2005 em Prentice Hall, 2005

14 Amostragem {desafios} Amostras devem representar a população Quantas amostras são necessárias? Curvas de raridade para estimar fração de espécies sequenciadas. (Abundância x Complexidade). Presença de populações dominantes afeta análises representação maior e maior chance de montar contigs. Quanto mais metadados forem coletados mais detalhadas serão as inferências das condições ambientais. Ex.: dados geográficos, bioquímicos, data de coleta, métodos de extração do DNA. Bruno Malveira Peixoto 2011

15 Sequenciamento – Shotgun Commins, Toft, Fares, 2009 Genoma completo Hierárquico

16 Prakash and Taylor, 2012

17 Montagem Fatores a serem considerados: Tamanho das leituras de sequenciamento usadas para criar a base de dados de metagenômica São necessárias sequências mais longas para anotação? A base de dados está montada para reduzir os requerimentos de processamento de dados?

18 MIRA: An Automated Genome and Assembler Montagem baseada em referência: Montagem de novo: Algoritmos rápidos rodam em laptop em 2h; Regiões divergentes não são cobertas – inserções, deleções ou polimorfirmos. Velvet Baseados em gráficos de Bruijn Requer grandes recursos computacionais Requer milhares de gigabytes – dias. Meta-IDBA e MetaVelvet – não clonalidade de populações naturais - subgráficos de Bruijn - N50 e tam. contig Thomas, Gilbert e Meyer, 2011 Meta-IDBAMetaVelvet Montagem

19 Montagem {limitações} Amostragem incompleta – genomas parcialmente amostrados Formação de quimeras – sequências de espécies diferentes Dificuldade em montar amostras ricas em espécies (solo). Bruno Malveira Peixoto 2011

20 Métodos de Discriminação Processo de classificação das seqs de DNA em grupos que possam representar um genoma individual ou genomas de organismos fortemente relacionados Classificação composicional Similaridade Vários algoritmos foram desenvolvidos – empregam dois tipos de informações contidas dentro de uma dada seq DNA Pontos importantes a considerar: Tipo de dado de entrada disponível Existência de training datasets adequados ou genomas de referência Algumas ferramentas combinam os dois approachs – PhymmBl, MetaCluster Pontos importantes a considerar: Tipo de dado de entrada disponível Existência de training datasets adequados ou genomas de referência Algumas ferramentas combinam os dois approachs – PhymmBl, MetaCluster Thomas et al, 2012; Liu, 2012

21 Classificação Composicional Genomas têm composição de nucleotídeos conservada e isto será refletido nos fragmentos de sequência dos genomas Conteúdo de GC Uso de códons Sítios de reconhecimento – 5S ou 16S rRNA Bioinfo tools: Phylopythia S-GSCM TACAO Não funciona bem com leituras curtas por não conterem informações suficientes Thomas et al, 2012; Liu, 2012

22 Conteúdo GC Karlin & Burge, 1995 A distribuição de nucleotídeos é relativamente constante dentro do genoma, mas varia entre genomas. A razão de possibilidades (odds ratio) de frequência de conteúdo C+G é essencialmente a mesma na maioria dos organismos para todo o DNA versus o DNA codificante e também a mesma para as frações de DNA das diferentes sequências. Talvez existam fatores que imponham limites às variações composicionais e estruturais de um genoma e que o conjunto de valores das odds ratios do dinucleotídeo seja uma assinatura genômica. Diferenças significativas entre procariotos e eucariotos, entre vírus e seus hospedeiros. Pxy = fxy / fx fy Karlin, 1995; Liu, 2012

23 Karlin, 1995

24

25 Uso de códons Codon Usage Database - Cada genoma tem uma estratégia particular de codificação Percentual de G+C na 3a posição do códon tRNA Códons redundantes/sinônimos para qq aa não são usados com frequências iguais entre os diversos organismos Todos os aminoácidos, exceto Met e Trp, são codificados por 2 a 6 códons Karlin, 1998; Ikemura, 1985

26 Similaridade Compara leituras curtas contra sequências codificadoras de bases de dados públicas de genes usando BlastX e então designa para o seu ancestral comum mais tardio (LCA) de um organismo alvo Bioinfo tools IGG/M MG-RAST MEGAN CARMA Sort-ITEMS MetaPhyler Thomas et al, 2012; Liu, 2012

27 Classificação {Bioinfo} Análise de similaridade: IMG/M, MG-RAST, MEGAN, CARMA, Sort-ITEMS, MetaPhyler Análise composicional: Phylopythia, S-GSOM, PCAHIER, TACAO Similaridade e composicional: PhymmBL e MetaCluster Necessidade de sequências de referência* (marcador de RNAr) para fechar o alinhamento para sequenciamentos de leitura curta. * Base de dados escassas e tendenciosas para apenas três filos Proteobacteria, Firmicutes e Actinobacteria Thomas, Gilbert e Meyer, 2011 Bruno Malveira Peixoto 2011

28 ANÁLISES DOS DADOS Dados de metagenômica cada vez mais abundantes necessitam de banco de dados para cobrir as informações taxonômicas e funcionais Plataforma computacional robusta, combinado com programas de pesquisa de similaridade adaptados a esses dados.

29 Anotação Contigs longos pb: RAST ou IMG Contigs curtos Fase 1: identificação dos genes: FragGeneScan (FGS) 1-2% erro, MetaGeneMark (MGM), MetaGeneAnotator (MGA), Metagene e Orphelia Fase 2: identificação atribuição de função e agrupamento taxonômico

30 Usa FGS, Greengenes, RDP e similaridade por RNAr Usa bases de dados funcionais de ontologia GO (KEGG, eggNOG, COG/KOG, PFAM e TIGRFAM). Pipelines Thomas, Gilbert e Meyer, 2011 Sistema aberto que processa automaticamente as sequências de metagenomas, faz comparações com bases de dados existentes, computa reconstruções filogenéticas e classifica funcionalmente potenciais genes.

31 Usa FGS, MGA e taxonomia baseada em 16S RNAr Usa bases de dados funcionais de ontologia GO (KEGG, eggNOG, COG e SEED). Pipelines Thomas, Gilbert e Meyer, 2011

32 Usa FGA e MGA Oferece esquema de anotação mais flexível Requer o uso do mesmo workflow para análise Pipelines Thomas, Gilbert e Meyer, 2011

33 MEGAN Pipelines

34 Aplicações

35 o Identificar genes funcionais e/ou novas vias metabólicas o Estimar a diversidade microbiana; permitindo o estudo dos genomas em uma comunidade como um todo o Compreender a dinâmica da população de uma comunidade inteira.

36 Saúde

37 Bioenergia

38 Metabolismo animal

39 Identificação novos patógenos

40 Vigilância

41 Medicina forense

42 FUNCIONAL SEQUÊNCIAS BIOPROSPECÇÃO

43

44 ESTUDOS ECOLÓGICOS Primeiros estudos Mar de Sargaços – Comunidade complexa – Genes desconhecidos – Filotipos novos – Impossibilidade de sequenciar todos os genomas presentes na amostra

45 Global Ocean Sampling (GOS) Fonte: Projetos recentes

46 Microorganismos representam mais de 90% da biomassa do oceano, mediam todos os ciclos bioquímicos nos oceanos e são responsáveis por 98% da produção primária no mar. Metagenômica é uma abordagem inovadora de sequenciação para examinar as espécies microbianas de espaço aberto sem a necessidade de isolamento e cultura de laboratório de espécies individuais. Alves, 2007

47 Projetos recentes

48

49 Fluxograma comparativo de projetos genoma tradicionais e metagenômicos

50 OBRIGADO!


Carregar ppt "Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr."

Apresentações semelhantes


Anúncios Google