A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista

Apresentações semelhantes


Apresentação em tema: "Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista"— Transcrição da apresentação:

1 Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista
BMP 5762 – Bioinformática Aplicada ao Estudo de Doenças Parasitárias Prof Dr Arthur Gruber Instituto de Ciências Biológicas Metagenômica Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista

2 O termo Metagenômica foi usado primeiramente em 1998 por Jo Handelsman (Universidade de Wiscosin – EUA) Dr. Anand Kumar & Dr. R. A. Siddique

3 Introdução METAGENOMA
É o genoma coletivo da microbiota total, encontrada em um determinado habitat. METAGENOMA É o genoma coletivo da microbiota total, encontrada em um determinado habitat METAGENÔMICA É a análise genômica das comunidades de microrganismos de um determinado ambiente por técnicas independentes de cultivo. Dr. Anand Kumar & Dr. R. A. Siddique

4 Handelsman, 2004

5 Fornece a informação da capacidade metabólica
Metagenômica Fornece a informação da capacidade metabólica e funcional da comunidade microbiana Metatranscritoma Permite a identificação de genes que estão ou não sendo expressos Metaproteômica Permite uma melhor caracterização funcional da comunidade microbiana Dr. Anand Kumar & Dr. R. A. Siddique

6 Metagenômica aplicada
Dr. Anand Kumar & Dr. R. A. Siddique

7 Metagenômica fornece Informação genética sobre possíveis novos biocatalizadores ou enzimas Conexões genômicas entre função e filogenia de organismos “não cultiváveis” Perfis evolutivos de função e estrutura de comunidades Novas hipóteses de funções microbiais Thomas et al, 2012

8 JCSetubal, 2012

9 JCSetubal, 2012

10 JCSetubal, 2012

11 Fracionamento da amostra
Desenho do Estudo Amostragem Fracionamento da amostra Extração de DNA Sequenciamento de DNA Montagem Anotação Análises Estatísticas Armazenamento de dados Compartilhamento de dados Binning Thomas et al, 2012

12 Handelsman, 2004

13 Amostragem Isolar o DNA Clonar DNA
Depende do tipo de amostras Clonar DNA Inserir dentro de um vetor (plasmídio, cosmídio, BAC) Biblioteca Screening e sequenciamento Isolating DNA from an environmental sample is the first step of any metagenomics study. Different types of samples often require specialized extraction techniques; however, once the DNA is extracted most metagenomics projects will take one of several approaches. A schematic of the techniques used to study the soil metagenome is shown in the slide. Once DNA is isolated it is cloned, entered into some kind of vector (bacterial artificial chromosome, plasmid, cosmid, etc.), and then inserted into an appropriate bacterial host. The bacteria can then be used in functional screens for specific types of biochemical activity (e.g. proteases). Alternatively, DNA from the metagenome can be used for sequencing. In some cases this can even result in the complete or almost complete genomes of individual species in the environmental sample. Daniel, 2005 em Prentice Hall, 2005

14 Amostragem {desafios}
Amostras devem representar a população → Quantas amostras são necessárias? Curvas de raridade para estimar fração de espécies sequenciadas. (Abundância x Complexidade). Presença de populações dominantes afeta análises → representação maior e maior chance de montar contigs. Quanto mais metadados forem coletados mais detalhadas serão as inferências das condições ambientais. Ex.: dados geográficos, bioquímicos, data de coleta, métodos de extração do DNA. Bruno Malveira Peixoto 2011

15 Sequenciamento – Shotgun
Genoma completo In whole genome shotgun sequencing (top), the entire genome is sheared randomly into small fragments (appropriately sized for sequencing) and then reassembled. In hierarchical shotgun sequencing (bottom), the genome is first broken into larger segments. After the order of these segments is deduced, they are further sheared into fragments appropriately sized for sequencing. Hierárquico Commins, Toft, Fares, 2009

16 Prakash and Taylor, 2012

17 Montagem Fatores a serem considerados:
Tamanho das leituras de sequenciamento usadas para criar a base de dados de metagenômica São necessárias sequências mais longas para anotação? A base de dados está montada para reduzir os requerimentos de processamento de dados?

18 MIRA: An Automated Genome and
Montagem Montagem baseada em referência: MIRA: An Automated Genome and Assembler Algoritmos rápidos rodam em laptop em 2h; Regiões divergentes não são cobertas – inserções, deleções ou polimorfirmos. Montagem “de novo”: Velvet Meta-IDBA MetaVelvet Baseados em gráficos de Bruijn Requer grandes recursos computacionais Requer milhares de gigabytes – dias. Meta-IDBA e MetaVelvet – não clonalidade de populações naturais - subgráficos de Bruijn - N50 e tam. contig Thomas, Gilbert e Meyer, 2011

19 Montagem {limitações}
Amostragem incompleta – genomas parcialmente amostrados Formação de quimeras – sequências de espécies diferentes Dificuldade em montar amostras ricas em espécies (solo). Bruno Malveira Peixoto 2011

20 Métodos de Discriminação
Processo de classificação das seqs de DNA em grupos que possam representar um genoma individual ou genomas de organismos fortemente relacionados Classificação composicional Similaridade Vários algoritmos foram desenvolvidos – empregam dois tipos de informações contidas dentro de uma dada seq DNA A training set is a set of data used in various areas of information science to discover potentially predictive relationships. Training sets are used in artificial intelligence, machine learning, genetic programming, intelligent systems, and statistics. In all these fields, a training set has much the same role and is often used in conjunction with a test set. Pontos importantes a considerar: Tipo de dado de entrada disponível Existência de training datasets adequados ou genomas de referência Algumas ferramentas combinam os dois approachs – PhymmBl, MetaCluster Thomas et al, 2012; Liu, 2012

21 Classificação Composicional
Genomas têm composição de nucleotídeos conservada e isto será refletido nos fragmentos de sequência dos genomas Conteúdo de GC Uso de códons Sítios de reconhecimento – 5S ou 16S rRNA Bioinfo tools: Phylopythia S-GSCM TACAO Não funciona bem com leituras curtas por não conterem informações suficientes Thomas et al, 2012; Liu, 2012

22 Conteúdo GC Karlin & Burge, 1995
A distribuição de nucleotídeos é relativamente constante dentro do genoma, mas varia entre genomas. A razão de possibilidades (odds ratio) de frequência de conteúdo C+G é essencialmente a mesma na maioria dos organismos para todo o DNA versus o DNA codificante e também a mesma para as frações de DNA das diferentes sequências. Talvez existam fatores que imponham limites às variações composicionais e estruturais de um genoma e que o conjunto de valores das odds ratios do dinucleotídeo seja uma assinatura genômica. Diferenças significativas entre procariotos e eucariotos, entre vírus e seus hospedeiros. Pxy = fxy / fx fy Domínio taxonômico Eukariota, Eukaria, Eukarya, Eukaryota, também referidos como eucariotas ou eucariontes (do grego ευ, translit.: eu, "bom, perfeito"; e κάρυον, translit.: karyon, noz ou amêndoa, núcleo) inclui todos os seres vivos com células eucarióticas, ou seja, com um núcleo celular rodeado por uma membrana (DNA compartimentado, consequentemente separado do citoplasma) e com vários organelos. No núcleo está contida a maior parte do material genético, o DNA, enquanto uma parte menor está contida nos mitocôndrios. Seu DNA está associado a proteínas histónicas. Os eucariotas são portanto os organismos unicelulares ou pluricelulares constituídos por células dotadas de núcleo, distinguindo-se dos procariotas (grupo parafilético), cujas células são desprovidas de um núcleo bem diferenciado. Procariontes, procariotas ou procariotos (grego transliterado: pro, anterior, antes, primeiro, primitivo - karyon, noz ou amêndoa - núcleo = Nucleo Primitivo) são organismos unicelulares na sua vasta maioria e que não apresentam seu material genético delimitado por uma membrana. Estes seres não possuem nenhum tipo de compartimentalização interna por membranas, estando ausentes várias outras organelas, como as mitocôndrias, o Complexo de Golgi e o fuso mitótico.[1][2] Esta definição engloba todos os organismos dos domínios Bacteria e Archaea. Karlin, 1995; Liu, 2012

23 Karlin, 1995

24 From data simulations and statistical theory, P. xy<0
From data simulations and statistical theory, P*xy<0.78 (extreme under-representation) or P*xy >1.23 (extreme over-representation) occurs for sufficiently long (~20 kb) Karlin, 1995

25 Uso de códons Todos os aminoácidos, exceto Met e Trp, são codificados por 2 a 6 códons Códons redundantes/sinônimos para qq aa não são usados com frequências iguais entre os diversos organismos Cada genoma tem uma estratégia particular de codificação Percentual de G+C na 3a posição do códon tRNA Codon Usage Database - Códon é uma sequência de três bases nitrogenadas de RNA mensageiro que codificam um determinado aminoácido ou que indicam o ponto de início ou fim de tradução da cadeia de RNAm. Isto significa que cada conjunto de três bases consecutivas é responsável pela codificação de um aminoácido. Karlin, 1998; Ikemura, 1985

26 Similaridade Compara leituras curtas contra sequências codificadoras de bases de dados públicas de genes usando BlastX e então designa para o seu ancestral comum mais tardio (LCA) de um organismo alvo Bioinfo tools IGG/M MG-RAST MEGAN CARMA Sort-ITEMS MetaPhyler BlastX – consul nt x aa base Thomas et al, 2012; Liu, 2012

27 Classificação {Bioinfo}
Análise de similaridade: IMG/M, MG-RAST, MEGAN, CARMA, Sort-ITEMS, MetaPhyler Análise composicional: Phylopythia, S-GSOM, PCAHIER, TACAO Similaridade e composicional: PhymmBL e MetaCluster Necessidade de sequências de referência* (marcador de RNAr) para fechar o alinhamento para sequenciamentos de leitura curta. * Base de dados escassas e tendenciosas para apenas três filos Proteobacteria, Firmicutes e Actinobacteria Bruno Malveira Peixoto 2011 Thomas, Gilbert e Meyer, 2011

28 ANÁLISES DOS DADOS Dados de metagenômica cada vez mais abundantes necessitam de banco de dados para cobrir as informações taxonômicas e funcionais Plataforma computacional robusta, combinado com programas de pesquisa de similaridade adaptados a esses dados. Necessário uma plataforma computacional poderosa combinado com programas de pesquisa de similaridade adaptados a esses dados.

29 Anotação Contigs longos ≥ 30.000 pb: RAST ou IMG Contigs curtos
Fase 1: identificação dos genes: FragGeneScan (FGS) 1-2% erro, MetaGeneMark (MGM), MetaGeneAnotator (MGA), Metagene e Orphelia Fase 2: identificação atribuição de função e agrupamento taxonômico

30 Usa FGS, Greengenes , RDP e similaridade por RNAr
Pipelines Sistema aberto que processa automaticamente as sequências de metagenomas, faz comparações com bases de dados existentes, computa reconstruções filogenéticas e classifica funcionalmente potenciais genes. Usa FGS, Greengenes , RDP e similaridade por RNAr Usa bases de dados funcionais de ontologia GO (KEGG, eggNOG, COG/KOG, PFAM e TIGRFAM). Thomas, Gilbert e Meyer, 2011

31 Usa FGS, MGA e taxonomia baseada em 16S RNAr
Pipelines Usa FGS, MGA e taxonomia baseada em 16S RNAr Usa bases de dados funcionais de ontologia GO (KEGG, eggNOG, COG e SEED). Thomas, Gilbert e Meyer, 2011

32 Pipelines Usa FGA e MGA Oferece esquema de anotação mais flexível
Requer o uso do mesmo workflow para análise Thomas, Gilbert e Meyer, 2011

33 Pipelines MEGAN

34 Modeling microbial communities for public health
Aplicações PROJETOS METAGENÔMICOS Identificar genes funcionais e/ou novas vias metabólicas; Estimar a diversidade microbiana; permitindo o estudo dos genomas em uma comunidade como um todo; Compreender a dinâmica da população de uma comunidade inteira. 2. Metagenomics: Modeling microbial communities for public health visión completa de la evolución de la ecología microbiana Herramienta de salud publica para monitorear la salud de la población y sus interacciones biomarcador de diagnóstico o pronóstico para la enfermedad de huésped. Who’s there? What are they doing? What do functional genomic data tell us about microbiomes? What can our microbiomes tell us about us?* *Using terabases of sequence and thousands of experimental results

35 Aplicações Identificar genes funcionais e/ou novas vias metabólicas
Estimar a diversidade microbiana; permitindo o estudo dos genomas em uma comunidade como um todo Compreender a dinâmica da população de uma comunidade inteira. Environmental sample all DNA sequencing (Genome informations)‏ Information about : Biodiversity but also physiology, metabolic pathways…

36 Saúde Eles descobriram que: primeiro microbiomas, saliva na população humana foram apresentados por uma vasta diversidade filogenética, ainda um núcleo mínimo de organismos; em segundo lugar, microbiomas da cárie foram significativamente mais variável na estrutura da comunidade, onde, como as saudáveis ​​eram relativamente conservado, o terceiro, mudanças abundântes de taxa determinada, tais como excesso de Prevotella Gênero microbiota cárie diferenciadas dos saudáveis ​​e, além disso, os indivíduos cárie-ativos e normais tinham diferentes matrizes das espécies Prevotella;(bacteriodetes, bacteroides, bacteroidales) e, finalmente, não há unidades 'cárie específico' taxonômicos operacionais (UTOs) foram detectados Vinculação de Longo Prazo padrões dietéticos com enterotipos microbiais intestinais. Dieta afeta fortemente a saúde humana, em parte através da modulação composição microbioma, intestino. eles usaram inventários dieta e 16S rDNA de seqüenciamento para caracterizar amostras fecais de 98 indivíduos. Enterotypes foram fortemente associados com dietas de longo prazo, principalmente proteína e gordura animal (Bacteroides) versus carboidratos (Prevotella). Um estudo de alimentação controlada de 10 sujeitos mostrou que a composição microbiome alterado de forma detectável dentro de 24 horas após o início de uma dieta elevado de gordura / baixo de fibras ou de dieta baixo de gordura / rica em fibras, mas que a identidade enterotype permaneceu estável durante o estudo de 10 dias (3) Long-term goals: Nutrigenomics is to help to understand how we can use nutrition to prevent many of the same diseases for which pharmacogenomics is attempting to identify cures. SNP database will be effect on disease risk. Future==personalized diets

37 Bioenergia Empresa Brasileira de Pesquisa Agropecuária
identificação de enzimas a partir de DNA de microrganismos presentes em amostra ambiental (metagenoma) que podem ser provenientes de organismos não identificados tem investido na construção de bibliotecas metagenômicas de rúmen de caprinos e da microbiota do solo da Floresta Amazônica. Esses ambientes são abundantes em microrganismos que levam à degradação de material lignocelulósico

38 Metabolismo animal Micróbios ruminais vaca especializar na degradação do material vegetal celulósico, mas a maioria dos membros desta comunidade complexa resistir cultivo. Para caracterizar a biomassa de degradação genes e genomas, nós seqüenciados e analisados ​​268 gigabases de DNA de micróbios metagenomico aderentes a fibra vegetal incubadas no rúmen de vacas. A partir desses dados, foram identificados putativos genes ativos em carboidratos e proteínas expressas 90 candidatos, dos quais 57% eram enzimaticamente ativa contra substratos celulósicos. Nós também reuniu 15 genomas microbianos não cultivadas, que foram validados por métodos complementares, incluindo uma única célula de seqüenciamento do genoma. Estes conjuntos de dados oferecem um catálogo substancialmente alargado de genes e genomas participar da desconstrução da biomassa celulósica Um rúmen catálogo gene microbiana, é necessário compreender a função do microbioma e sua interação com o animal hospedeiro e se alimenta, e irá fornecer uma base para integrativas microbioma-host modelos e informar estratégias de promoção menos poluentes, ruminantes mais robustos e eficientes

39 Identificação novos patógenos
Um total de 96 amostras retais foram coletadas em meio de transporte viral de 10 tipos de morcegos Metagenômica também levou para o estudo da diversidade viral e comunidade em hospedeiros e da associação de vírus e da doença Dada a associação entre a PV e os cancros nos seres humanos e outros animais, não é surpreendente que o PV bat primeiro foi encontrado no carcinoma basosquamous de um taco de fruta

40 Vigilância Este estudo revelou NOVA diversidade e função com as comunidades de DNA viral no, influente, lodo ativado, digestor anaeróbio de e efluente de uma doméstica WWTP utilizando metagenômica Utilizando a abordagem metagenômica, este estudo revelou um alto grau de novidade da diversidade e da função de quatro comunidades virais obtidos em diferentes etapas de um WWTP

41 Medicina forense Em resumo, com a aplicação de uma única célula WGA e 454 pyrosequencing eles foram capazes de determinar a composição de uma mancha metagenômico biológica no local do crime. Com uma análise bioinformática das sequências de ADN, foi possível determinar a origem mais provável da mancha. Com este método não suposições sobre a possível identidade mancha precisa ser desenhado, desde amplificação e seqüenciamento é dependente de primers seqüência específica. Poderíamos mostrar que essas manchas podem conter uma alta proporção de metagenomico (ainda desconhecido) seqüências, que vai ficar menor com o aumento de dados de seqüência públicas no futuro.

42 BIOPROSPECÇÃO FUNCIONAL SEQUÊNCIAS
Método de localização, avaliação e exploração sistemática e legal da diversidade da vida de um determinado local, visando a busca de recursos genéticos e bioquímicos para fins comerciais. analises Detecção fenotípica Complementação heteróloga Indução da expressão de gene Vantagens: Maiores chances para descrição de novos compostos INOVAÇÃO Desvantagens: Depende da expressão dos genes analises secuencias Hibridização por sondas Detecção por amplificação (PCR Eficiência superior Similaridade do conhecido Somente descrição de classes funcionais já conhecidas INOVAÇÃO (menor)

43 BIOPROSPECÇÃO Método de localização, avaliação e exploração sistemática e legal da diversidade da vida de um determinado local, visando a busca de recursos genéticos e bioquímicos para fins comerciais. La bioprospección es la búsqueda sistemática, clasificación e investigación para fines comerciales u holísticos de nuevas fuentes de compuestos químicos, genes, proteínas, microorganismos y otros productos con valor económico actual o potencial, que forman parte de la biodiversidad.

44 ESTUDOS ECOLÓGICOS Primeiros estudos Mar de Sargaços
Comunidade complexa Genes desconhecidos Filotipos novos Impossibilidade de sequenciar todos os genomas presentes na amostra Foco na diversidade taxonômica e funcional de comunidades microbianas. Prokaryote: Sargasso Sea (Venter et al 2004) : 1.6 billion base pairs generated estimated to come from 1800 genomic species Abordagens tradicionais Genes marcadores (16S rRNA, recA etc) Un svedberg (símbolo S, a veces Sv) es una unidad no incluida en el SI que se usa en ultracentrifugación Sequenciamento (Sanger, pirosequenciamento) Técnicas de fingerprint (T-RFLP, DGGE) Metagenômica Melhor representação da composição taxonômica Aspectos funcionais

45 Projetos recentes Global Ocean Sampling (GOS)
A Expedição Amostragem Global Ocean (GOS) é um projeto genoma de exploração de oceano com o objetivo de avaliar a diversidade genética em comunidades microbianas marinhos e de compreender o seu papel nos processos fundamentais da natureza. se começou como um projeto de amostragem Mar de Sargaços piloto em agosto de 2003, Craig Venter anunciou a Expedição completa em 4 de março de O projeto, que usou iate pessoal Craig Venter, iniciado em Halifax, Canadá e circum navegou o globo e voltar para os EUA em janeiro de A expedição amostrados água de Halifax, Nova Escócia para o Tropical Oceano Pacífico Oriental, enquanto a realizar um périplo de dois anos. Durante 2007, a amostragem continuou ao longo da costa oeste da América do Norte Fonte:

46 Microorganismos representam mais de 90% da biomassa do oceano, mediam todos os ciclos bioquímicos nos oceanos e são responsáveis ​​por 98% da produção primária no mar. Metagenômica é uma abordagem inovadora de sequenciação para examinar as espécies microbianas de espaço aberto sem a necessidade de isolamento e cultura de laboratório de espécies individuais. All of the Metagenome projects have generated enormous amounts of data that still cannot be assembled or annotated Alves, 2007

47 Projetos recentes A comunidade microbiana do solo é uma mina de ouro para os genes e caminhos que codificam biocatalisadores novas para processos biossintéticos ou biodegradação, incluindo a degradação de poluentes, a síntese de biocombustíveis e produção de novos medicamentos. Seqüenciamento do metagenome solo também irá fornecer conhecimentos sobre a ecologia de microrganismos que são benéficos para, ou ameaçar, a produção agrícola, e que garantam a qualidade ea prestação de serviços ambientais.

48 Projetos recentes Para entender a gama de diversidade genética e fisiológica humana, o microbioma e os fatores que influenciam a distribuição e evolução dos microorganismos constituintes devem ser caracterizada Metagenômica comparativa revelou atributos funcionais do microbioma. Em última instância, o objectivo consiste em associar as diferenças em comunidades com diferenças na função metabólica e / ou doença. Muitos resultados do HMP pode ser previsto: por exemplo, novos marcadores de diagnóstico de saúde, uma farmacopeia século XXI, que inclui membros da microbiota humana e os mensageiros químicos que produzem, e aplicações industriais a partir de enzimas que são produzidas pelo ser humano microbiota e pode processar substratos particulares. Um resultado importante está prevista para ser uma compreensão mais profunda das necessidades nutricionais dos seres humanos

49 Fluxograma comparativo de projetos genoma tradicionais e metagenômicos

50 OBRIGADO!


Carregar ppt "Carla Bartels Francisco M Ulloa Stanojlovic Luis Fábio Batista"

Apresentações semelhantes


Anúncios Google