A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Comparação de Genoma Completo Dilvan Moreira (Baseado em material do prof. André Carvalho)

Apresentações semelhantes


Apresentação em tema: "Comparação de Genoma Completo Dilvan Moreira (Baseado em material do prof. André Carvalho)"— Transcrição da apresentação:

1 Comparação de Genoma Completo Dilvan Moreira (Baseado em material do prof. André Carvalho)

2 Leitura  Introduction to Computational Genomics: A Case Studies Approach  Capítulo 8

3 1/6/2016André de Carvalho - ICMC/USP 3 Conteúdo  Comparação de genomas  Simbiose  Clamídias  Genômica com saco de genes  Sintenia  Distância entre regiões homólogas

4 1/6/2016André de Carvalho - ICMC/USP 4 Introdução  Ser humano tem múltiplas espécies de bactérias vivendo dentro dele  Maioria delas não é prejudicial, representando simbioses (muitas vezes mutualismo) Relação mutuamente vantajosa entre dois ou mais organismos de espécies diferentes Ajudam a digerir alimentos ou nos fornecem vitaminas que não produzimos sozinhos Ex. E. coli recebe nutrientes e produz vitamina K Com sua presença em nosso corpo, previne infecções por outros patógenos

5 1/6/2016André de Carvalho - ICMC/USP 5 Introdução  Existem vários exemplos de relações simbióticas na natureza  Abelhas e flores  Vaca e Anu  Tubarão e rêmora  Fungos e plantas (samambaias, orquídeas)  Pássaro palito e crocodilo

6 1/6/2016André de Carvalho - ICMC/USP 6 Introdução  Muitos simbiontes não são visíveis por viverem dentro de seu hospedeiro  E. coli Ajudam a digestão de seus hospedeiros Se beneficiam por viver no estômago de um organismo móvel  Cupins e tryconinpha Protozoário vivendo em seu aparelho digestivo auxilia na digestão de madeira (produz enzima celulase) Sua principal fonte de nutrientes

7 1/6/2016André de Carvalho - ICMC/USP 7 Introdução  Algumas espécies se instalaram de forma permanente nas células de seus hospedeiros  Tornando-se completamente dependentes para obtenção de seus nutrientes  Durante processo evolutivo, ocorreram grandes mudanças no genoma dessas espécies

8 1/6/2016André de Carvalho - ICMC/USP 8 Introdução  Por que isso ocorre?  Seleção natural não incentiva manutenção da função desses genes Mutações que os destroem são ignoradas  Resultado:  Genomas simbiontes intracelulares são alguns dos menores genomas conhecidos Em tamanho e número de genes

9 1/6/2016André de Carvalho - ICMC/USP 9 Clamídias  Clamídia trachomatis  Bactéria simbionte intracelular dos humanos  Parasita Não traz nenhum benefício ao hospedeiro  Principal causa de doenças sexualmente transmissíveis nos EUA  2 milhões de novas infecções por ano

10 1/6/2016André de Carvalho - ICMC/USP 10 Clamídias  Clamídia trachomatis  Perdeu capacidade de gerar vários produtos bioquímicos Pode viver apenas em células específicas de humanos Não se mantém viva nem em laboratório  Presente no sistema urinário

11 Clamidia trachomatis

12 1/6/2016André de Carvalho - ICMC/USP 12 Clamídias  Clamídia pneumoniae  Bactéria simbionte intracelular dos humanos  Parasita, infecta células do aparelho respiratório superior e inferior Causa pneumonia e bronquite  Possível associação com o processo aterosclerótico em artérias do coração Emdurecida, estreitada e sem elasticidade Isquemia miocárdica

13 1/6/2016André de Carvalho - ICMC/USP 13 Aparelho Respiratório Superior Inferior

14 Aparelho respiratório humano Clamídia pneunomia

15 1/6/2016André de Carvalho - ICMC/USP 15 Clamídias  Ambas C. pneumoniae e C. trachomatis apresentam  Funções metabólicas e bio-sintéticas muito reduzidas  Genoma muito pequeno (ambas têm  1 Mb em tamanho)

16 1/6/2016André de Carvalho - ICMC/USP 16 Clamídias  Seis espécies diferentes já foram completamente sequenciadas  Todas são obrigatoriamente simbionte intracelular Mas nem todas são prejudiciais ao hospedeiro  Apresentam: Pequenas diferenças para número e identidade dos genes perdidos desde ancestral comum  Aparentemente, o modo de vida intracelular da clamídia começou 700 milhões de anos atrás  Com o surgimento dos primeiros organismos eucariotos

17 1/6/2016André de Carvalho - ICMC/USP 17 Clamídias  Mitocôndrias e cloroplastos podem derivar de bactérias simbiontes intracelulares  Perderam tantos genes que se tornaram parte de células eucarióticas  Clamídias  Também têm um relacionamento simbiótico com hospedeiros eucariotos  Parecem estar fortemente relacionadas com os ancestrais dos cloroplastos

18 1/6/2016André de Carvalho - ICMC/USP 18 Comparação de Genomas  Desafios relacionados a comparação de genomas completos  Genoma das espécies de clamídias são utilizados como estudo de casos Pequeno tamanho Taxa relativamente baixa de evolução do genoma  Permite responder questões possível apenas com a comparação completa

19 1/6/2016André de Carvalho - ICMC/USP 19 Comparação de Genomas  Analisa diferenças entre o conjunto completo de genes de dois genomas  Gera novos conhecimentos em:  Evolução de genomas  Função de sequências  Função de genes  Comparação de sequências de DNA usando resolução diferente da usada anteriormente

20 1/6/2016André de Carvalho - ICMC/USP 20 Comparação de Genomas  Variabilidade genética  Na maioria das vezes, devido a polimorfismo de nucleotídeos Inserções, deleções e substituições  Frequentemente, transformações não locais são observadas dentro de e entre espécies  Transferência de longos trechos entre espécies é mais frequente do que se acreditava  20% do genoma da E. coli se deve a transferência horizontal

21 1/6/2016André de Carvalho - ICMC/USP 21 Comparação de Genomas  Rearranjo de sequências pelo embaralhamento dentro de um genoma também é comum  Inversões: um segmento inteiro de DNA é invertido  Transposições: DNA é cortado de um local do genoma e colado em outro (cut and paste)  Cromossomos podem se quebrar e os pedaços podem se re-arranjar em novas combinações  Genomas completos podem ser duplicados, gerando indivíduos poliploides

22 1/6/2016André de Carvalho - ICMC/USP 22 Comparação de Genomas  Conjunto de genes de um genoma pode mudar sem os efeitos drásticos de grandes  Deleções  Duplicações  Transferências horizontais  Simples genes são freqüentemente ganhos ou perdidos por duplicações e deleções em pequena escala

23 1/6/2016André de Carvalho - ICMC/USP 23 Lembrando: Duplicação de Genes  Geralmente resulta na presença de duas cópias do gene original  Uma das quais pode posteriormente mudar de função

24 1/6/2016André de Carvalho - ICMC/USP24 Efeito da Duplicação de Genes Mosca normal Mosca com um par extra de asas Mosca com par antenas transformado em novo par de pernas

25 1/6/2016André de Carvalho - ICMC/USP 25 Deleção de Genes  Pequenas deleções podem tornar genes funcionais pseudogenes  Assim como shift da estrutura  Essa perda de genes é muito comum Genes possuem funções redundantes Mudanças no ambiente tornaram o gene desnecessário  Além do contrário Ganho de genes

26 1/6/2016André de Carvalho - ICMC/USP 26 Comparação de Genomas  Perda e ganho de genes podem resultar em grandes diferenças entre genomas  Número de genes  Papel dos genes nos genomas individuais  Uso da abordagem de genômica com saco de genes

27 1/6/2016André de Carvalho - ICMC/USP 27 Genômica com Saco de Genes  Variedade de re-arranjos devido à evolução dificulta alinhamento de dois genomas  Inversões, transposições, duplicações,...  Boa parte das variações: Não trarão informações relevantes Serão de difícil interpretação  Na maioria das vezes, alinhamento não será possível

28 1/6/2016André de Carvalho - ICMC/USP 28 Genômica com Saco de Genes InversãoTransposiçãoDuplicaçãoDeleção Alinhamento do genoma completo não funciona ACTTTTTGG GAC ACTTTTTGGTATATACATGTAAATAATCGAACCCCCGGACGGG AAATAATCG AACCCCGCATGTGGG TATATACATGT

29 1/6/2016André de Carvalho - ICMC/USP 29 Genômica com Saco de Genes InversãoTransposiçãoDuplicaçãoDeleção  Divisão em novos cromossomos  Embaralhamento de genes entre os cromossomos ACTTTTTGG GAC ACTTTTTGGTATATACATGTAAATAATCGAACCCCCGGACGGG AAATAATCG AACCCCGCATGTGGG TATATACATGT

30 1/6/2016André de Carvalho - ICMC/USP 30 Genômica com Saco de Genes  Comparação de genomas completos não funciona  Abordagem mais gerenciável e informativa:  Comparação dos genes individuais de cada genoma Quebrar os genomas em pedaços (genes) Combinar as comparações dos pedaços

31 1/6/2016André de Carvalho - ICMC/USP 31 Genômica com Saco de Genes  Comparação de dois genomas  Encontrar genes que estão presentes em ambos  Usar ORF-finder com threshold de 100 codons  Ex.: OrganismoTamanhoORFs C. trachomatis 1 042 519916 C. pneumonia1 229 853 1048 E. coli-5000

32 1/6/2016André de Carvalho - ICMC/USP 32 Genômica com Saco de Genes  Para descobrir genes e vias que foram perdidos na evolução da clamídia:  Identificar os genes em cada espécie  CP e CT perderam vários genes Parasitam no hospedeiro e roubam produtos de seus genes Espera-se processos biológicos diferentes para vida nos sistemas respiratório e urinário Diferença nos genomas pode identificar a função dos genes remanescentes

33 1/6/2016André de Carvalho - ICMC/USP 33 Genômica com Saco de Genes  Qual o método mais adequado para comparar genes ganhos e perdidos?  Identificar genes em cada genoma e calcular similaridade aos demais genes  Informação sobre similaridade entre todos os pares de genes é necessário para: Estudar substituições de nucleotídeos entre genes ortólogos Encontrar blocos de genes com ordem conservada Analisar mudanças no tamanho das famílias de genes

34 1/6/2016André de Carvalho - ICMC/USP 34 Genômica com Saco de Genes  Para gerar escores de similaridade  Utilizar seqüência de aminoácidos de todos os genes de ambos os genomas  Criar matriz n x m com valor de alinhamento entre cada par de genes Algoritmo NW pode ser usado, normalizando o resultado pelo tamanho das seqüências Para seqüências maiores, usar algoritmos mais rápidos, mas menos precisos (BLAST)

35 1/6/2016André de Carvalho - ICMC/USP 35 Genômica com Saco de Genes  Duplicações podem gerar grandes famílias de genes relacionados  Relacionamento entre esses genes homólogos pode ser bastante complexo  Dois principais tipos de relacionamento: Parálogos Ortólogos  Matriz pode ser usada para distinguir genes parálogos e ortólogos

36 1/6/2016André de Carvalho - ICMC/USP 36 Genômica com Saco de Genes  Parálogos:  Genes que surgem da duplicação e posterior especialização  Todos os genes em uma família de genes de um mesmo genoma  Ortólogos  Genes não estão relacionados por duplicação, apenas por especialização  Usado para estimar número de substituições E tempo entre espécies para reconstruir árvores filogenéticas

37 1/6/2016André de Carvalho - ICMC/USP 37 Identificação de Ortólogos  BRHs (Best Reciprocal Hits)  Melhor similaridade recíproca  Método mais comum  Par de ORFs é BRH se cada uma é o melhor casamento para a outra ORF pode não pertencer a nenhum par BHR ORF pode ter ortólogo em outra espécie e parálogo no mesmo genoma

38 1/6/2016André de Carvalho - ICMC/USP 38 Identificação de Ortólogos  Matriz de similaridade  BRH  ortólogos  Usando threshold igual a 100 codons  1964 ORFs (916 CT e 1048 CP) 728 pares ortólogos 126 pares parálogos (56 CT e 70 CP) Pares de parálogos encontrados são mais similares entre si que pares de ortólogos Resultado da duplicação de genes depois que as espécies se dividem 253 ORFS restantes podem ser parálogos ou genes mais antigos perdidos na outra espécie pela especialização

39 1/6/2016André de Carvalho - ICMC/USP 39 Identificação de Famílias de Genes  A principio, todos os genes têm um ancestral comum e são da mesma família  Família: grupo de genes relacionados que provavelmente têm funções semelhantes  Possui um ancestral comum que é relativamente recente  Não existe regra objetiva  Regra usada: genes pertencem a uma mesma família se têm identidade  50% Dependendo das espécies onde são encontrados, esses genes são considerados parálogos ou ortólogos

40 1/6/2016André de Carvalho - ICMC/USP 40 Identificação de Famílias de Genes  Mudanças no tamanho de família de genes são úteis para estudar função e evolução de genes  Expansão e contração de famílias de genes ajuda a determinar diferença entre espécies  Identificação de famílias de genes equivalentes entre genomas  Agrupar todos os genes, independentemente do genoma  Após definir clusters (famílias), contar número de gene em cada família que veio de cada genoma

41 1/6/2016André de Carvalho - ICMC/USP 41 Identificação de Famílias de Genes  Algoritmo de clustering hierárquico  Utiliza matriz de similaridade para definir distância entre genes Algoritmo NJ ou UPGMA  Clusters encontrados dependem dos valores dos parâmetros do algoritmo

42 1/6/2016André de Carvalho - ICMC/USP 42 Identificação de Famílias de Genes Grande número de famílias pequenas e pequeno número de famílias grandes

43 1/6/2016André de Carvalho - ICMC/USP 43 Identificação de Famílias de Genes  As maiores famílias encontradas para CT e CP foram: CTCPFunção 12 12Transportadores ABC 6 15Família G de proteínas da membrana externa 910Desconhecida

44 1/6/2016André de Carvalho - ICMC/USP 44 Identificação de Famílias de Genes  Transformadores ABC são proteínas trans-membranas com região de ligação em ambos os sítios  ATP-binding cassette  Têm um papel importante no transporte para dentro e fora da célula Todas as células adquirem moléculas e íons que precisam do ambiente externo através da membrana  Muito antigas, são quase idênticas em todos os organismos  Família inclui mais de 30 proteínas

45 1/6/2016André de Carvalho - ICMC/USP 45 Identificação de Famílias de Genes

46 1/6/2016André de Carvalho - ICMC/USP 46 Identificação de Famílias de Genes  Abordgens alternativas para encontrar genes ortólogos entre espécies  Construção de árvore filogenético com todos os genes em uma família de ambas as espécies Espera-se que ortólogos um-a-um apareceriam como irmãos nos nós folha Uma vez que esses genes são separados apenas por um evento de especialização entre os dois genomas comparados Mais confiável, porém mais difícil automação

47 1/6/2016André de Carvalho - ICMC/USP 47 Sintenia  Ordem relativa dos genes nos mesmos cromossomos  Origem grega: syn = juntos, taenia = fita  Uma vez os genes ortólogos tenham sido identificados  Examinar mudanças em sua posição física em cromossomos com o passar do tempo  Observar se relacionamentos sintênicos são preservados entre espécies

48 1/6/2016André de Carvalho - ICMC/USP 48 Sintenia  Relacionamentos sintêmicos são, em geral, embaralhados por:  Inversões  Transposições  Ruídos podem ser adicionados ao estudo de sintenia por causa de:  Deleções  Duplicações  Inserções

49 1/6/2016André de Carvalho - ICMC/USP 49 Sintenia  Mesmo assim, é geralmente fácil identificar blocos de sintenia  Longos trechos em que a ordem relativa de genes ortólogos tem sido preservada  Encontrar blocos de sintenia é importante para: Anotação de seqüências não codificadoras Definir regiões intergênicas homólogas Que podem ter pouca ou nenhuma similaridade Nunca seriam identificadas por alinhamento

50 1/6/2016André de Carvalho - ICMC/USP 50 Visualização de Sintenia  Uma forma fácil de estudar sintenia é por meio de um gráfico de pontos  Geralmente são marcados apenas os pares cuja similaridade supera um threhold Sintenia quase completa Inversões Transposições

51 1/6/2016André de Carvalho - ICMC/USP 51 Sintenia para três espécies de clamídia: C.trachomatis X C.muridarum C.pneumoniae X C.caviae C.muridarum X C.caviae Clamídia apresenta elevado nível de conservação na posição dos genes

52 1/6/2016André de Carvalho - ICMC/USP 52 Blocos sintenicos nonservados no ser humano e no gato

53 1/6/2016André de Carvalho - ICMC/USP 53 Sintenia  Detecção de blocos sintênicos ajuda a identificar regiões intergênicas homólogas  Essas regiões geralmente evoluem mais rapidamente que o resto do genoma Mais difícil de alinhar e atribuir homologia  Genes são usados como âncoras Para garantir que regiões intergênicas examinadas são homólogas Permite examinar evolução dessas seqüências

54 1/6/2016André de Carvalho - ICMC/USP 54 Sintenia  Existem regiões não codificadores de proteínas que são conservadas  Trechos que são transcritos em RNA  Seqüências regulatórias  Pegada filogenética  Ancorar alinhamento com regiões sintênicas codificadoras Facilita encontrar sequencias curtas que são conservadas em trechos não codificadores de DNA

55 1/6/2016André de Carvalho - ICMC/USP 55 Sintenia  Pegada filogenética tem sido usada para:  Encontrar sequencias regulatórias conservadas  Regiões codificadoras  Exemplo  Análise de região com  3500 bp com 3 ORFs preservando sintenia entre 2 espécies

56 ORF CT672 CP1950 ORF CT671- CP1949 ORF CT673- CP1951 Regiões intergênicas

57 1/6/2016André de Carvalho - ICMC/USP 57 Métrica para Distância Sintenica  Blocos sistêmicos são re-arranjados por inversões ou transposições entre dois genomas  Alinhamento de pares não funciona  Objetivo é calcular número de re-arranjos genômicos que separam duas espécies Não no número de nucleotídeos diferentes  Encontrar menor número de inversões que levam de um genoma para o outro  Incluir transposição complica muito o problema

58 1/6/2016André de Carvalho - ICMC/USP 58 Métrica para Distância Sintenica  Encontrar menor número de inversões que levam de um genoma para o outro  Strings de ORFs  Regiões homólogas não codificadoras  Ordenação por inversão Várias possíveis séries de inversões entre suas sequencias com mesma distância Diferente seqüência de inversões

59 1/6/2016André de Carvalho - ICMC/USP 59 Algoritmo Guloso 1 Designar uma das seqüências como padrão (s); Inversões serão aplicadas apenas à outra seqüência (t); 2 Começar de uma extremidade da seqüência padrão e mover até encontrar posição onde os símbolos são diferentes, s i  t i ; 3Realizar as inversões necessárias para que o símbolo em t j case com o símbolo em s j. Quando isso ocorrer, inverter t i :t j ; 4Continuar movimento ao longo da seqüência aplicando inversões quando necessário até que todos os símbolos casem

60 1/6/2016André de Carvalho - ICMC/USP 60 Exemplo Padrão: 1 2 3 4 5 6 7 8 9 Não padrão: 1 2 4 3 5 8 7 9 6 Inverteu 3 e 4: 1 2 3 4 5 8 7 9 6 Inverteu 8, 7, 9 e 61 2 3 4 5 6 9 7 8 Inverteu 9 e 71 2 3 4 5 6 7 9 8 Inverteu 9 e 81 2 3 4 5 6 7 9 8 4 inversões

61 1/6/2016André de Carvalho - ICMC/USP 61 Análise do Resultado  Ocorreram 4 operações de inversão  Distância de inversão = 4  Se operações fossem realizadas na sequência padrão, distância seria 3  Algoritmo não gera distância mínima quando inversões se sobrepõem Outros algoritmos fornecem estimativas melhores Com maior complexidade computacional

62 1/6/2016André de Carvalho - ICMC/USP 62 Conclusão  Comparação de genomas  Clamídias  Genômica com saco de genes  Sintenia  Distância entre regiões homólogas

63 1/6/2016André de Carvalho - ICMC/USP 63 Identificação de Famílias de Genes ABC transport ATP-binding cassette Perfil de hidrofobicidade

64 Perguntas?


Carregar ppt "Comparação de Genoma Completo Dilvan Moreira (Baseado em material do prof. André Carvalho)"

Apresentações semelhantes


Anúncios Google