Carregar apresentação
A apresentação está carregando. Por favor, espere
PublicouDanilo Barreiro Castilho Alterado mais de 8 anos atrás
1
Comparação de Genoma Completo Dilvan Moreira (Baseado em material do prof. André Carvalho)
2
Leitura Introduction to Computational Genomics: A Case Studies Approach Capítulo 8
3
1/6/2016André de Carvalho - ICMC/USP 3 Conteúdo Comparação de genomas Simbiose Clamídias Genômica com saco de genes Sintenia Distância entre regiões homólogas
4
1/6/2016André de Carvalho - ICMC/USP 4 Introdução Ser humano tem múltiplas espécies de bactérias vivendo dentro dele Maioria delas não é prejudicial, representando simbioses (muitas vezes mutualismo) Relação mutuamente vantajosa entre dois ou mais organismos de espécies diferentes Ajudam a digerir alimentos ou nos fornecem vitaminas que não produzimos sozinhos Ex. E. coli recebe nutrientes e produz vitamina K Com sua presença em nosso corpo, previne infecções por outros patógenos
5
1/6/2016André de Carvalho - ICMC/USP 5 Introdução Existem vários exemplos de relações simbióticas na natureza Abelhas e flores Vaca e Anu Tubarão e rêmora Fungos e plantas (samambaias, orquídeas) Pássaro palito e crocodilo
6
1/6/2016André de Carvalho - ICMC/USP 6 Introdução Muitos simbiontes não são visíveis por viverem dentro de seu hospedeiro E. coli Ajudam a digestão de seus hospedeiros Se beneficiam por viver no estômago de um organismo móvel Cupins e tryconinpha Protozoário vivendo em seu aparelho digestivo auxilia na digestão de madeira (produz enzima celulase) Sua principal fonte de nutrientes
7
1/6/2016André de Carvalho - ICMC/USP 7 Introdução Algumas espécies se instalaram de forma permanente nas células de seus hospedeiros Tornando-se completamente dependentes para obtenção de seus nutrientes Durante processo evolutivo, ocorreram grandes mudanças no genoma dessas espécies
8
1/6/2016André de Carvalho - ICMC/USP 8 Introdução Por que isso ocorre? Seleção natural não incentiva manutenção da função desses genes Mutações que os destroem são ignoradas Resultado: Genomas simbiontes intracelulares são alguns dos menores genomas conhecidos Em tamanho e número de genes
9
1/6/2016André de Carvalho - ICMC/USP 9 Clamídias Clamídia trachomatis Bactéria simbionte intracelular dos humanos Parasita Não traz nenhum benefício ao hospedeiro Principal causa de doenças sexualmente transmissíveis nos EUA 2 milhões de novas infecções por ano
10
1/6/2016André de Carvalho - ICMC/USP 10 Clamídias Clamídia trachomatis Perdeu capacidade de gerar vários produtos bioquímicos Pode viver apenas em células específicas de humanos Não se mantém viva nem em laboratório Presente no sistema urinário
11
Clamidia trachomatis
12
1/6/2016André de Carvalho - ICMC/USP 12 Clamídias Clamídia pneumoniae Bactéria simbionte intracelular dos humanos Parasita, infecta células do aparelho respiratório superior e inferior Causa pneumonia e bronquite Possível associação com o processo aterosclerótico em artérias do coração Emdurecida, estreitada e sem elasticidade Isquemia miocárdica
13
1/6/2016André de Carvalho - ICMC/USP 13 Aparelho Respiratório Superior Inferior
14
Aparelho respiratório humano Clamídia pneunomia
15
1/6/2016André de Carvalho - ICMC/USP 15 Clamídias Ambas C. pneumoniae e C. trachomatis apresentam Funções metabólicas e bio-sintéticas muito reduzidas Genoma muito pequeno (ambas têm 1 Mb em tamanho)
16
1/6/2016André de Carvalho - ICMC/USP 16 Clamídias Seis espécies diferentes já foram completamente sequenciadas Todas são obrigatoriamente simbionte intracelular Mas nem todas são prejudiciais ao hospedeiro Apresentam: Pequenas diferenças para número e identidade dos genes perdidos desde ancestral comum Aparentemente, o modo de vida intracelular da clamídia começou 700 milhões de anos atrás Com o surgimento dos primeiros organismos eucariotos
17
1/6/2016André de Carvalho - ICMC/USP 17 Clamídias Mitocôndrias e cloroplastos podem derivar de bactérias simbiontes intracelulares Perderam tantos genes que se tornaram parte de células eucarióticas Clamídias Também têm um relacionamento simbiótico com hospedeiros eucariotos Parecem estar fortemente relacionadas com os ancestrais dos cloroplastos
18
1/6/2016André de Carvalho - ICMC/USP 18 Comparação de Genomas Desafios relacionados a comparação de genomas completos Genoma das espécies de clamídias são utilizados como estudo de casos Pequeno tamanho Taxa relativamente baixa de evolução do genoma Permite responder questões possível apenas com a comparação completa
19
1/6/2016André de Carvalho - ICMC/USP 19 Comparação de Genomas Analisa diferenças entre o conjunto completo de genes de dois genomas Gera novos conhecimentos em: Evolução de genomas Função de sequências Função de genes Comparação de sequências de DNA usando resolução diferente da usada anteriormente
20
1/6/2016André de Carvalho - ICMC/USP 20 Comparação de Genomas Variabilidade genética Na maioria das vezes, devido a polimorfismo de nucleotídeos Inserções, deleções e substituições Frequentemente, transformações não locais são observadas dentro de e entre espécies Transferência de longos trechos entre espécies é mais frequente do que se acreditava 20% do genoma da E. coli se deve a transferência horizontal
21
1/6/2016André de Carvalho - ICMC/USP 21 Comparação de Genomas Rearranjo de sequências pelo embaralhamento dentro de um genoma também é comum Inversões: um segmento inteiro de DNA é invertido Transposições: DNA é cortado de um local do genoma e colado em outro (cut and paste) Cromossomos podem se quebrar e os pedaços podem se re-arranjar em novas combinações Genomas completos podem ser duplicados, gerando indivíduos poliploides
22
1/6/2016André de Carvalho - ICMC/USP 22 Comparação de Genomas Conjunto de genes de um genoma pode mudar sem os efeitos drásticos de grandes Deleções Duplicações Transferências horizontais Simples genes são freqüentemente ganhos ou perdidos por duplicações e deleções em pequena escala
23
1/6/2016André de Carvalho - ICMC/USP 23 Lembrando: Duplicação de Genes Geralmente resulta na presença de duas cópias do gene original Uma das quais pode posteriormente mudar de função
24
1/6/2016André de Carvalho - ICMC/USP24 Efeito da Duplicação de Genes Mosca normal Mosca com um par extra de asas Mosca com par antenas transformado em novo par de pernas
25
1/6/2016André de Carvalho - ICMC/USP 25 Deleção de Genes Pequenas deleções podem tornar genes funcionais pseudogenes Assim como shift da estrutura Essa perda de genes é muito comum Genes possuem funções redundantes Mudanças no ambiente tornaram o gene desnecessário Além do contrário Ganho de genes
26
1/6/2016André de Carvalho - ICMC/USP 26 Comparação de Genomas Perda e ganho de genes podem resultar em grandes diferenças entre genomas Número de genes Papel dos genes nos genomas individuais Uso da abordagem de genômica com saco de genes
27
1/6/2016André de Carvalho - ICMC/USP 27 Genômica com Saco de Genes Variedade de re-arranjos devido à evolução dificulta alinhamento de dois genomas Inversões, transposições, duplicações,... Boa parte das variações: Não trarão informações relevantes Serão de difícil interpretação Na maioria das vezes, alinhamento não será possível
28
1/6/2016André de Carvalho - ICMC/USP 28 Genômica com Saco de Genes InversãoTransposiçãoDuplicaçãoDeleção Alinhamento do genoma completo não funciona ACTTTTTGG GAC ACTTTTTGGTATATACATGTAAATAATCGAACCCCCGGACGGG AAATAATCG AACCCCGCATGTGGG TATATACATGT
29
1/6/2016André de Carvalho - ICMC/USP 29 Genômica com Saco de Genes InversãoTransposiçãoDuplicaçãoDeleção Divisão em novos cromossomos Embaralhamento de genes entre os cromossomos ACTTTTTGG GAC ACTTTTTGGTATATACATGTAAATAATCGAACCCCCGGACGGG AAATAATCG AACCCCGCATGTGGG TATATACATGT
30
1/6/2016André de Carvalho - ICMC/USP 30 Genômica com Saco de Genes Comparação de genomas completos não funciona Abordagem mais gerenciável e informativa: Comparação dos genes individuais de cada genoma Quebrar os genomas em pedaços (genes) Combinar as comparações dos pedaços
31
1/6/2016André de Carvalho - ICMC/USP 31 Genômica com Saco de Genes Comparação de dois genomas Encontrar genes que estão presentes em ambos Usar ORF-finder com threshold de 100 codons Ex.: OrganismoTamanhoORFs C. trachomatis 1 042 519916 C. pneumonia1 229 853 1048 E. coli-5000
32
1/6/2016André de Carvalho - ICMC/USP 32 Genômica com Saco de Genes Para descobrir genes e vias que foram perdidos na evolução da clamídia: Identificar os genes em cada espécie CP e CT perderam vários genes Parasitam no hospedeiro e roubam produtos de seus genes Espera-se processos biológicos diferentes para vida nos sistemas respiratório e urinário Diferença nos genomas pode identificar a função dos genes remanescentes
33
1/6/2016André de Carvalho - ICMC/USP 33 Genômica com Saco de Genes Qual o método mais adequado para comparar genes ganhos e perdidos? Identificar genes em cada genoma e calcular similaridade aos demais genes Informação sobre similaridade entre todos os pares de genes é necessário para: Estudar substituições de nucleotídeos entre genes ortólogos Encontrar blocos de genes com ordem conservada Analisar mudanças no tamanho das famílias de genes
34
1/6/2016André de Carvalho - ICMC/USP 34 Genômica com Saco de Genes Para gerar escores de similaridade Utilizar seqüência de aminoácidos de todos os genes de ambos os genomas Criar matriz n x m com valor de alinhamento entre cada par de genes Algoritmo NW pode ser usado, normalizando o resultado pelo tamanho das seqüências Para seqüências maiores, usar algoritmos mais rápidos, mas menos precisos (BLAST)
35
1/6/2016André de Carvalho - ICMC/USP 35 Genômica com Saco de Genes Duplicações podem gerar grandes famílias de genes relacionados Relacionamento entre esses genes homólogos pode ser bastante complexo Dois principais tipos de relacionamento: Parálogos Ortólogos Matriz pode ser usada para distinguir genes parálogos e ortólogos
36
1/6/2016André de Carvalho - ICMC/USP 36 Genômica com Saco de Genes Parálogos: Genes que surgem da duplicação e posterior especialização Todos os genes em uma família de genes de um mesmo genoma Ortólogos Genes não estão relacionados por duplicação, apenas por especialização Usado para estimar número de substituições E tempo entre espécies para reconstruir árvores filogenéticas
37
1/6/2016André de Carvalho - ICMC/USP 37 Identificação de Ortólogos BRHs (Best Reciprocal Hits) Melhor similaridade recíproca Método mais comum Par de ORFs é BRH se cada uma é o melhor casamento para a outra ORF pode não pertencer a nenhum par BHR ORF pode ter ortólogo em outra espécie e parálogo no mesmo genoma
38
1/6/2016André de Carvalho - ICMC/USP 38 Identificação de Ortólogos Matriz de similaridade BRH ortólogos Usando threshold igual a 100 codons 1964 ORFs (916 CT e 1048 CP) 728 pares ortólogos 126 pares parálogos (56 CT e 70 CP) Pares de parálogos encontrados são mais similares entre si que pares de ortólogos Resultado da duplicação de genes depois que as espécies se dividem 253 ORFS restantes podem ser parálogos ou genes mais antigos perdidos na outra espécie pela especialização
39
1/6/2016André de Carvalho - ICMC/USP 39 Identificação de Famílias de Genes A principio, todos os genes têm um ancestral comum e são da mesma família Família: grupo de genes relacionados que provavelmente têm funções semelhantes Possui um ancestral comum que é relativamente recente Não existe regra objetiva Regra usada: genes pertencem a uma mesma família se têm identidade 50% Dependendo das espécies onde são encontrados, esses genes são considerados parálogos ou ortólogos
40
1/6/2016André de Carvalho - ICMC/USP 40 Identificação de Famílias de Genes Mudanças no tamanho de família de genes são úteis para estudar função e evolução de genes Expansão e contração de famílias de genes ajuda a determinar diferença entre espécies Identificação de famílias de genes equivalentes entre genomas Agrupar todos os genes, independentemente do genoma Após definir clusters (famílias), contar número de gene em cada família que veio de cada genoma
41
1/6/2016André de Carvalho - ICMC/USP 41 Identificação de Famílias de Genes Algoritmo de clustering hierárquico Utiliza matriz de similaridade para definir distância entre genes Algoritmo NJ ou UPGMA Clusters encontrados dependem dos valores dos parâmetros do algoritmo
42
1/6/2016André de Carvalho - ICMC/USP 42 Identificação de Famílias de Genes Grande número de famílias pequenas e pequeno número de famílias grandes
43
1/6/2016André de Carvalho - ICMC/USP 43 Identificação de Famílias de Genes As maiores famílias encontradas para CT e CP foram: CTCPFunção 12 12Transportadores ABC 6 15Família G de proteínas da membrana externa 910Desconhecida
44
1/6/2016André de Carvalho - ICMC/USP 44 Identificação de Famílias de Genes Transformadores ABC são proteínas trans-membranas com região de ligação em ambos os sítios ATP-binding cassette Têm um papel importante no transporte para dentro e fora da célula Todas as células adquirem moléculas e íons que precisam do ambiente externo através da membrana Muito antigas, são quase idênticas em todos os organismos Família inclui mais de 30 proteínas
45
1/6/2016André de Carvalho - ICMC/USP 45 Identificação de Famílias de Genes
46
1/6/2016André de Carvalho - ICMC/USP 46 Identificação de Famílias de Genes Abordgens alternativas para encontrar genes ortólogos entre espécies Construção de árvore filogenético com todos os genes em uma família de ambas as espécies Espera-se que ortólogos um-a-um apareceriam como irmãos nos nós folha Uma vez que esses genes são separados apenas por um evento de especialização entre os dois genomas comparados Mais confiável, porém mais difícil automação
47
1/6/2016André de Carvalho - ICMC/USP 47 Sintenia Ordem relativa dos genes nos mesmos cromossomos Origem grega: syn = juntos, taenia = fita Uma vez os genes ortólogos tenham sido identificados Examinar mudanças em sua posição física em cromossomos com o passar do tempo Observar se relacionamentos sintênicos são preservados entre espécies
48
1/6/2016André de Carvalho - ICMC/USP 48 Sintenia Relacionamentos sintêmicos são, em geral, embaralhados por: Inversões Transposições Ruídos podem ser adicionados ao estudo de sintenia por causa de: Deleções Duplicações Inserções
49
1/6/2016André de Carvalho - ICMC/USP 49 Sintenia Mesmo assim, é geralmente fácil identificar blocos de sintenia Longos trechos em que a ordem relativa de genes ortólogos tem sido preservada Encontrar blocos de sintenia é importante para: Anotação de seqüências não codificadoras Definir regiões intergênicas homólogas Que podem ter pouca ou nenhuma similaridade Nunca seriam identificadas por alinhamento
50
1/6/2016André de Carvalho - ICMC/USP 50 Visualização de Sintenia Uma forma fácil de estudar sintenia é por meio de um gráfico de pontos Geralmente são marcados apenas os pares cuja similaridade supera um threhold Sintenia quase completa Inversões Transposições
51
1/6/2016André de Carvalho - ICMC/USP 51 Sintenia para três espécies de clamídia: C.trachomatis X C.muridarum C.pneumoniae X C.caviae C.muridarum X C.caviae Clamídia apresenta elevado nível de conservação na posição dos genes
52
1/6/2016André de Carvalho - ICMC/USP 52 Blocos sintenicos nonservados no ser humano e no gato
53
1/6/2016André de Carvalho - ICMC/USP 53 Sintenia Detecção de blocos sintênicos ajuda a identificar regiões intergênicas homólogas Essas regiões geralmente evoluem mais rapidamente que o resto do genoma Mais difícil de alinhar e atribuir homologia Genes são usados como âncoras Para garantir que regiões intergênicas examinadas são homólogas Permite examinar evolução dessas seqüências
54
1/6/2016André de Carvalho - ICMC/USP 54 Sintenia Existem regiões não codificadores de proteínas que são conservadas Trechos que são transcritos em RNA Seqüências regulatórias Pegada filogenética Ancorar alinhamento com regiões sintênicas codificadoras Facilita encontrar sequencias curtas que são conservadas em trechos não codificadores de DNA
55
1/6/2016André de Carvalho - ICMC/USP 55 Sintenia Pegada filogenética tem sido usada para: Encontrar sequencias regulatórias conservadas Regiões codificadoras Exemplo Análise de região com 3500 bp com 3 ORFs preservando sintenia entre 2 espécies
56
ORF CT672 CP1950 ORF CT671- CP1949 ORF CT673- CP1951 Regiões intergênicas
57
1/6/2016André de Carvalho - ICMC/USP 57 Métrica para Distância Sintenica Blocos sistêmicos são re-arranjados por inversões ou transposições entre dois genomas Alinhamento de pares não funciona Objetivo é calcular número de re-arranjos genômicos que separam duas espécies Não no número de nucleotídeos diferentes Encontrar menor número de inversões que levam de um genoma para o outro Incluir transposição complica muito o problema
58
1/6/2016André de Carvalho - ICMC/USP 58 Métrica para Distância Sintenica Encontrar menor número de inversões que levam de um genoma para o outro Strings de ORFs Regiões homólogas não codificadoras Ordenação por inversão Várias possíveis séries de inversões entre suas sequencias com mesma distância Diferente seqüência de inversões
59
1/6/2016André de Carvalho - ICMC/USP 59 Algoritmo Guloso 1 Designar uma das seqüências como padrão (s); Inversões serão aplicadas apenas à outra seqüência (t); 2 Começar de uma extremidade da seqüência padrão e mover até encontrar posição onde os símbolos são diferentes, s i t i ; 3Realizar as inversões necessárias para que o símbolo em t j case com o símbolo em s j. Quando isso ocorrer, inverter t i :t j ; 4Continuar movimento ao longo da seqüência aplicando inversões quando necessário até que todos os símbolos casem
60
1/6/2016André de Carvalho - ICMC/USP 60 Exemplo Padrão: 1 2 3 4 5 6 7 8 9 Não padrão: 1 2 4 3 5 8 7 9 6 Inverteu 3 e 4: 1 2 3 4 5 8 7 9 6 Inverteu 8, 7, 9 e 61 2 3 4 5 6 9 7 8 Inverteu 9 e 71 2 3 4 5 6 7 9 8 Inverteu 9 e 81 2 3 4 5 6 7 9 8 4 inversões
61
1/6/2016André de Carvalho - ICMC/USP 61 Análise do Resultado Ocorreram 4 operações de inversão Distância de inversão = 4 Se operações fossem realizadas na sequência padrão, distância seria 3 Algoritmo não gera distância mínima quando inversões se sobrepõem Outros algoritmos fornecem estimativas melhores Com maior complexidade computacional
62
1/6/2016André de Carvalho - ICMC/USP 62 Conclusão Comparação de genomas Clamídias Genômica com saco de genes Sintenia Distância entre regiões homólogas
63
1/6/2016André de Carvalho - ICMC/USP 63 Identificação de Famílias de Genes ABC transport ATP-binding cassette Perfil de hidrofobicidade
64
Perguntas?
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.