Como o genoma humano foi sequenciado

Slides:



Advertisements
Apresentações semelhantes
Instituto de Computação
Advertisements

Organização Gênica de Eucariotos
PROJETOS GENOMA E PROTEOMA HUMANOS
Laboratório de Neurociências
SNPs e suas aplicações Karine Begnini Doutoranda em Biotecnologia
Organização Gênica de Eucariotos
Cenário evolutivo.
Introdução à Bioinformática
ESTIMAÇÃO.
Biotecnologia.
PROJETO GENOMA HUMANO E ÉTICA
Sequenciamento inicial e análises do genoma humano
Computação Evolutiva: Programação Genética
Inteligência Artificial
Principios de Genética Microbiana
VACINAS.
VACINAS.
Simulação de Sistemas Prof. MSc Sofia Mara de Souza AULA2.
Genômica É a caracterização de genomas inteiros. Tenta compreender a organização molecular e as informações que ela traz.
Transmissão Genética Agentes Responsáveis.
Polimorfismos de nucleotídeos únicos em espécies poliplóides
[Clayton J Pereira] [Leonilson Kiyoshi] [Prof. Dr. Vitor Leite]
Fundamentos de Engenharia de SW
ÁCIDO DESOXIRRIBONUCLEICO
Genômica e Proteômica 1) Genômica Estrutural O que é Genômica ?
Genómica Licenciatura em Ciências Biomédicas Departamento de Ciências da Saúde, UCP Fevereiro 2013.
EQUILÍBRIO DE HARDY-WEIMBERG
GENÉTICA DE POPULAÇÕES.
Engenharia Genética.
A REVOLUÇÃO DA GENÉTICA
Profa. Ana Paula Miranda Guimarães
Biotecnologia (I).
Regressão Múltipla Profas: Gardênia da Silva Abbad Elaine Rabelo Neiva
A genética e os genes.
Introdução à Estatística
Matriz de Referência de Ciências da Natureza
Hereditariedade.
Influências genéticas e ambientais
Nome : Kauany Souza n°: 12 Colégio da Policia Militar
GENÉTICA Aula 7: Fundamentos das Tecnologias do DNA Recombinante
Química Pablo Felipe Profª. Carol
Aplicações Estatísticas uma rápida abordagem
Fontes de Erros Aula 1 Introdução; Erros em processos numéricos;
Gestão de defeitos.
MUTAÇÕES GÊNICAS E CROMOSSÔMICAS
Prevenção.
Química na Medicina O que a química influência na medicina ?
Ácido Desoxirribonucleico. Composto orgânico cujas moléculas contêm as instruções genéticas que coordenam o desenvolvimento e funcionamento de todos os.
Neoplasia.
Sequenciamento de Genomas
Prof. Alan Alencar Biotecnologia.
Aula 6. Delineamento amostral
Aplicações em Redes Neurais Artificiais De acordo com Turbam, McLean e Wetherbe (2004), “a computação neural também pode ser combinada com outros sistemas.
ALTERAÇÃO NO NÍVEL MOLECULAR DO DNA PROFA. GISELLE MOURA MESSIAS
Estatística Descritiva
Ana Luiza Telles Leal 24/05/2010
FERRAMENTAS DE ANÁLISE MOLECULAR
Ligação, Recombinação e Mapas Genéticos
Computação Evolutiva Nome dado ao estudo de algoritmos cuja inspiração é o processo de evolução natural das espécies. Origem: trabalho de um pesquisador.
Carine Moreira Avaliador: Abadio de Oliveira da Costa BTC Biologia Molecular e Métodos Analíticos.
MEDICINA GENÔMICA Prof. MSc. Hélio Alves.
Transferência da Informação Biológica
ANÁLISE EM LARGA ESCALA DE EXPRESSÃO GÊNICA DIFERENCIAL ENTRE DIVERSAS
Indicadores antropométricos do estado nutricional
SHEILA FERREIRA RAQUEL GERALDI LAIS PRESOTTO. É a transferência de material genético com o propósito de prevenir ou curar uma enfermidade qualquer. No.
RASTREIOS DE MASSA (SCREENING). EXAME ESPECÍFICO DOS MEMBROS DE UMA POPULAÇÃO, DESTINADO A IDENTIFICAR OS FACTORES DE RISCO OU DOENÇA NUMA FASE PRÉ- SINTOMÁTICA.
Materiais e Métodos. Por que : materiais e métodos? Para que o leitor entenda o que foi feito Para que outros possam repetir o seu estudo Para validar.
Vetores de entrada para clonagem gênica Os plasmídios devem possuir uma região designada origem de replicação (ORI), que é essencial para a sua replicação.
 Dengue  Hipertensão  5 diferenças Traumatismos (acidentes/violências) Doenças genéticas Doenças relacionadas à assistência da gestação e parto Deficiências/carências.
Transcrição da apresentação:

Como o genoma humano foi sequenciado Elisa Mota Filipe Dutra Frederico Kremer Rafael Woloski Vinícius da Rosa

Por que seqüenciar o genoma humano? Determinar as possíveis causas para doenças genéticas Desenvolver terapias gênicas Obesidade Hipertensão Diabetes

Histórico 1984: Cientistas se reúnem em Utah para debater sobre as maneiras de identificar mutações dos sobreviventes às bombas atômicas de Hiroshima e Nagasaki

1987: Relatórios do Departamento de Energia americano recomendavam que o governo realizasse um esforço para determinar a seqüência do genoma humano

1990: Lançamento do Projeto Genoma Humano, tendo Estados Unidos, Japão, França, Alemanha, China e Reino Unido como os centros do projeto.

1994: Mapa genômico humano detalhado

1996: Reunião de cientistas do mundo todo para discutir métodos de seqüenciamento e discutir os rumos da liberação dos dados; Começa o seqüenciamento de fato do genoma humano.

1999: Celera entra na corrida no seqüenciamento do genoma humano

2001: O primeiro rascunho do genoma humano foi lançado ao mesmo tempo pela Celera e pelo Projeto Genoma Humano

2003: Projeto Genoma Humano concluído 2004:

Projeto Genoma Humano Intuito de mapear o genoma humano, identificando genes responsáveis por características “normais” e patológicas. Assim, levar avanços à área médica e prevenir características indesejáveis, como doenças. Vacinas de DNA poderiam ser desenvolvidas e remédios seriam adequados ao “perfil genético” de indivíduos. Modelos animais mais usados também foram analisados, para pesquisas posteriores.

Análises Método de Sanger; Seqüenciamento hierárquico por shotgun Eletroforese em gel acrilamida; Leitura da seqüência;

Divulgação (2001)

Abril de 2003: Conclusão.

Iniciativa privada:

Celera Genomics é um empresa do setor farmacêutico-biotecnológico que desenvolve tecnologias de diagnóstico e tratamento. Fundada em 1998, a empresa tinha, dentre seus objetivos, o sequenciamento de genoma humano para fins comerciais. Foi idealizada por Craig Venter e pela Applera corporation.

Antes do Sequenciamento do Genoma Humano a Celera já havia ajudado no sequenciamento do genoma da Drosophila Megalogaster. O projeto foi realizado em parceria com o consórcio Projeto Genoma Drosophila e serviu de base para os protocolos e métodos utilizados no sequenciamento do Genoma Humano.

Origem do material 2 homens e 3 mulheres cederam material para o sequenciamento. Deste indivíduos, um era afro-americano, um era hispânica, um era de origem chinesa e dois era caucasianos. Os indivíduos assinaram termos de consentimento e duas identidades foram ocultadas. Foram retirados 130 mL de sangue de cada um.

Construção de bibliotecas de DNA e sequenciamento

O processo de extração e purificação visava apenas o DNA cromossômico. Para a construção da biblioteca, o DNA humano foi clivado em pedaços relativamente pequenos e de forma aleatória, inserido em plamídeos e estes foram inserido em E. Coli. Os plasmídeos apresentavam, no final, tamanhos de 2, 10 ou 50 kb.

O DNA das colônias transformadas foi extraído e foi feita a reação de sequenciamento com os ddNTPs. Para o sequenciamento, foram utilizados seqüenciadores ABI PRISM 3700. Cada amostra seqüenciada era identifica com um código de barras. Desde o começo do projeto, até o fim da etapa de sequenciamento, nem um dia se quer foi desperdiçado. Um alto controle de qualidade durante todo o processo garantiu uma taxa de apenas 1 em cada 1000 leituras com qualidade inferior a 98%.

Montagem do genoma

Whole Genome Shotgun Assembly Compartmentalized Shotgun Assembly Após o sequenciamento, métodos computacionais foram necessários para a montagem do genoma. Como o genoma havia sido fragmentado em pedaços relativamente pequenos e de forma aleatória, a montagem se torna um processo complexo, sobretudo em zonas de DNA repetitivo. A Celera utilizou dois métodos para o sequenciamento: Whole Genome Shotgun Assembly Compartmentalized Shotgun Assembly

Whole Genome Shotgun Assembly

Para a montagem do genoma inteiro, foram utilizados programas que já haviam sido utilizados no Projeto Genoma Drosophila. Estes programas consistem em um procedimento denominado Whole-genome Assembly (WGA). A montagem do WGA é feita em cinco passos: Screener. Overlapper. Unitigger. Scaffolder. Repeat Resolver.

Screener: Este passo consiste em procurar e marcar regiões de microssatélites com elementos de 6 pares de base ou menos. O algoritmo também rastreia zonas de DNA ribossomal e sequencias do tipo Alu e Line. As informações obtidas neste passo serão uteis para a construção de contigs e scaffolds. Contigs: são formados por fragmentos menores que são sobrepostos com a finalidade de se construir um seqüência maior de forma ininterrupta. Scaffolds: Conjunto de contigs.

Overlapper: Esta etapa consiste na sobreposição dos fragmentos. O computador comparará cada fragmento com todos os outros fragmentos e selecionará apenas as sobreposições que apresentam menos de 6% de diferença no match. Estatisticamente falando, o processo de sobreposição possui um baixa taxa de erro. Alinhamento errados feitos por coincidência nas sequencias ocorrem em 1 a cada 10.000.000 sobreposições. Entretanto, o processo é altamente difícil tendo em vista o grande numero de sequencias a serem comparadas. 40 computadores em paralelo e cada com 4 Gb de RAM e quatro núcleos de processadores levaram cinco dias para terminar a sobreposição.

Unitigger: Apesar da etapa de overlapper conseguir criar sequencias consensos de uma grande porção do genoma, ainda existem fragmentos que não conseguem ser sobrepostos de forma correta. Esta etapa utiliza relações estatísticas para descriminar quais fragmentos pertencem a determinadas regiões. Até aqui, aproximadamente 73% do genoma está montado.

Scaffolder: As sequencias obtidas nos passos anteriores serão utilizadas na construção de um Scaffold que represente a seqüência do genoma.

Repeat Resolution: Um conjunto de três estágios onde a seqüência é analisada com a finalidade de se diminuir a possível taxa de erro. Neste ultimo passo, ocorre uma grande demanda por memória dos computadores. Foram necessários 7 dias de processamento, utilizando-se 10 computadores com processadores de 4 núcleos e 4 Gb de RAM e 16 processadores NUMA com 64 Gb de RAM.

Compartmentalized Shotgun Assembly

Este processo tem por objetivo complementar as análises obtidas pelo WSA, e consiste na divisão do genoma e grande regiões. Um dos objetivos deste processo é conseguir uma montagem mais “realista” de regiões cromossômicas duplicas e serve para complementar a montagem de determinadas regiões.

Para realizar este processo, foram usados dados do genoma que foram gerados pelo consórcio público, denominados PFP data. Os dados dos fragmentos obtidos pelo sequenciamento da Celera, em conjunto com PFP data serão divididos em regiões, denominadas components. A determinação dos components é feita a partir de conhecimentos prévios de analise de sequencias já conhecidas. Como os components são montados de forma independente, regiões duplicadas não serão tratadas com ambigüidades, o que diminui a taxa de erro e a demanda por processamento.

Comparação do WSA e CSA

Ambos contribuem para uma montagem mais precisa do genoma, cada um utilizando um parâmetro e algoritmos distintos. Agora, com duas montagens diferentes, é possível fazer uma comparação, identificar pontos de concordância e inconsistências durante as montagens. Do ponto de vista estatístico, o CSA é mais “eficiente” que o WSA, visto que na montagens compartimentalizada os erros de cobertura se estendiam por zonas na ordem de mega bases, enquanto a montagem do genoma inteiro possui erros do mesmo tipo que se estendiam por áreas na magnitude de giga bases.

A maior precisão da montagens compartimentalizada e sua menor exigência de hardware para processamento fez com que a Celera utilizasse este assembly para as analises posteriores.

Com o Assembly selecionado, o próximo passo era a transposição dos scaffolds obtidos pelo CSA nas informações já conhecidas dos cromossomos. Para esta etapa, fora utilizadas informações do GeneMap99, usando-se regiões conhecidas como marcadores para o “encaixe” da seqüência.

Completamente seqüenciado?

Apesar de toda a exigência, o projeto não conseguiu um cobertura de todo a seqüência do genoma humano. É difícil determinar com certeza, mas uma análise das sequencias de cromossomos já conhecidos, marcadores moleculares, marcadores STS e genomas já conhecidos (como o da Drosophila) leva a crer que as seqüências obtidas pela Celera representam aproximadamente 94% do total.

Análise pós-montagem: predição de genes

Desafios da predição de genes: A predição de genes ainda é um processo impreciso e difícil de ser executado dentro de um genoma grande. Os principais problemas são: Ainda é difícil se definir um parâmetro universal que possa ser transformado em um algoritmo de busca eficiente. Novos algoritmos são necessários para que o computador possa diferenciar melhor as zonas codificadoras das não codificadoras.

Com os genes foram identificados: A identificação dos genes é feitas através de diversas técnicas, dentre elas: Comparação do Genoma com o Genoma de outros organismos, neste caso com o da Drosophila megalogaster e do Rato. Predição automatizada. Utilização de Softwares capazes de identificar genes, como as ferramentas Genscan que apresenta alta sensibilidade na definição de estrutura de genes e foi usada como base para a ferramenta Otto.

A ferramenta Otto: Tinha por objetivo emular o processo de identificação de genes que ocorre no organismo. Algoritmo de foca em determinadas regiões do genoma e começa uma análise baseada em padrões já conhecidos de estrutura de genes, fazendo uma busca por características que confirmem se aquela sequencia é codificante. O algoritmo também se mostrou eficiente na identificação de genes que já foram determinados e que tinha suas sequencias disponíveis em bancos de dados, como o RefSeq.

Resultado de Identificação: Utilizando a ferramenta Otto e outras análises complementares a Celera conseguiu identificar 26.383 genes. Também foram encontrados muitos pseudogenes, regiões que apresentam uma estrutura muito parecida com outros genes mas que, aparentemente, não são expressão.

Aplicações Futuras Medicina Molecular Genômica Molecular Avaliação de Riscos Antropologia e Evolução

Medicina Molecular Mudança no foco da medicina de tratar os sintomas para tratar a causa da doença; Medicina com possibilidade de fazer diagnósticos de doenças genéticas mais cedo, mais rápido, com maior precisão e menor custo; Surgimento de novos fármacos e tratamentos que podem prevenir ou até mesmo curar doenças que atualmente são consideradas incuráveis;

Modificação ou remoção de seções do genoma que apresentam defeitos em indivíduos; Melhoramento em genes benéficos para o ser humano, como supressores de tumor; Fármacos com melhor sistema de entrega e melhora no sistema de ação.

Genômica Microbiana Desenvolvimento de novas formas de combates de microorganismos patogênicos; Compreender os efeitos de microorganismos benéficos no corpo humano, e testar a adaptação de indivíduos a locais com microbiota diferente, assim como a ação de probioticos.

Entender a atividade da microbiota nos seus principais pontos de ação.

Avaliação de Riscos Exposição à radiação, mesmo que em curto período de tempo; Exposição à agentes químicos mutagênicos e toxinas causadoras de câncer; Reduzir a probabilidade de transmitir mutações genéticas aos filhos.

Compreender o motivo genético de porque certos medicamentos/toxinas tem efeitos variados em diversos tipos de pessoas.

Antropologia e Evolução Estudar a evolução através de mutações da microbiota em diferentes gerações; Estudar a migração de diferentes grupos populacionais baseado na herança genética feminina; Estudar mutações do cromossomo Y para acompanhar gerações e migrações masculinas.

Comparar breakpoints na evolução de mutações com a idade da população geral e acontecimentos históricos; Maior compreensão da origem biológica da vida.

E mais... Capacidade de determinar o genótipo a baixíssimos custos, em um estudo em que 2.000 indivíduos poderiam ser testados com aproximadamente 400.000 marcadores genéticos por menos de R$ 10.000,00; Conseguir monitorar o estado de todas as proteínas em uma única célula durante um experimento;

Desafios a serem superados Número de genes, definir localização e função exatas; Regulação gênica; Organização das sequências; Organização da estrutura cromossômica; Função, tipo, quantidade e distribuição de DNA não-codificante;

Coordenação da expressão, síntese de proteínas e eventos pós-transcricionais; Interação das proteínas nas maquinarias celulares; Diferença entre a função predita de um gene e a função determinada em um experimento; Conservação evolutiva entre organismos;

Correlação entre SNPs e diferenças da condição de saúde entre diversos indivíduos; Prever a suscetibilidade a doenças baseado em variações nas seqüências de um gene; Genes envolvidos em características complexas e doenças multigênicas; Fatores Epigenéticos.

Projeto Genoma Humano e Ética Por Mayana Zatz Banco de DNA: Possibilidade de identificar criminosos X Instabilidade “familiar”; (Baseado em artigo de Dawkins, de 1998, e Estudos de Robert Wright, em seu livro “O animal moral: psicologia evolutiva e vida cotidiana”) Informações sobre tendência a desenvolver determinadas doenças e expectativa de vida: poderiam ser divulgadas a planos de saúde e empregadores. Diagnóstico pré-natal e interrupções de gestação;

Projeto Genoma Humano e Ética “Aceitação” de padrões de comportamento ligados a genes X discriminação de indivíduos predispostos à dependência química e comportamentos “indesejáveis”; Possibilidade de escolha do sexo de bebês: “Desbalanceamento sexual” X Prevenção de doenças; Aconselhamento genético: prevenção de doenças X questões familiares; Testes moleculares para detectar doenças “tardias”, ainda sem tratamento; Paradoxo do câncer de mama.

Artigos

Psoríase A psoríase é uma doença de pele inflamatória comum, com uma etiologia base de fatores ambientais e genéticos.  Doença autoimune causa real mal definida.  Fatores genéticos contribuem para a suscetibilidade à doença.  Suspeita-se: Polimorfismos de nucleotídeo único (SNVS) ou Cópia variantes de número (CNVs)

Técnicas Usadas Técnicas genéticas usadas : PCR, PCR em tempo real microarray, e restrição do comprimento do fragmento de análise Suspeita: 1.338 genes Destaque: ALOX12B, EIF5, CTSC, CDC42EP1, HDGF, MX1, ITM2B, SYNCRIP, MYO5A, ALOX12B, UBE2L6, NAPA, TGM1 e SPRR1A 

Conclusão Variabilidade na expressão de genes: Em cada indivíduo idade, raça, sexo, genética, tipos de pele e influências ambientais.  Acredita-se que a psoríase é um interferon-imunes e mediada por células T

Obrigado!