Organização Gênica de Eucariotos Universidade Federal de Pelotas Centro de Biotecnologia Graduação em Biotecnologia Biologia Molecular Organização Gênica de Eucariotos
Classificação dos seres vivos de acordo com Woese (1977)
Protistas (protozoários e leveduras) Domínio Eukarya Reinos Protistas (protozoários e leveduras) Fungi (fungos) Plantae (vegetais) Animalia (animais)
GENE Sequência nucleotídica necessária e suficiente para a síntese de um polipeptídeo ou de uma molécula de RNA estável
Estrutura e expressão de um gene eucariótico
Tamanho médio dos genes Maiores em Eucariotos E. coli – 0,9 kb S. cerevisiae – 1.4 kb D. melanogaster – 11,3 kb H. sapiens – 19,2 kb
Há uma tendência geral de aumento do número de genes interrompidos, do número de íntrons por gene e do tamanho dos íntrons individuais à medida que se avança na escala evolutiva, o que determina que o tamanho médio dos genes (incluindo íntrons) seja maior em organismos mais complexos
Íntrons Um gene contém em média 3,7 íntrons por kb de região codificadora No homem o número médio é de 5 íntrons por gene 94% dos genes contém íntrons O tamanho médio dos íntrons é de 125 pb O tamanho médio dos éxons é de 90 a 120 pb (30 a 40 aa)
Então, porque a evolução nos presenteou com estas seqüências? A presença de íntrons nos genes eucarióticos, aparentemente, representa um enorme desperdício celular Então, porque a evolução nos presenteou com estas seqüências? Mecanismo de proteção contra mutações Diversidade: genomas e proteomas (splicing alternativo) Regulação gênica...
Genomas Eucarióticos - Aspectos Gerais Genoma nuclear (gDNA): material genético contido no núcleo Genoma de organelas (mtDNA e ctDNA): mitocôndrias, cloroplastos DNA dividido em 2 ou mais cromossomos Geralmente diplóides: 2 conjuntos de cromossomos Podem ser haplóides (leveduras e alguns fungos com 1 conjunto) ou poliplóides (3 ou mais cópias de cada cromossomo) Dois ou mais cromossomos lineares
Célula animal Célula vegetal
Número de cromossomos em alguns organismos
conjunto cromossômico Normal Down Cariótipo normal CARIÓTIPO conjunto cromossômico Síndrome de Down Turner Miado do gato Síndrome de Turner Síndrome de Cri du chat
Conteúdo de DNA por genoma haplóide = Valor C Quantidade de DNA presente no genoma em pb! Procariotos: 5 x 10 5 e 10 7pb - Eucariotos: 107 a 1011 Quanto mais complexo o organismo, maior o valor C
Paradoxo do Valor C É a impossibilidade de correlacionar o tamanho do genoma (valor C) com a complexidade das características morfológicas, fisiológicas e comportamentais do organismo. Resultado da presença de seqüências de DNA repetida
Acredita-se que o número total de genes seja proprocional ao aumento da complexidade dos organismos reduzido
Número de proteínas ≠ número de genes Número de proteínas maior do que o número de genes Geração de múltiplas cópias de RNA a partir de um único gene Produz 18 isoformas da proteína, a partir do uso de 2 códons de início de tradução alternativos e por splicing alternativo de 12 dos seus 23 éxons Gene da proteína 4.1 de eritrócitos humanos
Cinética de renaturação de um genoma eucariótico: estimativa da fração de um genoma que corresponde a sequências únicas ou repetidas DNA extraído é fragmentado, desnaturado e renaturado. A proporção de moléculas renaturadas em relação às desnaturadas é analisada em função do tempo Quanto maior for a proporção de sequências únicas no genoma, maior será o tempo necessário para renaturação. Sequências repetidas tem maior velocidade no processo de renaturação
Classes de sequências Sequências não-repetitivas (muito complexas) Sequências moderadamente repetitivas Sequências altamente repetitivas (pouco complexas)
Moderadamente repetitivos: Famílias gênicas 25 a 50% dos genes são de cópia única (não repetitivo) Família gênica: possuem sequências com grau variado de similaridade entre si – 30% a 40 % de identidade. Tem funções relacionadas ou idênticas, mas podem ser expressos em diferentes estágios. Agrupamento de genes ou espalhados pelo genoma Moderadamente repetitivos: Genes que codificam tRNAs: > 1300 cópias no homem Genes que codificam rRNA: de 100 a 200 cópias por genoma Genes que codificam histonas: 300 a 1.000 cópias (ouriço-do-mar)
Seqüência de DNA repetitivo DNA de seqüência simples Seqüência curta (5 a 10 pb) repetida milhares de vezes em tandem. Representa 10 a 15% do DNA de mamíferos Fração de reassociação intermediária: sequências moderadamente repetitivas (25 a 40% do DNA). Maior parte derivada de sequências de famílias de elementos transponíveis Transposons Retrotrasposons: movimento é mediado por um RNA e envolve uma etapa de transcrição reversa de seu RNA.
Genomas de Organelas ctDNA Genomas Extranucleares: codificam funções relacionadas ao metabolismo das próprias organelas Mitocôndrias – mtDNA Plastídios: família de organelas vegetais Cloroplastos Cromoplastos Amiloplastos Elaioplastos ctDNA
Estrutura de um Gene de Procarioto Promotor Região Codificadora Terminador Estrutura de um Gene de Eucarioto Promotor Região Codificadora Sítio de PoliA hnRNA AAAAAAAAAA mRNA Exon Intron DNA RNA
O GENOMA HUMANO
Fim do sequenciamento dos outros organismos A idéia do sequenciamento foi primeiramente proposta em encontros cientificos Fim do sequenciamento dos outros organismos 1984-1986 1995 1999 2004 1990 1998 2001 O Projeto Genoma Humano foi lançado com a criação de centros de genoma nos seguintes países: EUA, Reino Unido, Japão, França, Alemanha e China
determinar a sequencia completa de nucleotídeos do genoma humano
Mapeamento do genoma Mapa Citogenético (FISH): características dos cromossomos visíveis em microscópios Mapa Genético (genealogia): posicionam genes baseados na transmissão de locus polimorficos ao longo de genealogias Mapa Físico (Clonagem e caracterização de fragmentos): mostram as distâncias reais entre marcadores e genes
Consórcio Internacional do Sequenciamento do Genoma Humano
Projeção de duração de 15 anos Duração total de 13 anos (1990–2003) Projeto patrocinado pelo Instituto Nacional de Saúde dirigido por Francis Collins e pelo Departamento de Energia - EUA Projeção de duração de 15 anos Duração total de 13 anos (1990–2003) Planejamento de custo de $3 bilhões Maior genoma sequenciado até agora (2001) 1º genoma de veterbrados sequenciado
Total de pares de bases de 3 bilhões para 2,851,330,913 Número de genes entre 20.000 a 25.000 A versão atual do catálogo de genes consta com 19.438 genes conhecidos e 2.188 genes preditos 3.7 milhões de SNPs mapeados
The Sequence of the Human Genome
Anotação das seqüências Bioinformática
Identificação de alvos para terapias DESAFIOS Identificação de polimorfismos na população humana e associação com doenças Identificação de alvos para terapias Identificação de elementos funcionais do genoma: genes, proteínas, regiões regulatórias e elementos estruturais Identificação de como os genes e as proteínas funcionam em conjunto