A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Identificar e caracterizar todos os genes Genscan, FGENES and MZEF

Apresentações semelhantes


Apresentação em tema: "Identificar e caracterizar todos os genes Genscan, FGENES and MZEF"— Transcrição da apresentação:

1 Identificar e caracterizar todos os genes Genscan, FGENES and MZEF
Computational identification of promoters and first exons in the human genome Ramana V Davuluri, Ivo Grosse & Michael Q. Zhang Nature Genetics 29: Identificar e caracterizar todos os genes do genoma humano kb: ~ genes Genscan, FGENES and MZEF

2

3 Sequencing Progress Draft Finished Total 51.4 % 47.1 % 98.5 %

4 exons Gene introns

5 Gene  glonina ORESTES dbEST 1 2 3 Sinal de poliadenilação 5’m7G G A
Promotor AATAAA ATG TAA TAG TGA AG GT 1 2 3 Sinal de poliadenilação AATAAA 5’m7G AAAAAAAAA 3’ ORESTES dbEST

6 Modificações químicas nas duas extremidades do RNAm
Poliadenilação Seqüência rica em GU Sinal de poliadenilação 5’ m7G AAUAAA GU 3’ endonuclease 5’ m7G AAUAAA 3’ Poli(A) polimerase AAAAAAAA 3’ 5’ m7G AAUAAA Cauda poli(A)

7 10s a 10.000 nt Exon 1 Exon 2 Intron C A AG GT AGT G CCCCCC C
TTTTTTT T N AG G A

8 Gene Sinal de poliadenilação 1 2 3 Promotor AATAAA G A G A AG GT AG AG
ATG TAA TAG TGA

9 Exon parcialmente codificado Exon não codificado 40%
ATG AG GT G A +1 Exon 1 +1 ATG Exon parcialmente codificado Exon não codificado 40%

10 Computational identification of promoters
and first exons in the human genome Ramana V Davuluri, Ivo Grosse & Michael Q. Zhang Nature Genetics 29:

11 Alinharam RNAm e 5’ UTR com seqüências genômicas;
Recupera o primeiro exon com 500 bases de cada lado; Elimina a redundância e as seqs ambíguas. FEdb 2.139 Splice-donor Sites (GT) Para todo sítio GT, o programa calcula a probabilidade de ser um splice-donor site. P(donor site|GT) > 0.4 GT 500 pb 1.500 pb Promotor GT 500 pb 1.500 pb ATG 70 pb P(promoter|window) > 0.4

12 Alinharam RNAm e 5’ UTR com seqüências genômicas;
Recupera o primeiro exon com 500 bases de cada lado; Elimina a redundância e as seqs ambíguas. FEdb 2.139 Splice-donor Sites (GT) Para todo sítio GT, o programa calcula a probabilidade de ser um splice-donor site. P(donor site|GT) > 0.4 GT 500 pb 1.500 pb Promotor Primeiro exon P(promoter|window) > 0.4 P(exon|all) > 0.5 GT 500 pb 1.500 pb ATG

13 Parcialmente codificado
Resultados Banco de dados de primeiro exon. FEdb 2.139 Parcialmente codificado 1.315 (61%) 348 pb Não codificado 824 (39%) 151 pb

14 Primeiro exon e ilhas CpG
500 pb 500 pb ATG GT GC% GC% GC% GC% GC% GC% GC% GC% GC% GC% 201pb CpG score =  GC% / total window

15 Primeiro exon e ilhas CpG
14 3 6.5

16 Primeiro exon e ilhas CpG
Promotor +1 -200 93,8 % 76,3 %

17 FirstEF Procurando o primeiro exon e a região promotora
Predizer o primeiro exon e a região Promotora usando diferentes funções discriminantes estruturada como uma árvore de decisão. FirstEF Modelos probabilísticos destinados a encontrar sítios de splicing donor e regiões promotoras relacionadas e não relacionadas com ilhas CpG. Para todo sitio de splicing (donor) e toda região promotora, o FirstEF decide se a região intermediária pode ser um primeiro exon baseado em um grupo de função quadrática discriminante.

18 Eficiência do FirstEF Análise sistemática de validação. Cross-validation (FEdb)

19 Eficiência do FirstEF O programa foi rodado com a seqüência completa do Chr 21 e Chr 22.


Carregar ppt "Identificar e caracterizar todos os genes Genscan, FGENES and MZEF"

Apresentações semelhantes


Anúncios Google