Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação Florianópolis, 09 de novembro de 2010.
Genbank Swiss-prot pdb Tópicos
GENBANK
GENBANK: É um banco de seqüências de nucleotídeos e proteínas. Acesso irrestrito (grande parte) acessado pelo NCBI: Construído pelo National Center of Biothecnology Information (NCBI) em COLABORAÇÕES: DNA Data Bank do Japão (DDBJ) European Bioinformatics Institutes (EBI, Hinxtin, UK). -> Todos estes centros recebem dados separadamente, estas informações são trocadas e integradas, de maneira que estes bancos contém o mesmo banco de dados, sendo grande parte deles disponível on line. GENBANK
Bethesda, MD O National Center for Biotechnology Information (NCBI) Aceita submissões de seqüências primárias. Desenvolve ferramentas para analisar dados. Criação de bancos específicos baseados na seqüência primária. Fornece pesquisa livre e links
Users per day 300, , , , , , Christmas and New Years Day Tráfego de navegação ao NCBI 65 milhões de pb 61 milhões de seqüências 65 milhões de pb 61 milhões de seqüências
01/21/2007 9/19/2006
Organismo -Tradicional PRI (28) Primate ROD (15) Rodent PLN (20) Plant and Fungal BCT (18) Bacterial/Archeal INV (7) Invertebrate VRT (7) Other Vertebrate VRL (4) Viral MAM (2) Mammalian PHG (1) Phage SYN (1) Synthetic ENV (4) Envir. samples UNA (1) Unannotated Functional - Bulk EST (570) Expressed Sequence Tag GSS (197) Genome Survey Sequence HTG (88) High Throughput Genomic PAT (27) Patent STS (9) Sequence Tagged Site CON (1) Contigs, virtual EST (570) Expressed Sequence Tag GSS (197) Genome Survey Sequence HTG (88) High Throughput Genomic PAT (27) Patent STS (9) Sequence Tagged Site CON (1) Contigs, virtual Organizado por taxonomia Submissões diretas (Sequin/Bankit) Acuracidade (~1 error per 10,000 bp) Bem caracterizado Organizado por tipo de sequencia Submissões por (ftp/ ) Menos acurado Pouco caracterizado Divisões do GENBANK
GenBank EST STS GSS HTG Expressed Sequence Tag – Uma única passagem de leitura do cDNA Genome Survey Sequence – Uma única passagem de leitura do gDNA High Throughput Genomic – Seqüências incompletas de clones Sequence Tagged Site – PCR-based mapping reagents GENBANK funcional
Pouco caracterizada Banco de Seqüências do tipo EST
shred Whole BAC insert (or genome) isolate clonessequence GSS division or trace archive Draft sequence ( HTG division ) assembly whole genome shotgun assemblies (wgs projects) GSS, HTG, WGS
Sequencias não concluidas de BAC Gaps e pedaços fora de ordem Sequencias não concluidas de BAC Gaps e pedaços fora de ordem LOCUS AC bp DNA linear HTG 19-MAR-2004 DEFINITION Apis mellifera clone CH224-4A2, WORKING DRAFT SEQUENCE, 14 unordered pieces. ACCESSION AC VERSION AC GI: KEYWORDS HTG; HTGS_PHASE1; HTGS_DRAFT. LOCUS AC bp DNA linear HTG 19-MAR-2004 DEFINITION Apis mellifera clone CH224-4A2, WORKING DRAFT SEQUENCE, 14 unordered pieces. ACCESSION AC VERSION AC GI: KEYWORDS HTG; HTGS_PHASE1; HTGS_DRAFT. HTG: Honeybee Draft Sequence
685 projetos Bactéria (320) Sequencias ambientais (14) Archaea (8) Eucariotos (140), incluem: Frango, em ratinhos, ratos, cães (2), chimpanzé, humano Peixe (2) Abelha, Anopheles, moscas das frutas (3) Nematóides (2) As leveduras (8), Aspergillus (2) Arroz (2) 685 projetos Bactéria (320) Sequencias ambientais (14) Archaea (8) Eucariotos (140), incluem: Frango, em ratinhos, ratos, cães (2), chimpanzé, humano Peixe (2) Abelha, Anopheles, moscas das frutas (3) Nematóides (2) As leveduras (8), Aspergillus (2) Arroz (2) Genomas completos - Projetos Shotgun
wgs master[properties] ftp://ftp.ncbi.nih.gov/genbank/wgs/ Projetos Genomas Completos (WGS)
GENBANK: procurando por seqüências – Regiões regulatórias. – Regiões não-traduzíveis. – Regiões codificantes para proteínas. – Regiões intergênicas. – Regiões regulatórias. – Regiões não-traduzíveis. – Regiões codificantes para proteínas. – Regiões intergênicas.
Swiss-prot
O swiss-prot foi criado durante a tese de Amos Bairoch em 1986 ligado ao Swiss Institute of Bioinformatics (SIB). Contém todas as seqüências protéicas de proteínas com funções conhecidas. Swiss-prot está disponível no endereço eletrônico conectado ao servidor ExPAsy. ExPASy: Expert Protein Analysis System contém banco de dados + ferramentas on line úteis. Colaboração: European Bioinformatics Institute (EBI). Automated TrEMBL (TRanslation of EMBL nucleotide sequences)
Típico swiss-prot entry Proteína Função proteíca bibliografia Links com outros bancos: – Estrutura – Domínio – Função