Formato de Arquivos e Banco de Dados Biológicos II

Slides:



Advertisements
Apresentações semelhantes
MÓDULO 4.1 PubMed/Como pesquisar, exibir, fazer download e enviar por os resultados
Advertisements

TUTORIAL BASE DE DADOS OVID
Pesquisa Avançada, Tutorial de Estilo Orientado
Módulo II – Domine a Internet Introdução a Informática DCC - UFMG.
HTML - HiperText Markup Language Tecnologia para Web
Support.ebsco.com EBSCO Discovery Service Tutorial.
UNICEUMA – CENTRO UNIVERSITÁRIO DO MARANHÃO
Citation format 1 The “Citation” display option is similar to the abstract display but has some extra information such as MeSH terms and substances listed.
TUTORIAL BASE DE DADOS SCIENCE DIRECT Elaborado por:
Bancos de dados aplicados ao estudo de proteínas
CINAHL Tutorial de Pesquisa Básica
SISTEMAS DE INFORMAÇÃO
Maurício Edgar Stivanello
Universidade Federal de Viçosa
Sistemas de Gerenciamento de Bancos de Dados SGBD / DBMS
Introduction of RefSeq and LocusLink: resources at the NCBI
O Surgimento dos Sistemas de Bioinformática
Implementação de pipeline de sequenciamento configurável
Anotação de SAGE Tags Rodrigo Martins Brandão.
Bancos de Dados Biológicos
Formato de Arquivos e Bancos de Dados Biológicos
Denise Perdigão BASE DE DADOS Denise Perdigão
Evolução Molecular Metodologias de Análise
Tutorial de utilização do
Gestão de Referências e JabRef
XXIII Congresso Brasileiro de Microbiologia Novembro de 2005
EMBRAPA _ Foco: Dados  Conhecimento
TUTORIAL. Acervo digital de obras de referência (dicionários e enciclopédias) com acesso ao texto completo e busca textual. Contempla diversas áreas do.
Análise Computacional de Seqüências Nucleotídicas e Protéicas
EBSCO workshop Portal Capes – www. periodicos. capes. gov. br www
Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação Florianópolis, 09 de novembro de 2010.
Engineering Village. Engineering Village – A Plataforma Desenvolvida pela Engineering Information (Ei), líder em fornecer informações.
Softwares de Análises Estatísticas em Biologia Sistêmica
TUTORIAL. Acervo de 47 jornais especialmente selecionados pela British Library para melhor representar o século XIX. Inclui jornais nacionais e regionais.
Portal.periodicos.CAPES ASSOCIATION FOR COMPUTING MACHINERY Portal.periodicos.CAPES ASSOCIATION FOR COMPUTING MACHINERY.
Bioinformática Prof. Paulo Fazendeiro Trabalho realizado por: • Ana Margarida Barata, nº • Ana Isabel Monteiro, nº • Henrique Matos Cardoso,
Vagner Estevam Instrutor Tel.: (21)
Bancos de dados para análise de sequências de DNA
ARTIGOS CIENTÍFICOS ABNT NBR 6022 / 2003
Exercício Modelagem Structure Prediction Flowchart
Portal das Revistas Científicas em Ciências da Saúde
IF803 - Introdução à Biologia Molecular Computacional Profa. Katia Guimarães 2007/2.
Bancos de Dados.
MÓDULO 4 Como usar PubMed
Escola de Engenharia de Piracicaba Sistemas de Apoio a Decisão
METODOLOGIA CIENTÍFICA
Fluxos de produção de periódicos Francine Curivil SciELO Brasil
Bancos de Dados Natália F. Martins. BD de Seqüências Há uma quantidade gigantesca de informação sobre biomoléculas em BD públicos Mais de 348 BD –BD de.
Diogo Silva Nº  1988 NCBI- Banco de dados público contendo sequências de DNA dos mais diversos organismos  1995 Técnica do microarranjo -perfil.
METODOLOGIA DA PESQUISA
Introdução à Biologia Molecular História Cadeias de DNA e de Proteínas.
Campus de Caraguatatuba Aula 2: Introdução a Tecnologia de BD
Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro
Bioinformática Nuno Santos a25303 Bioengenharia 2011/2012.
RepeatMasker Aluno: Fred Ulisses maranhão Professora: Kátia S. Guimarães Algoritmos p/ processamento de Cadeias, Cin, UFPE - 1/2001.
A Internet e Seu Impacto
Allan Lima  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology 
Introdução à Biologia Molecular Computacional
Gene Projects Marcelo Falsarella Carazzolle Laboratório de Genômica e Proteômica Unicamp.
IF803 - Introdução à Biologia Molecular Computacional Katia Guimarães 2008/2.
Bioinformática Felipe G. Torres.
FERRAMENTAS DE ANÁLISE MOLECULAR
TUTORIAL. SABIN AMERICANA Esta base é formulada conforme a bibliografia de Joseph Sabin, bibliófilo americano que viveu entre 1821 e Com.
* Com o avanço das descobertas acerca dos Ácidos Nucléicos e das Proteínas surgiu o Dogma da biologia Molecular; * Surgimento dos métodos de sequenciamento.
Banco de Dados Distribuídos Sílvia Cristina de Matos Soares
HighWire Press. HighWire Press é uma divisão da Stanford University Libraries, que desde 1995 tem a missão de auxiliar na disseminação de informação acadêmica.
KEGG – Kyoto Encyclopedia of genes and genomes Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Seminários.
YOUR LOGO Tópicos Avançados em Internet Prof. Lincoln Ferreira Dantas Sistemas de Informação UNIESP – Presidente Epitácio.
Gestão da Tecnologia da Informação Fundamentos de Sistemas de Banco de Dados Faculdade de Tecnologia Senac Jaraguá do Sul.
Modelagem de Banco de Dados: Conceitos
Transcrição da apresentação:

Formato de Arquivos e Banco de Dados Biológicos II Alynne Oya Chiromatzo alynne@lgmb.fmrp.usp.br

Sumário Principais Repositórios Comparação Atividades NCBI EBI Entrez Tipos de Arquivos Aquisição de dados EBI EB-eye Tipos de arquivos Comparação Atividades

Principais Bancos NCBI (National Center for Biotechnology Information) 1988 – Criado como fonte nacional (norte americana) de informações sobre biologia molecular Bancos de Dados públicos; Pesquisas na área da biologia computacional; Desenvolvimento de ferramentas para análise de dados genômicos; Informações biomédicas. http://www.ncbi.nlm.nih.gov/

NCBI Eu já sei o que eu busco? Ou quero descobrir o que existe a respeito do que busco?

Entrez Sistema de busca robusto que realiza a procura simultânea em múltiplos bancos.

Entrez Mapa do relacionamento entre os diferentes bancos de dados. Colocar a imagem parcial Mapa do relacionamento entre os diferentes bancos de dados. Mapa

Entrez Busca

Entrez Busca

Formato GenPept

Formato GenPept http://www.ncbi.nlm.nih.gov/Sitemap/samplerecord.html

Formato GenPept GB: gene bank - accession number identifica a seqüência e sua versão

Formato GenPept GI : genInfo Identifier identificador único para cada seqüência

Formato GenPept O número do taxon é importante para pesquisas nos BDs.

Formato GenPept

Formato GenPept

Formato GenPept

Formato GenPept

Formato GenPept

Formato GenPept

Formato Fasta > identificação

Formato ASN É um sistema de notação usado para descrever dados que serão trocados em um sistema computacional distribuído. Inclui nucleotídeos e proteínas.

Formato ASN

Formato ASN

Acesso aos Dados SOAP (Service Oriented Architecture Protocol) EInfo – Fornece a contagem, a última atualização e os links disponíveis para cada banco de dados para um determinado campo de indexação. ESearch – Busca e retorna IDs primárias (para uso no EFetch, Elink e Esummary), palavras traduzidas e opcionalmente retém resultados para uso futuro. EPost – Cria um arquivo contendo uma lista de IDs primários para uso nas estratégias de busca sub-sequentes. ESummary – Retorna o resumo de documentos a partir de uma lista de ID primários fornecida pelo usuário.

Acesso aos Dados Descrição das funções do E-Utilities: http://www.ncbi.nlm.nih.gov/entrez/query/static/esoap_toolkit.html SOAP EFetch – Retorna registros de uma lista de IDs primários fornecidos pelo usuário no formato requisitado. ELink – Verifica a existência de links para artigos externos ou do banco de dados a partir de uma lista de um ou mais IDs primários. Retorna os IDs primários dos artigos e as pontuações de relevância. EGQuery – Fornece uma contagem do banco de dados Entrez para uma única busca usando a busca global (Global Query). ESpell – Retorna sugestões de ortografia.

Acesso aos Dados ftp://ftp.ncbi.nih.gov/ FTP GenBank – Coleção de anotações de todas as seqüências de DNA públicas disponíveis. Gene – Informações sobre genes de organismos completamente seqüenciados. RefSeq – Conjunto não-redundante de seqüências de DNA, proteínas e transcritos (dogma central). Demais bancos ... Cn3D – Programa de visualização de estruturas 3D. BLAST – Ferramenta de procura de alinhamentos locais em bases de dados. Demais programas ...

Principais Bancos EMBL-EBI (European Molecular Biology Laboratory European Bioinformatics Institute) Cambridge, Inglaterra Pioneiro no desenvolvimento de pesquisas em bioinformática Desenvolve banco de dados biológicos e programas http://www.ebi.ac.uk/

EMBL-EBI BD de seqüências de nucleotídeos do EMBL

EMBL-EBI - Catálogo mais completo de informações sobre proteínas. - Repositório central de seqüências e funções de proteínas criado pela junção das informações contidas no UniProtKB/Swiss-Prot, UniProtKB/TrEMBL e PIR.

EMBL-EBI Repositório público para dados de transcriptoma e relacionados, o qual visa armazenar dados MIAME (Minimum Information About a Microarray Experiment). Ele armazena padrões de expressão indexados por gene e as suas respectivas biomedidas. Microarray?

EMBL-EBI Ensembl Genome Browser Projeto em conjunto com o Instituto Sanger Matem anotação automática de genomas de eucariotos. Ensembl anota genes conhecidos e novos com a anotação de sua função fornecida por InterPro, OMIM, SAGE e famílias gênicas. O acesso aos dados e ao software são livres e sem restrição.

EMBL-EBI BD de proteínas que abrange famílias, domínios, repetições e regiões com características de proteínas conhecidas que podem ser aplicadas a novas seqüências de proteínas.

EMBL-EBI Macromolecular Structure Database Group Projeto europeu para a coleta, gerenciamento e destribuição de dados sobre estruturas macromoleculares derivadas em parte do PDB (World Wide Protein Data Bank).

Bancos de Dados

Bancos de Dados

Busca

Busca

Busca

Busca Human complete

Busca

Busca

Formato Embl ID - identificação AC – número de acesso DT - data DE – descrição KW - palavra-chave OS – organismo espécie OC – classificação do organismo RN – número da referência RC – comentário RP – posições RX – referências cruzadas RA – autores RT – título PE – existência da proteína RL – Revista DR – referência cruzada do BD CC - notas FH – cabeçalho da tabela de atributos FT – tabela de atributos XX – linha em branco SQ – cabeçalho da seqüência // - linha final

Formato Embl Continuação do arquivo ID - identificação AC – número de acesso DT - data DE – descrição KW - palavra-chave OS – organismo espécie OC – classificação do organismo RN – número da referência RC – comentário RP – posições RX – referências cruzadas RA – autores RT – título PE – existência da proteína RL – Revista DR – referência cruzada do BD CC - notas FH – cabeçalho da tabela de atributos FT – tabela de atributos XX – linha em branco SQ – cabeçalho da seqüência // - linha final Continuação do arquivo

Formato Swiss-Prot ID - identificação AC – número de acesso PR – identificador de projeto DT - data DE – descrição GN – nome genérico KW - palavra-chave OS – organismo espécie OC – classificação do organismo OG – organela OX – referência cruzada organismo RN – número da referência RC – comentário RP – posições RX – referências cruzadas RA – autores RT – título RL – Revista DR – referência cruzada do BD FT – tabela de atributos SQ – cabeçalho da seqüência CO – linha de contig/construção // - linha final

Formato Swiss-Prot ID - identificação AC – número de acesso PR – identificador de projeto DT - data DE – descrição GN – nome genérico KW - palavra-chave OS – organismo espécie OC – classificação do organismo OG – organela OX – referência cruzada organismo RN – número da referência RC – comentário RP – posições RX – referências cruzadas RA – autores RT – título RL – Revista DR – referência cruzada do BD FT – tabela de atributos SQ – cabeçalho da seqüência CO – linha de contig/construção // - linha final

Formato PIR > Sinal de maior Duas letras descrevendo o tipo Protein (complete) P1 Protein (fragment) F1 DNA (linear) DL DNA (circular) DC RNA (linear) RL RNA (circular) RC tRNA N3 other functional RNA N1 ; ponto e vírgula Código de identificação Uma linha contendo a descrição Seqüência contendo 1 ou + linhas * Sinal de terminação

Acesso aos Dados SOAP WSDbfetch – Retorna entradas de vários BDs biológicos atualizados WSEB-Eye – Acesso ao mecanismo de busca EB-Eye WSMSD – Acesso aos dados e ferramentas do BD de estruturas macromoleculares WSChEBI – Retorna entradas do BD ChEBI (Chemical Entities of Biological Interest) WSIntegr8 – Acesso a um subconjunto de dados disponíveis no portal Integr8 (integrated information about deciphered genomes and their corresponding proteomes ) Mais outros serviços… http://www.ebi.ac.uk/Tools/webservices/

Acesso aos Dados FTP ArrayExpress – Dados de microarray http://www.ebi.ac.uk/FTP/ FTP ArrayExpress – Dados de microarray Embl – BD de nucleotídeos do EMBL InterPro – Famílias, domínios de proteínas UniProt – BD universal de proteínas UniRef – BD referência de grupos de proteínas Demais bancos… Programas

Comparação NCBI EBI BDs Busca Acesso aos dados BDs Busca Nucleotídeos Busca - Seleciona itens de interesse - Padrão entre os BDs - Maior consistência Acesso aos dados - SOAP: Específico para acesso de dados Forte: Pesquisas de publicações EBI BDs Proteínas Busca - Faz sub-buscas - Padrões diferentes Maior quantidade de informações Acesso aos dados - SOAP Usado para dados e ferramentas Forte: Obtenção de seqüências novas

Site com os formatos http://www.ebi.ac.uk/help/formats_frame.html

Atividades Busca rápida de dados em formato texto no NCBI usando o clipboard

Atividades

Atividades

Atividades

Atividades

Atividades

Atividades Transformar o trecho abaixo de genbank para: Fasta Embl

Obrigada!