Introduction of RefSeq and LocusLink: resources at the NCBI

Slides:



Advertisements
Apresentações semelhantes
MY NCBI (módulo 4.5).
Advertisements

MÓDULO 4.1 PubMed/Como pesquisar, exibir, fazer download e enviar por os resultados
PROJETOS GENOMA E PROTEOMA HUMANOS
KEGG: Enciclopédia de Genes e Genomas de Kyoto
Expressão génica.
Processamento pós-transcricional
Universidade Federal de Viçosa
Seqüenciamento parcial de transcritos
Uso da bioinformática na análise genômica
Principios de Genética Microbiana
Genética bacteriana.
Transcrição do RNA em Organismos Procariotos
Transcrição do RNA em Organismos Procariotos
Regulação da Expressão Gênica em Organismos Eucariotos
Anotação de SAGE Tags Rodrigo Martins Brandão.
Formato de Arquivos e Bancos de Dados Biológicos
Introdução à expressão gênica
Formato de Arquivos e Banco de Dados Biológicos II
Yeast vectors for integration at the HO locus
Genômica É a caracterização de genomas inteiros. Tenta compreender a organização molecular e as informações que ela traz.
Inicio PIATV para Windows Realização:.
AVAYA WEB SUPORTE Jan 07, Avaya Inc. All rights reserved.
PORTAL.PERIODICOS CAPES Iniciado no ano 2000 o Portal oferece acesso ao texto completo de revistas científicas e tecnológicas, acesso a bases de dados.
Bioengenharia – Bioinformática 2011/2012
Emanuel Teixeira Nº24924 Bioengenharia
Genômica funcional e metagenômica
RNAs não codificadores
[Clayton J Pereira] [Leonilson Kiyoshi] [Prof. Dr. Vitor Leite]
Uso da bioinformática na análise genômica TAGAGCATCGATCGATGCTGCAGATGATGCTAGCATCGGCTAGGCGACG ATCTCGTAGCTA ATCTCGTAGCTAGCTACGACGTCTA ATCTCGTAGCTAGCTA ATCTCGTAGCTAG.
Genômica e Proteômica 1) Genômica Estrutural O que é Genômica ?
Genómica Licenciatura em Ciências Biomédicas Departamento de Ciências da Saúde, UCP Fevereiro 2013.
SciELO. A Scientific Electronic Library Online - SciELO é uma biblioteca eletrônica que abrange uma coleção selecionada de periódicos científicos brasileiros.
Usando Microsoft Access 2010
Softwares de Análises Estatísticas em Biologia Sistêmica
Bancos de dados para análise de sequências de DNA
Tiago Guerreiro Nº25 Tiago Oliveira Nº26. Síntese Proteica A síntese proteica é criação de proteínas a partir da informação contida no DNA. Para que ocorra.
Dept. Entomologia, Fitopatologia e Zoologia Agrícola
IF803 - Introdução à Biologia Molecular Computacional Profa. Katia Guimarães 2007/2.
A genética e os genes.
MÓDULO 4 Como usar PubMed
Recursos de Informação em Genética Médica na Internet Renato M.E. Sabbatini, PhD Disciplina de Informática Médica Depto. Genética Médica Faculdade de Ciências.
Bancos de Dados Natália F. Martins. BD de Seqüências Há uma quantidade gigantesca de informação sobre biomoléculas em BD públicos Mais de 348 BD –BD de.
Dogma central da Biologia Molecular:
Diogo Silva Nº  1988 NCBI- Banco de dados público contendo sequências de DNA dos mais diversos organismos  1995 Técnica do microarranjo -perfil.
Introdução à Biologia Molecular História Cadeias de DNA e de Proteínas.
Análises de sequências
Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro
Bioinformática Nuno Santos a25303 Bioengenharia 2011/2012.
Marcílio C. P. de Souto DIMAp/UFRN
RepeatMasker Aluno: Fred Ulisses maranhão Professora: Kátia S. Guimarães Algoritmos p/ processamento de Cadeias, Cin, UFPE - 1/2001.
Seqüenciamento e genômica
Allan Lima  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology 
UNIVERSIDADE DA BEIRA INTERIOR Ana Rita Mendes, nº25167 Helena Pissarra, nº Rúben Pires, nº C. Biomédicas.
Introdução à Biologia Molecular Computacional
Sequenciamento de Genomas
Gene Projects Marcelo Falsarella Carazzolle Laboratório de Genômica e Proteômica Unicamp.
IF803 - Introdução à Biologia Molecular Computacional Katia Guimarães 2008/2.
Descoberta de novos genes no genoma de Saccharomyces cerevisiae
Links e recursos utilizados ou recomendados no curso Alguns dos links sugeridos ou utilizados no curso. As referências ausentes nessa apresentação são.
1 HapBlock Rogério Rosa Recife, Março de Introdução O genoma humano é composto por regiões de alta LD intercaladas com regiões de baixa LD; Áreas.
Loja Online Smart Ecommerce completo, com layout responsivo
Ácidos Nucléicos Molécula de DNA e RNA.
Bioinformática Felipe G. Torres.
Gerenciamento de Configuração de Software
Universidade Federal de Pernambuco
* Com o avanço das descobertas acerca dos Ácidos Nucléicos e das Proteínas surgiu o Dogma da biologia Molecular; * Surgimento dos métodos de sequenciamento.
Carine Moreira Avaliador: Abadio de Oliveira da Costa BTC Biologia Molecular e Métodos Analíticos.
Taís Sineiro Herig Laboratório de Genômica e Expressão / UNICAMP
ANÁLISE EM LARGA ESCALA DE EXPRESSÃO GÊNICA DIFERENCIAL ENTRE DIVERSAS
KEGG – Kyoto Encyclopedia of genes and genomes Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Seminários.
Transcrição da apresentação:

Introduction of RefSeq and LocusLink: resources at the NCBI Magno Inácio dos Santos

Artigos Introducing refSeq and LocusLink: curated human genome resources at the NCBI RefSeq and LocusLink: NCBI gene-centered resources PARA MAIS INFORMAÇÕES... Trends in Genetics,2000, Vol.16, No.1, pg.44-47 Nucleic Acids Research,2001, Vol.29, No.1, pg.137-140

Equipe/recursos Os idealizadores destes projetos foram os pesquizadores; Kim D. Pruitt, Donna R. Maglott, Kenneth S. Katz e Hugues Sicote com recursos para construção e manutenção dos seguintes grupos: Human Gene Nomenclature Committee Online Mendelian Inheritance in Man National Center for Biotechnology Information contribuições individuais e institucionais

Objetivos Encontrar a sequência de um gene; determinar o que se sabe sobre um gene ou proteína; estabelecer uma forma comum de referência para comparação de várias sequências e polimorfismos; selecionar um número representativo de sequências para estudos de expressão em larga escala.

Uso das ferramentas LocusLink organiza informações sobre genes gerando um banco de dados para serem acessadas informações de genes específicos; Refseq proporciona referências de modelos sequenciais de genomas, transcrições e proteínas; RefSeq e LocusLink proporcionam uma via direta para auxiliar a pesquisa em genes e linhagens de genes, variação, expressão gênica e apontamento genomico.

Análise do LocusLink O LocusLink mantém informações descritivas sobre um“loci” incluindo nomenclatura, identificador de bancos de dados (locus ID), doenças associadas, posições no mapa e acréscimo de sequências; O LocusLink mantém ligações diretas para facilitar pesquisas na PubMed, OMIM, RefSeq, GenBank, UniGene e dbSNP . A pesquisa no LocusLink pode ser feita através de termos (como uma proteína ou nome de doença), símbolos de genes, sequências de acesso, e ID’s de bancos de dados. Como acessar... Http://www.ncbi.nlm.nih.gov/LocusLink.html

Análise do Refseq O RefSeq transcreve registros de proteínas. Diferente dos registros do Genbank, o RefSeq pode ser modificado depois de revisado por um Biólogo. Uma sequência provisória é computada de um registro nucleotídico que tem uma região de codificação completa (CDS). O registro RefSeq de uma proteína é a tradução de um apontamento de CDS. Como acessar... Http://www.ncbi.nlm.nih.gov/LocusLink/refseq.html

RefSeq Banco de sequências de referência Inclui nº acesso redundância do GenBank retirada Inclui nº acesso mRNAs (Nucleotide) NM proteínas (Protein) NP cromossomos inteiros (Genome) NC Três níveis de curadoria para sequências NM: predita, provisória e revisada Além de entradas originadas de anotação do genoma

Três classes de NM Predita: automática Provisória: manual cDNA com ORF sem função descrita Provisória: manual proteína com função conhecida ou inferida o melhor representante do GenBank, mais anotado Revisada: manual compilação sobre o gene e seus transcritos sequência, propriedades, nomenclatura, referências, retirada de vetor, adição de UTRs, domínios conservados, descrição da função do gene, links

Escolha das NM provisórias Preferência para entrada GenBank com mais UTR; Diferença com GenBank: Inicialmente nenhuma Anotação da entrada RefSeq vai ficando mais detalhada Acrescenta dados de vários laboratórios e entradas Seleção de um único representante; redundância = somente isoformas de processamento Pseudogenes não geram RefSeq; Aparecem no GenBank

Anotação do genoma Software indica presença de gene e proteína; Sem comprovação de expressão: Acesso NT contigs genômicos construídos, XM mRNA modelado (sem evidência EST), XP proteína modelada

Download de sequências Somente a entrada única do gene: Nome [Gene name] e srcd RefSeq [prop]; Isoformas de processamento: Nome [Gene Name] e srcd RefSeq [properties]; Todas as provisórias (combinar com organismo): Srcd RefSeq [prop] e provisional [all]; Todas as revisadas (combinar com organismo): : Srcd RefSeq [prop] e Biomol mRNA [Prop] NOT provisional [all].

Aumento e manutenção As informações levantadas no LocusLink e RefSeq estão sendo continuamente revisadas e aumentadas. O número de registros RefSeq triplicou, e o LocusLink expandiu cerca de cinco vezes num período de um ano.

Status atual Registros RefSeq novos e atualizados são avaliados continuamente pelo público. O site do LocusLink é atualizado semanalmente.

URLs do NCBI