Bioinformática Felipe G. Torres.

Slides:



Advertisements
Apresentações semelhantes
Advanced Search Vamos usar a opção Advanced Search (Pesquisa Avançada) que permite usar a ferramenta Search Builder (construir a pesquisa). Para realizar.
Advertisements

MÓDULO 4.1 PubMed/Como pesquisar, exibir, fazer download e enviar por os resultados
as Humanidades e C. Sociais
EBSCOhost Estilo guiado de pesquisa avançada
A b-on e as Ciências e Engenharias/Tecnologias. b-on Modelo All for All - Editoras - Bases Referenciais - Bases de Texto Integral Fontes de informação.
BIOQUÍMICA DOS ALIMENTOS.
Support.ebsco.com Tutorial do Meu EBSCOhost Tutorial.
UNICEUMA – CENTRO UNIVERSITÁRIO DO MARANHÃO
TUTORIAL BASE DE DADOS SCIENCE DIRECT Elaborado por:
KEGG: Enciclopédia de Genes e Genomas de Kyoto
Obtendo informações sobre o Portal Localizando uma publicação.
Comunicação científica em Saúde Hooman Momen Instituto Oswaldo Cruz Fiocruz.
Introdução à Bioinformática
Construção de modelos tridimensionais de macromoléculas
Universidade Federal de Viçosa
Introdução aos Sistemas Gerenciadores de Banco de Dados
Introduction of RefSeq and LocusLink: resources at the NCBI
Embase é uma base de dados internacional, conhecida por sua extensa cobertura da literatura biomédica e de drogas, produzida pela Elsevier. Com mais de.
O Surgimento dos Sistemas de Bioinformática
Bioinformática Estruturas de Banco de Dados
Bancos de Dados Biológicos
Formato de Arquivos e Bancos de Dados Biológicos
Formato de Arquivos e Banco de Dados Biológicos II
Denise Perdigão BASE DE DADOS Denise Perdigão
In Investigação científica Campana,A.O. ; Organizador Editora Manole
Metabolismo de Construção.
EMBRAPA _ Foco: Dados  Conhecimento
PORTAL.PERIODICOS CAPES Iniciado no ano 2000 o Portal oferece acesso ao texto completo de revistas científicas e tecnológicas, acesso a bases de dados.
Transcription and Translation
Engineering Village. Engineering Village – A Plataforma Desenvolvida pela Engineering Information (Ei), líder em fornecer informações.
Aula 10 – Ácidos Nucléicos
Curso em Editoração Eletrônica por meio de Seminários
MEDLINE. É a fonte mais abrangente do mundo em revistas médicas especializadas, fornecendo o texto completo de quase revistas especializadas indexadas.
Softwares de Análises Estatísticas em Biologia Sistêmica
American Chemical Society Fundada em 1876, a American Chemical Society (ACS) é uma sociedade científica que conta com mais de membros. Sua primeira.
Bancos de dados para análise de sequências de DNA
Pesquisa em bases de dados na área da saúde
1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva
Buscando Informação Médica na Internet
MÓDULO 4 Como usar PubMed
Portal.periodicos.CAPES IEEE/IEE ELECTRONIC LIBRARY – IEL
Bancos de Dados Natália F. Martins. BD de Seqüências Há uma quantidade gigantesca de informação sobre biomoléculas em BD públicos Mais de 348 BD –BD de.
Introdução à Bioinformática
Sequencia de aminoácidos
Divisão Técnica de Biblioteca e Documentação Universidade Estadual Paulista “Julio de Mesquita Filho” Campus de Botucatu Análise de citações Luciana Pizzani.
Introdução à Biologia Molecular História Cadeias de DNA e de Proteínas.
PathogenPortal Bioinformática Universidade da Beira Interior Ciências Biomédicas Grupo 7 Manuela Pereira nº Bárbara Mendes nº25433 Mafalda Neto nº26132.
Allan Lima  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology 
Buscando Informação Médica na Internet NIB - Núcleo de Informática Biomédica Universidade Estadual de Campinas.
ACS Publications Visão geral do programa de publicação de periódicos da ACS.
Sistema de Bibliotecas da UFU Atualizado em fevereiro de 2009.
American Chemical Society Fundada em 1876, a American Chemical Society (ACS) é a maior sociedade científica do mundo; conta com mais de membros.
IF803 - Introdução à Biologia Molecular Computacional Katia Guimarães 2008/2.
Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação Faculdade Fabrai-Anhanguera 1.
Links e recursos utilizados ou recomendados no curso Alguns dos links sugeridos ou utilizados no curso. As referências ausentes nessa apresentação são.
Ácidos Nucléicos.
Banco de Dados I Introdução – UNIDESC O que é um Banco de Dados? Um banco de dados é uma coleção de dados (ou informações) organizadas de forma.
Projeto de Banco de Dados
FERRAMENTAS DE ANÁLISE MOLECULAR
* Com o avanço das descobertas acerca dos Ácidos Nucléicos e das Proteínas surgiu o Dogma da biologia Molecular; * Surgimento dos métodos de sequenciamento.
Bioinformática e O Projeto GENOMA EST da CANA
Introdução à Biologia Molecular
HighWire Press. HighWire Press é uma divisão da Stanford University Libraries, que desde 1995 tem a missão de auxiliar na disseminação de informação acadêmica.
BASES DE DADOS Acesso e Uso.
Pesquisa Em Saúde Profª Andreia
Interface da Base de Dados PubMed (Curso Básico: Módulo 4)
Prof. João Ricardo Andrêo Programação p/ INTERNET - HTML 31/5/ :32 1 LISTAS Listas de Definição Estas listas são chamadas também “Listas de Glossário”,
Bem-vindo à Biblioteca Digital de Teses e Dissertações da UFMG Esse tutorial vai te auxiliar na navegação do site!
Eliana Kátia Pupim Doutoranda em CI pela UNESP Marília.
EBSCO Information Services Experiências Empresariais de apoio ao acesso digital à informação 2o. Seminário sobre Informação na Internet Brasília, 27 de.
Transcrição da apresentação:

Bioinformática Felipe G. Torres

FELIPE G TORRES Graduado em Sistemas de Informação. Mestrando em Computação Aplicada – linha de pesquisa em bioinformática. fgtorres18@gmail.com http://www.4shared.com/folder/iMzBTBBF/Bioinformtica.html

INTRODUÇÃO A necessidade de processar e analisar dados biológicos motivou o surgimento de uma ciência interdisciplinar. Alguns biólogos começaram a utilizar o computador para executar processos nos dados. O conjunto desses processos é chamado de Bioinformática.

INTRODUÇÃO Existem dois tipos de experimentos biológicos: In vivo – Experimentos executados com seres vivos. In vitro – Experimentos executados com dados desenvolvimento artificial.

INTRODUÇÃO Existem basicamente três tipos de análises de dados genéticos: Proteínas DNA RNA

INTRODUÇÃO

INTRODUÇÃO Década de 60…

INTRODUÇÃO Tempo 13 anos (1990 - 2003) Custo U$3.8 bilhões

INTRODUÇÃO BANCO DE D. B. ESTRUT. COMP. DADOS BIO. BANCO DE DADOS ATUAIS FERRAMENTAS 10

11

ILLUMINA HISEQ2000 SANGER TOTAL DE BASES: 35 ~ 200 Gb TEMPO DA CORRIDA: 1.5 a 8 dias CUSTO: MENOS DE U$1/Mb TOTAL DE BASES: 30~ 350 kb TEMPO DA CORRIDA: 15 HORAS CUSTO: U$1000/Mb 12

INTRODUÇÃO O que são nucleotídeos ? Os nucleotídeos são compostos por uma base nitrogenada, um grupo fosfato e uma ribose ou desoxiribose.

INTRODUÇÃO

INTRODUÇÃO

INTRODUÇÃO Onde posso encontrar nucleotídeos ?

INTRODUÇÃO Direção da sequência 3’ 5’ e 5’ 3’

INTRODUÇÃO

INTRODUÇÃO Aminoácidos são moléculas orgânicas complexas formadas por:  um grupo amina e um grupo carboxilo.

INTRODUÇÃO Atualmente a bioquímica categoriza basicamente 20 nomes de aminoácidos basicamente. Os aminoácidos são cientificamente representados por 1 ou 3 letras.

INTRODUÇÃO AMINOÁCIDOS

INTRODUÇÃO As proteínas são macromoléculas formadas por aminoácidos. Uma proteína como exemplo é a insulina humana. Insulina = (30 glycines, 44 alanines, 5 tyrosines + 14 glutamines + ... ) Insulina = MALWMRLLPLLALLALWGPDPAAAF VNQHLCGSHLVEALYLVCGERGFFYTPKTRREAEDLQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN

INTRODUÇÃO

INTRODUÇÃO A análise de proteínas à 50 anos atrás era realizada apenas em laboratórios. Nesta disciplina posteriormente iremos nos aprofundar em análises modernas de proteínas com bioinformática.

INTRODUÇÃO Alfred Sanger é tipo como pai da era moderna da biologia molecular e estrutural. Ele recebeu o prêmio nobel pelo sequenciamento da insulina.

INTRODUÇÃO Porém nos anos 1960 o poder computacional era pequeno, nessa época o computador tinha no máximo 8mb de memória. Processava cálculos simples e demoravam um tempo alto para realizar cálculos. Essa limitação durante muito tempo foi um fator limitante para as análises computacionais de dados biológicas.

INTRODUÇÃO A sequência lógica de obtenção das informações de uma proteína é: ESTRUTURA SEQUÊNCIA FUNÇÃO

INTRODUÇÃO A primeira estrutura 3D de proteína obtida foi em 1958 pelos Dr. Kendrew e Perultz utilizando cristalografia de raio X. A função da proteína está diretamente ligada a sua estrutura 3D. Com a bioinformática ficou muito mais fácil obter a estrutura 3D de uma proteína e navegar por ela.

INTRODUÇÃO Existe uma área conhecida como bioinformática estrutural. Esta responsável por estudar e desenvolver processos de análise das estruturas moleculares. Posteriormente iremos aprender técnicas e nos aprofundar mais na análise de bioinformática de proteínas.

INTRODUÇÃO

INTRODUÇÃO As proteínas são formadas de aminoácidos, e os aminoácidos são formados de quê ?

Isso mesmo, nucleotídeos. INTRODUÇÃO As proteínas são formadas de aminoácidos, e os aminoácidos são formados de quê ? Isso mesmo, nucleotídeos.

BANCO DE DADOS BIO 1965 1970 1982

BANCO DE DADOS BIO GRÁFICO DE SEQUÊNCIAS NUCLEOTÍDICAS INSERIDAS NO GENBANK ENTRE 1995 A 2011.

BANCO DE DADOS BIO GRÁFICO DE SEQUÊNCIAS NUCLEOTÍDICAS INSERIDAS NO GOLD ENTRE 1997 A 2011.

BANCO DE DADOS BIO Banco de dados biológicos são locais computacionais para o armazenamento de dados biológicos. Dados Biológicos Sequências de DNA; Sequências de Proteínas; Anotações;

BANCO DE DADOS BIO Tipos de Bancos de dados biológicos, (XIONG, 2007): Primários Secundários Especializados

BANCO DE DADOS BIO Bancos de dados Primários: Armazenam informações biológicas originais. Armazenam normalmente em arquivos de texto. Ex.: Fasta.

BANCO DE DADOS BIO Bancos de dados Secundários: Armazenam resultados de análises feitas a partir de dados primários. Utilizam SGBD`s e estruturas computacionais mais complexas.

ESTRUTURA DE BD Modelo Relacional Orientação a objeto

MODELO RELACIONAL Planilhas que se relacionam Utilizando o conceito de keys Largamente utilizado e estável

MODELO RELACIONAL

MODELO OO Conceito abstrato de objeto Conceito melhorado de keys Maior facilidade na abstração

MODELO OO

TIPO DE ARQUIVOS - FASTA

TIPO DE ARQUIVOS - GENBANK

TIPO DE ARQUIVOS - GENBANK

UNIPROT Banco de dados de proteínas e informações funcionais. O UNIPROT é um consórcio entre: European Bioinformatics Institute (EBI). Swiss Institute of Bioinformatics (SIB). Protein Information Resource (PIR). Acesso disponível pelo link: http://www.uniprot.org/

HIV DATABASE No HIV Databases estam armazenados dados de sequências de HIV, epitopos e testes para vacinas. Este projeto foi fundado pela Division of AIDS of the National Institute of Allergy and Infectious Diseases (NIAID) Acesso disponível pelo link: http://www.hiv.lanl.gov/content/index

PROTEIN DATA BANK É um repositório de estruturas tri-dimensionais de proteínas e ácidos nucléicos. A maioria das estruturas foram obtidas por cristalograma ou por espectroscopia por ressonância magnética. A estrutura pode ser visualizada em 3D. Acesso disponível pelo link: http://www.rcsb.org/pdb

ENTREZ O NCBI armazena dados provenientes da sequenciação de genomas no seu GenBank e mantém um índice de artigos de investigação biomédica que disponibiliza nas bases de dados PubMed Central e PubMed. Todas as bases de dados estão disponíveis na Internet através do motor de busca Entrez. É um grande integrador de dados no NCBI. Acesso disponível pelo link: http://www.ncbi.nlm.nih.gov/sites/gquery

ENTREZ - DEFINIÇÃO É o sistema de indexação, busca e recuperação de informação baseado em texto usado pelo Portal NCBI. Integra recursos de diversas fontes de informação em Ciências Biológicas e da Saúde.

ENTREZ - RECURSOS Bases de Dados referenciais e textuais Literatura em Ciências Biológicas e da Saúde Bancos de Dados Genéticos Bases de Dados Moleculares Ferramentas e Recursos em Biologia Genômica Ferramentas de Mineração de Dados (Data Mining)

ENTREZ - ACESSO Clique aqui para obter descrição e link de todas as bases de dados disponíveis no Portal NCBI

Descrição e link de todas as bases de dados disponíveis no Portal NCBI ENTREZ - ACESSO Descrição e link de todas as bases de dados disponíveis no Portal NCBI

ENTREZ - RECURSOS Bases de Dados referenciais e textuais Literatura em Ciências Biológicas e da Saúde Bancos de Dados Genéticos Bases de Dados Moleculares Ferramentas e Recursos em Biologia Genômica Ferramentas de Mineração de Dados (Data Mining)

ENTREZ - LITERATURA PUBMED: biomedical literature citations and abstracts PUBMED CENTRAL: free, full text journal articles SITE SEARCH: NCBI web and FTP sites BOOKS: online books JOURNALS: detailed information about the journals indexed in PubMed and other NLM CATALOG: catalog of books, journals, and audiovisuals in the NLM collections

ENTREZ - LITERATURA Clique aqui para acessar as bases de dados em literatura em Ciências Biológicas e da Saúde

ENTREZ - LITERATURA Lista de todas as bases de dados em literatura em Ciências Biológicas e da Saúde

ENTREZ - PUBMED Serviço da NLM que integra diversas bases de dados em Ciências Biológicas e da Saúde. Permite o acesso a mais de 17 milhões de itens indexados pela MEDLINE e de artigos de periódicos, livros, multimeios, entre outros recursos de informação. A base PubMed inclui links para muitos sites que fornecem resumos e/ou textos completos de artigos e outros recursos de informação.

ENTREZ - PUBMED A interface da base PubMed é a mesma do Portal NCBI, com filtro de pesquisa apenas para a PubMed

Links específicos da base PubMed ENTREZ - PUBMED Links específicos da base PubMed

ENTREZ – PUBMED CENTRAL PubMed Central é um acervo digital de artigos de periódicos de livre acesso em Ciências Biológicas e da Saúde, desenvolvido e gerenciado pelo NCBI. Também faz parte da base PubMed, com o diferencial de que seus recursos de informação estão disponíveis quase sempre em texto completo

ENTREZ – PUBMED CENTRAL A interface da base PubMed Central é a mesma do Portal NCBI, com filtro de pesquisa apenas para a PubMed Central

MÃOS NA MASSA 1- Busque no NCBI as sequências de Transversotrema. 2- Baixe todas as sequências em um único arquivo .FASTA 3- Descubra a localização geográfica da coleta do organismo de acession id: JF412530

Bioinformática Felipe G. Torres