Carregar apresentação
A apresentação está carregando. Por favor, espere
1
Bioinformática Felipe G. Torres
2
FELIPE G TORRES Graduado em Sistemas de Informação.
Mestrando em Computação Aplicada – linha de pesquisa em bioinformática.
4
INTRODUÇÃO A necessidade de processar e analisar dados biológicos motivou o surgimento de uma ciência interdisciplinar. Alguns biólogos começaram a utilizar o computador para executar processos nos dados. O conjunto desses processos é chamado de Bioinformática.
5
INTRODUÇÃO Existem dois tipos de experimentos biológicos:
In vivo – Experimentos executados com seres vivos. In vitro – Experimentos executados com dados desenvolvimento artificial.
6
INTRODUÇÃO Existem basicamente três tipos de análises de dados genéticos: Proteínas DNA RNA
7
INTRODUÇÃO
8
INTRODUÇÃO Década de 60…
9
INTRODUÇÃO Tempo 13 anos ( ) Custo U$3.8 bilhões
10
INTRODUÇÃO BANCO DE D. B. ESTRUT. COMP. DADOS BIO.
BANCO DE DADOS ATUAIS FERRAMENTAS 10
11
11
12
ILLUMINA HISEQ2000 SANGER TOTAL DE BASES: 35 ~ 200 Gb
TEMPO DA CORRIDA: 1.5 a 8 dias CUSTO: MENOS DE U$1/Mb TOTAL DE BASES: 30~ 350 kb TEMPO DA CORRIDA: 15 HORAS CUSTO: U$1000/Mb 12
13
INTRODUÇÃO O que são nucleotídeos ?
Os nucleotídeos são compostos por uma base nitrogenada, um grupo fosfato e uma ribose ou desoxiribose.
14
INTRODUÇÃO
15
INTRODUÇÃO
16
INTRODUÇÃO Onde posso encontrar nucleotídeos ?
17
INTRODUÇÃO Direção da sequência 3’ 5’ e 5’ 3’
18
INTRODUÇÃO
19
INTRODUÇÃO Aminoácidos são moléculas orgânicas complexas formadas por: um grupo amina e um grupo carboxilo.
20
INTRODUÇÃO Atualmente a bioquímica categoriza basicamente 20 nomes de aminoácidos basicamente. Os aminoácidos são cientificamente representados por 1 ou 3 letras.
21
INTRODUÇÃO AMINOÁCIDOS
22
INTRODUÇÃO As proteínas são macromoléculas formadas por aminoácidos. Uma proteína como exemplo é a insulina humana. Insulina = (30 glycines, 44 alanines, 5 tyrosines + 14 glutamines ) Insulina = MALWMRLLPLLALLALWGPDPAAAF VNQHLCGSHLVEALYLVCGERGFFYTPKTRREAEDLQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN
23
INTRODUÇÃO
24
INTRODUÇÃO A análise de proteínas à 50 anos atrás era realizada apenas em laboratórios. Nesta disciplina posteriormente iremos nos aprofundar em análises modernas de proteínas com bioinformática.
25
INTRODUÇÃO Alfred Sanger é tipo como pai da era moderna da biologia molecular e estrutural. Ele recebeu o prêmio nobel pelo sequenciamento da insulina.
26
INTRODUÇÃO Porém nos anos 1960 o poder computacional era pequeno, nessa época o computador tinha no máximo 8mb de memória. Processava cálculos simples e demoravam um tempo alto para realizar cálculos. Essa limitação durante muito tempo foi um fator limitante para as análises computacionais de dados biológicas.
27
INTRODUÇÃO A sequência lógica de obtenção das informações de uma proteína é: ESTRUTURA SEQUÊNCIA FUNÇÃO
28
INTRODUÇÃO A primeira estrutura 3D de proteína obtida foi em 1958 pelos Dr. Kendrew e Perultz utilizando cristalografia de raio X. A função da proteína está diretamente ligada a sua estrutura 3D. Com a bioinformática ficou muito mais fácil obter a estrutura 3D de uma proteína e navegar por ela.
29
INTRODUÇÃO Existe uma área conhecida como bioinformática estrutural.
Esta responsável por estudar e desenvolver processos de análise das estruturas moleculares. Posteriormente iremos aprender técnicas e nos aprofundar mais na análise de bioinformática de proteínas.
30
INTRODUÇÃO
31
INTRODUÇÃO As proteínas são formadas de aminoácidos, e os aminoácidos são formados de quê ?
32
Isso mesmo, nucleotídeos.
INTRODUÇÃO As proteínas são formadas de aminoácidos, e os aminoácidos são formados de quê ? Isso mesmo, nucleotídeos.
34
BANCO DE DADOS BIO 1965 1970 1982
35
BANCO DE DADOS BIO GRÁFICO DE SEQUÊNCIAS NUCLEOTÍDICAS INSERIDAS NO GENBANK ENTRE 1995 A 2011.
36
BANCO DE DADOS BIO GRÁFICO DE SEQUÊNCIAS NUCLEOTÍDICAS INSERIDAS NO GOLD ENTRE 1997 A 2011.
37
BANCO DE DADOS BIO Banco de dados biológicos são locais computacionais para o armazenamento de dados biológicos. Dados Biológicos Sequências de DNA; Sequências de Proteínas; Anotações;
38
BANCO DE DADOS BIO Tipos de Bancos de dados biológicos, (XIONG, 2007):
Primários Secundários Especializados
39
BANCO DE DADOS BIO Bancos de dados Primários:
Armazenam informações biológicas originais. Armazenam normalmente em arquivos de texto. Ex.: Fasta.
40
BANCO DE DADOS BIO Bancos de dados Secundários:
Armazenam resultados de análises feitas a partir de dados primários. Utilizam SGBD`s e estruturas computacionais mais complexas.
41
ESTRUTURA DE BD Modelo Relacional Orientação a objeto
42
MODELO RELACIONAL Planilhas que se relacionam
Utilizando o conceito de keys Largamente utilizado e estável
43
MODELO RELACIONAL
44
MODELO OO Conceito abstrato de objeto Conceito melhorado de keys
Maior facilidade na abstração
45
MODELO OO
46
TIPO DE ARQUIVOS - FASTA
47
TIPO DE ARQUIVOS - GENBANK
48
TIPO DE ARQUIVOS - GENBANK
49
UNIPROT Banco de dados de proteínas e informações funcionais.
O UNIPROT é um consórcio entre: European Bioinformatics Institute (EBI). Swiss Institute of Bioinformatics (SIB). Protein Information Resource (PIR). Acesso disponível pelo link:
50
HIV DATABASE No HIV Databases estam armazenados dados de sequências de HIV, epitopos e testes para vacinas. Este projeto foi fundado pela Division of AIDS of the National Institute of Allergy and Infectious Diseases (NIAID) Acesso disponível pelo link:
51
PROTEIN DATA BANK É um repositório de estruturas tri-dimensionais de proteínas e ácidos nucléicos. A maioria das estruturas foram obtidas por cristalograma ou por espectroscopia por ressonância magnética. A estrutura pode ser visualizada em 3D. Acesso disponível pelo link:
52
ENTREZ O NCBI armazena dados provenientes da sequenciação de genomas no seu GenBank e mantém um índice de artigos de investigação biomédica que disponibiliza nas bases de dados PubMed Central e PubMed. Todas as bases de dados estão disponíveis na Internet através do motor de busca Entrez. É um grande integrador de dados no NCBI. Acesso disponível pelo link:
53
ENTREZ - DEFINIÇÃO É o sistema de indexação, busca e recuperação de informação baseado em texto usado pelo Portal NCBI. Integra recursos de diversas fontes de informação em Ciências Biológicas e da Saúde.
54
ENTREZ - RECURSOS Bases de Dados referenciais e textuais
Literatura em Ciências Biológicas e da Saúde Bancos de Dados Genéticos Bases de Dados Moleculares Ferramentas e Recursos em Biologia Genômica Ferramentas de Mineração de Dados (Data Mining)
55
ENTREZ - ACESSO Clique aqui para obter descrição e link de todas as bases de dados disponíveis no Portal NCBI
56
Descrição e link de todas as bases de dados disponíveis no Portal NCBI
ENTREZ - ACESSO Descrição e link de todas as bases de dados disponíveis no Portal NCBI
57
ENTREZ - RECURSOS Bases de Dados referenciais e textuais
Literatura em Ciências Biológicas e da Saúde Bancos de Dados Genéticos Bases de Dados Moleculares Ferramentas e Recursos em Biologia Genômica Ferramentas de Mineração de Dados (Data Mining)
58
ENTREZ - LITERATURA PUBMED: biomedical literature citations and abstracts PUBMED CENTRAL: free, full text journal articles SITE SEARCH: NCBI web and FTP sites BOOKS: online books JOURNALS: detailed information about the journals indexed in PubMed and other NLM CATALOG: catalog of books, journals, and audiovisuals in the NLM collections
59
ENTREZ - LITERATURA Clique aqui para
acessar as bases de dados em literatura em Ciências Biológicas e da Saúde
60
ENTREZ - LITERATURA Lista de todas as bases de dados em literatura em Ciências Biológicas e da Saúde
61
ENTREZ - PUBMED Serviço da NLM que integra diversas bases de dados em Ciências Biológicas e da Saúde. Permite o acesso a mais de 17 milhões de itens indexados pela MEDLINE e de artigos de periódicos, livros, multimeios, entre outros recursos de informação. A base PubMed inclui links para muitos sites que fornecem resumos e/ou textos completos de artigos e outros recursos de informação.
62
ENTREZ - PUBMED A interface da base PubMed é a mesma do Portal NCBI, com filtro de pesquisa apenas para a PubMed
63
Links específicos da base PubMed
ENTREZ - PUBMED Links específicos da base PubMed
64
ENTREZ – PUBMED CENTRAL
PubMed Central é um acervo digital de artigos de periódicos de livre acesso em Ciências Biológicas e da Saúde, desenvolvido e gerenciado pelo NCBI. Também faz parte da base PubMed, com o diferencial de que seus recursos de informação estão disponíveis quase sempre em texto completo
65
ENTREZ – PUBMED CENTRAL
A interface da base PubMed Central é a mesma do Portal NCBI, com filtro de pesquisa apenas para a PubMed Central
66
MÃOS NA MASSA 1- Busque no NCBI as sequências de Transversotrema.
2- Baixe todas as sequências em um único arquivo .FASTA 3- Descubra a localização geográfica da coleta do organismo de acession id: JF412530
67
Bioinformática Felipe G. Torres
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.