A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Bioinformática Felipe G. Torres.

Apresentações semelhantes


Apresentação em tema: "Bioinformática Felipe G. Torres."— Transcrição da apresentação:

1 Bioinformática Felipe G. Torres

2 FELIPE G TORRES Graduado em Sistemas de Informação.
Mestrando em Computação Aplicada – linha de pesquisa em bioinformática.

3

4 INTRODUÇÃO A necessidade de processar e analisar dados biológicos motivou o surgimento de uma ciência interdisciplinar. Alguns biólogos começaram a utilizar o computador para executar processos nos dados. O conjunto desses processos é chamado de Bioinformática.

5 INTRODUÇÃO Existem dois tipos de experimentos biológicos:
In vivo – Experimentos executados com seres vivos. In vitro – Experimentos executados com dados desenvolvimento artificial.

6 INTRODUÇÃO Existem basicamente três tipos de análises de dados genéticos: Proteínas DNA RNA

7 INTRODUÇÃO

8 INTRODUÇÃO Década de 60…

9 INTRODUÇÃO Tempo 13 anos ( ) Custo U$3.8 bilhões

10 INTRODUÇÃO BANCO DE D. B. ESTRUT. COMP. DADOS BIO.
BANCO DE DADOS ATUAIS FERRAMENTAS 10

11 11

12 ILLUMINA HISEQ2000 SANGER TOTAL DE BASES: 35 ~ 200 Gb
TEMPO DA CORRIDA: 1.5 a 8 dias CUSTO: MENOS DE U$1/Mb TOTAL DE BASES: 30~ 350 kb TEMPO DA CORRIDA: 15 HORAS CUSTO: U$1000/Mb 12

13 INTRODUÇÃO O que são nucleotídeos ?
Os nucleotídeos são compostos por uma base nitrogenada, um grupo fosfato e uma ribose ou desoxiribose.

14 INTRODUÇÃO

15 INTRODUÇÃO

16 INTRODUÇÃO Onde posso encontrar nucleotídeos ?

17 INTRODUÇÃO Direção da sequência 3’ 5’ e 5’ 3’

18 INTRODUÇÃO

19 INTRODUÇÃO Aminoácidos são moléculas orgânicas complexas formadas por:  um grupo amina e um grupo carboxilo.

20 INTRODUÇÃO Atualmente a bioquímica categoriza basicamente 20 nomes de aminoácidos basicamente. Os aminoácidos são cientificamente representados por 1 ou 3 letras.

21 INTRODUÇÃO AMINOÁCIDOS

22 INTRODUÇÃO As proteínas são macromoléculas formadas por aminoácidos. Uma proteína como exemplo é a insulina humana. Insulina = (30 glycines, 44 alanines, 5 tyrosines + 14 glutamines ) Insulina = MALWMRLLPLLALLALWGPDPAAAF VNQHLCGSHLVEALYLVCGERGFFYTPKTRREAEDLQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN

23 INTRODUÇÃO

24 INTRODUÇÃO A análise de proteínas à 50 anos atrás era realizada apenas em laboratórios. Nesta disciplina posteriormente iremos nos aprofundar em análises modernas de proteínas com bioinformática.

25 INTRODUÇÃO Alfred Sanger é tipo como pai da era moderna da biologia molecular e estrutural. Ele recebeu o prêmio nobel pelo sequenciamento da insulina.

26 INTRODUÇÃO Porém nos anos 1960 o poder computacional era pequeno, nessa época o computador tinha no máximo 8mb de memória. Processava cálculos simples e demoravam um tempo alto para realizar cálculos. Essa limitação durante muito tempo foi um fator limitante para as análises computacionais de dados biológicas.

27 INTRODUÇÃO A sequência lógica de obtenção das informações de uma proteína é: ESTRUTURA SEQUÊNCIA FUNÇÃO

28 INTRODUÇÃO A primeira estrutura 3D de proteína obtida foi em 1958 pelos Dr. Kendrew e Perultz utilizando cristalografia de raio X. A função da proteína está diretamente ligada a sua estrutura 3D. Com a bioinformática ficou muito mais fácil obter a estrutura 3D de uma proteína e navegar por ela.

29 INTRODUÇÃO Existe uma área conhecida como bioinformática estrutural.
Esta responsável por estudar e desenvolver processos de análise das estruturas moleculares. Posteriormente iremos aprender técnicas e nos aprofundar mais na análise de bioinformática de proteínas.

30 INTRODUÇÃO

31 INTRODUÇÃO As proteínas são formadas de aminoácidos, e os aminoácidos são formados de quê ?

32 Isso mesmo, nucleotídeos.
INTRODUÇÃO As proteínas são formadas de aminoácidos, e os aminoácidos são formados de quê ? Isso mesmo, nucleotídeos.

33

34 BANCO DE DADOS BIO 1965 1970 1982

35 BANCO DE DADOS BIO GRÁFICO DE SEQUÊNCIAS NUCLEOTÍDICAS INSERIDAS NO GENBANK ENTRE 1995 A 2011.

36 BANCO DE DADOS BIO GRÁFICO DE SEQUÊNCIAS NUCLEOTÍDICAS INSERIDAS NO GOLD ENTRE 1997 A 2011.

37 BANCO DE DADOS BIO Banco de dados biológicos são locais computacionais para o armazenamento de dados biológicos. Dados Biológicos Sequências de DNA; Sequências de Proteínas; Anotações;

38 BANCO DE DADOS BIO Tipos de Bancos de dados biológicos, (XIONG, 2007):
Primários Secundários Especializados

39 BANCO DE DADOS BIO Bancos de dados Primários:
Armazenam informações biológicas originais. Armazenam normalmente em arquivos de texto. Ex.: Fasta.

40 BANCO DE DADOS BIO Bancos de dados Secundários:
Armazenam resultados de análises feitas a partir de dados primários. Utilizam SGBD`s e estruturas computacionais mais complexas.

41 ESTRUTURA DE BD Modelo Relacional Orientação a objeto

42 MODELO RELACIONAL Planilhas que se relacionam
Utilizando o conceito de keys Largamente utilizado e estável

43 MODELO RELACIONAL

44 MODELO OO Conceito abstrato de objeto Conceito melhorado de keys
Maior facilidade na abstração

45 MODELO OO

46 TIPO DE ARQUIVOS - FASTA

47 TIPO DE ARQUIVOS - GENBANK

48 TIPO DE ARQUIVOS - GENBANK

49 UNIPROT Banco de dados de proteínas e informações funcionais.
O UNIPROT é um consórcio entre: European Bioinformatics Institute (EBI). Swiss Institute of Bioinformatics (SIB). Protein Information Resource (PIR). Acesso disponível pelo link:

50 HIV DATABASE No HIV Databases estam armazenados dados de sequências de HIV, epitopos e testes para vacinas. Este projeto foi fundado pela Division of AIDS of the National Institute of Allergy and Infectious Diseases (NIAID) Acesso disponível pelo link:

51 PROTEIN DATA BANK É um repositório de estruturas tri-dimensionais de proteínas e ácidos nucléicos. A maioria das estruturas foram obtidas por cristalograma ou por espectroscopia por ressonância magnética. A estrutura pode ser visualizada em 3D. Acesso disponível pelo link:

52 ENTREZ O NCBI armazena dados provenientes da sequenciação de genomas no seu GenBank e mantém um índice de artigos de investigação biomédica que disponibiliza nas bases de dados PubMed Central e PubMed. Todas as bases de dados estão disponíveis na Internet através do motor de busca Entrez. É um grande integrador de dados no NCBI. Acesso disponível pelo link:

53 ENTREZ - DEFINIÇÃO É o sistema de indexação, busca e recuperação de informação baseado em texto usado pelo Portal NCBI. Integra recursos de diversas fontes de informação em Ciências Biológicas e da Saúde.

54 ENTREZ - RECURSOS Bases de Dados referenciais e textuais
Literatura em Ciências Biológicas e da Saúde Bancos de Dados Genéticos Bases de Dados Moleculares Ferramentas e Recursos em Biologia Genômica Ferramentas de Mineração de Dados (Data Mining)

55 ENTREZ - ACESSO Clique aqui para obter descrição e link de todas as bases de dados disponíveis no Portal NCBI

56 Descrição e link de todas as bases de dados disponíveis no Portal NCBI
ENTREZ - ACESSO Descrição e link de todas as bases de dados disponíveis no Portal NCBI

57 ENTREZ - RECURSOS Bases de Dados referenciais e textuais
Literatura em Ciências Biológicas e da Saúde Bancos de Dados Genéticos Bases de Dados Moleculares Ferramentas e Recursos em Biologia Genômica Ferramentas de Mineração de Dados (Data Mining)

58 ENTREZ - LITERATURA PUBMED: biomedical literature citations and abstracts PUBMED CENTRAL: free, full text journal articles SITE SEARCH: NCBI web and FTP sites BOOKS: online books JOURNALS: detailed information about the journals indexed in PubMed and other NLM CATALOG: catalog of books, journals, and audiovisuals in the NLM collections

59 ENTREZ - LITERATURA Clique aqui para
acessar as bases de dados em literatura em Ciências Biológicas e da Saúde

60 ENTREZ - LITERATURA Lista de todas as bases de dados em literatura em Ciências Biológicas e da Saúde

61 ENTREZ - PUBMED Serviço da NLM que integra diversas bases de dados em Ciências Biológicas e da Saúde. Permite o acesso a mais de 17 milhões de itens indexados pela MEDLINE e de artigos de periódicos, livros, multimeios, entre outros recursos de informação. A base PubMed inclui links para muitos sites que fornecem resumos e/ou textos completos de artigos e outros recursos de informação.

62 ENTREZ - PUBMED A interface da base PubMed é a mesma do Portal NCBI, com filtro de pesquisa apenas para a PubMed

63 Links específicos da base PubMed
ENTREZ - PUBMED Links específicos da base PubMed

64 ENTREZ – PUBMED CENTRAL
PubMed Central é um acervo digital de artigos de periódicos de livre acesso em Ciências Biológicas e da Saúde, desenvolvido e gerenciado pelo NCBI. Também faz parte da base PubMed, com o diferencial de que seus recursos de informação estão disponíveis quase sempre em texto completo

65 ENTREZ – PUBMED CENTRAL
A interface da base PubMed Central é a mesma do Portal NCBI, com filtro de pesquisa apenas para a PubMed Central

66 MÃOS NA MASSA 1- Busque no NCBI as sequências de Transversotrema.
2- Baixe todas as sequências em um único arquivo .FASTA 3- Descubra a localização geográfica da coleta do organismo de acession id: JF412530

67 Bioinformática Felipe G. Torres


Carregar ppt "Bioinformática Felipe G. Torres."

Apresentações semelhantes


Anúncios Google