Bioinformática Felipe G. Torres.

Slides:



Advertisements
Apresentações semelhantes
Organização Gênica de Eucariotos
Advertisements

BIBLIOTECAS DE DNA ou BANCOS DE DNA FABIANA SEIXAS
KEGG: Enciclopédia de Genes e Genomas de Kyoto
Expressão génica.
TRANSCRIÇÃO Biologia Molecular Profª Marília Scopel Andrighetti.
Universidade Federal de Viçosa
Montagem e análise de genomas
Seqüenciamento parcial de transcritos
Uso da bioinformática na análise genômica
Eukaryotic and prokaryotic promoter prediction using hybrid approach Hao Lin Qian-Zhong Li Theory in Biosciences, 2011.
Transcrição do RNA em Organismos Procariotos e Eucariotos
Regulação da Expressão Gênica
Regulação da Expressão Gênica em Procariotos
Regulação da Expressão Gênica em Organismos Eucariotos
O Surgimento dos Sistemas de Bioinformática
Identificar e caracterizar todos os genes Genscan, FGENES and MZEF
Anotação de SAGE Tags Rodrigo Martins Brandão.
Introdução à expressão gênica
Regulação da Expressão Genética
QBQ 0102 – Educação Física Carlos Hotta Transcrição 04/06/13.
Genômica funcional e metagenômica
Regulação da Expressão Gênica em Procariotos
RNAs não codificadores
ÁCIDO DESOXIRRIBONUCLEICO
ÁCIDOS NUCLEICOS.
Genômica e Proteômica 1) Genômica Estrutural O que é Genômica ?
Aula 8 – Proteínas II: Síntese Protéica
Replicação, transcrição e tradução
Transcrição e processamento de RNA em eucariotos
Organização Gênica de Eucariotos
QBQ 0102 – Educação Física Carlos Hotta Controle da expressão gênica
REGULAÇÃO DA EXPRESSÃO GÊNICA
IF803 - Introdução à Biologia Molecular Computacional Profa. Katia Guimarães 2007/2.
A genética e os genes.
Predição computacional de genes
Bancos de Dados Natália F. Martins. BD de Seqüências Há uma quantidade gigantesca de informação sobre biomoléculas em BD públicos Mais de 348 BD –BD de.
ESTRUTURA; Replicação; Transcrição;
Estrutura e função de ácidos nucleicos, Replicação de DNA, transcrição e processamento de RNA, expressão gênica.
CAP3 (Contig Assembly Program)
Reconhecimento de Genes Marcílio C. P. de Souto DIMAp/UFRN.
Introdução à Biologia Molecular História Cadeias de DNA e de Proteínas.
Análises de sequências
Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro
Silberschatz, Galvin and Gagne ©2009 Operating System Concepts – 8 th Edition Capítulo 10: Interface de Sistemas de Arquivos.
RepeatMasker Aluno: Fred Ulisses maranhão Professora: Kátia S. Guimarães Algoritmos p/ processamento de Cadeias, Cin, UFPE - 1/2001.
Seqüenciamento e genômica
Identificação dos Genes de uma cadeia de DNA com a ferramenta GENSCAN
Identificação dos Genes de uma cadeia de DNA com a ferramenta GENSCAN Lauro Didier Lins Junho de 2001.
Introdução à Biologia Molecular Computacional
GenScan Katia Guimarães.
A INFORMAÇÃO ADQUIRE FORMA BIOLÓGICA PROFA. GISELLE MOURA MESSIAS
Sequenciamento de Genomas
Gene Projects Marcelo Falsarella Carazzolle Laboratório de Genômica e Proteômica Unicamp.
RNA-SEQ: CONCEITO E APLICAÇÕES
IF803 - Introdução à Biologia Molecular Computacional Katia Guimarães 2008/2.
Variação Gênica Variação Gênica em Bactéria
Principais algoritmos de alinhamento de sequências genéticas
Alinhamentos Múltiplos
Biologia Molecular RNA.
Aplicações em Redes Neurais Artificiais De acordo com Turbam, McLean e Wetherbe (2004), “a computação neural também pode ser combinada com outros sistemas.
Bioinformática Felipe G. Torres.
FERRAMENTAS DE ANÁLISE MOLECULAR
* Com o avanço das descobertas acerca dos Ácidos Nucléicos e das Proteínas surgiu o Dogma da biologia Molecular; * Surgimento dos métodos de sequenciamento.
Bioinformática e O Projeto GENOMA EST da CANA
Dogma central da biologia molecular
CENTRO DE GENOMICA E FITOMELHORAMENTO Introdução à Bioinformática
ANÁLISE EM LARGA ESCALA DE EXPRESSÃO GÊNICA DIFERENCIAL ENTRE DIVERSAS
Hidden Markov Models 2 de maio de K … 1 2 K … 1 2 K … … … … 1 2 K … x1x1 x2x2 x3x3 xKxK 2 1 K 2.
Controle da Expressão Gênica
EXPRESSÃO GÊNICA.
Transcrição da apresentação:

Bioinformática Felipe G. Torres

DICA http://www.cellbiol.com/

TERMOS IMPORTANTES READS: Trechos sequenciados de DNA. CONTIG: Macro trechos formato pela junção de reads. LOW QUALITY: Regiões com baixa região, seja por falha de artefato ou metodológica. QUALIDADE: Certeza de identificação do nucleotídeo em um determinado sítio.

MONTAGEM DE GENOMAS É um subprocesso do workflow de obtenção da sequencia de DNA. Consiste em pegar os reads gerados no processo de sequenciamento e montar um ou vários contigs. Afim de unificar os reads em uma sequência consensus que é a sequência do DNA.

WORKFLOW - MONTAGEM ANÁLISE DE QUALIDADE SEQUENCIAMENTO MONTAGEM DOS CONTIGS

SEQUENCIAMENTO O sequenciamento do DNA é uma série de processos bioquímicos tem por finalidade determinar a ordem dos nucleotídeos. Método Sanger Pirosequenciamento Nova Geração

COMO É ARMAZENADO OS DADOS DO SEQUENCIAMENTO EM UM ARQUIVO ?

SEQUENCIAMENTO O arquivo usado para armazenar esse tipo de dado é o .FASTQ Este arquivo não é lido de uma forma agradável pois muitas vezes possui o seu conteúdo binário. Para lidar com ele normalmente é feita a conversão para o modelo FASTA.

ANÁLISE Essa conversão não é tão simples pois envolve uma análise de qualidade. Existem regiões que possuem ruídos que necessitam ser avaliados. Essa avaliação pode ser feita por diversos softwares. Ex:. PHRED & PHRAP

ANÁLISE http://asparagin.cenargen.embrapa.br/phph/

MÃOS NA MASSA 1- Pegue o arquivo seq2.zip 2- Analise a qualidade do sequenciamento e gere os arquivos FASTA.

APENAS SEQUENCIAR O DNA DE UM ORGANISMO RESPONDE TODAS AS PERGUNTAS ?

ANOTAÇÃO GENÔMICA Ter a sequência do genoma de um organismo não responde todas as perguntas... Mas ABRE PORTAS É necessário entender, mapear e identificar todas as estruturas gênicas presentes nesse genoma. Esse processo de explorar e entender melhor a estrutura de um genoma é conhecido por anotação.

ANOTAÇÃO GENÔMICA Este processo tem ganhado muita força recentemente devido: Ganho de tempo Redução de erros de artefatos Entendimento melhor dos organismos Redução de custos

ANOTAÇÃO GENÔMICA ANOTAÇÃO GENÔMICA PROCESSO DE ANOTAÇÃO ESTRUTURAL FUNCIONAL

ANOTAÇÃO ESTRUTURAL A anotação estrutural consiste na identificação e mapeamento de estruturas genômicas: GENES RNAnc REGIÕES PROMOTORAS

ANOTAÇÃO ESTRUTURAL Essa identificação é feita utilizando técnicas de predição gênica. Os preditores são especializados para seres eucariotos e procariotos. Essa especificação deve-se a diferença da complexidade das estruturas do genoma.

ANOTAÇÃO ESTRUTURAL Alguns preditores conhecidos são: GLIMMER, GENSCAN e GENMARK. Eucarioto Procarioto GENSCAN GLIMMER GENMARK

DICA http://www.bioplanet.com/

GLIMMER É um sistema de identificação de genes em DNA de procariotos, especialmente bacteria e archaea. GLIMMER (Gene Locator and Interpolated Markov ModelIER). Ele utiliza a interpolação de Markov para definir a probabilidade de uma região ser codificante.

GLIMMER

GLIMMER http://www.ncbi.nlm.nih.gov/genomes/MICROBES/glimmer_3.cgi

GLIMMER - RESULTADO ID: São números identificadores de possíveis genes. Frame: É o frame de leitura da ORF. Positivo indica a fita foward e Negativo indica a reverse.

GLIMMER - RESULTADO Start: Sítio de início do gene ou da ORF. Stop: Sítio de início do gene ou da ORF.

GLIMMER - RESULTADO Length: Tamanho do ORF e do Gene.

MÃOS NA MASSA 1- Procure no NCBI uma sequência da Leishmania braziliensis. 2- Utilizando o GLIMMER, analise a sequência em busca de genes.

GENSCAN É um sistema de identificação de genes em DNA de eucariotos. O GENSCAN pode ser usado para localização de exon-intron em sequências. Desenvolvido pelo MIT, este software pode ser executado utilizando a web. Ele utiliza cadeias de Markov do estado oculto para predizer as estruturas.

GENSCAN

GENSCAN http://genes.mit.edu/GENSCAN.html

GENSCAN - RESULTADO Gn.Ex : Número de identificação da estrutura. Type : Init = Initial exon (ATG to 5' splice site) Intr = Internal exon (3' splice site to 5' splice site) Term = Terminal exon (3' splice site to stop codon) Sngl = Single-exon gene (ATG to stop) Prom = Promoter (TATA box / initation site) PlyA = poly-A signal (consensus: AATAAA)

GENSCAN - RESULTADO S : DNA strand (+ = input strand; - = opposite strand) Begin : beginning of exon or signal (numbered on input strand) End : end point of exon or signal (numbered on input strand) Len : length of exon or signal (bp)

GENSCAN - RESULTADO CodRg : coding region score (tenth bit units) P : probability of exon (sum over all parses containing exon) Tscr : exon score (depends on length, I/Ac, Do/T and CodRg scores)

DICA http://www.softberry.com/

SOFTBERRY O softberry é uma plataforma de bioinformática que permite a execução de softwares sem instalar. Você pode executar softwares como: BLAST FGNESH

ANOTAÇÃO FUNCIONAL A anotação funcional consiste na identificação das funções executadas pelas estruturas identificadas. Normalmente para este tipo de anotação utiliza-se algoritmos de similaridade entre bases de dados anotadas. A comparação é feita entre o desconhecido e o conhecido e anotado.

Proteinas preditas similares a existentes ANOTAÇÃO FUNCIONAL Proteínas anotadas Comparação Proteinas preditas Proteinas preditas similares a existentes BLAST BLAT BOWTIE

ANOTAÇÃO FUNCIONAL Esta metodologia tem algumas limitações que por muitas vezes resultam diretamente no resultado do projeto. Por exemplo, a base de dados conhecida precisa ter uma variedade alta de sequências. Você pode está procurando similaridade entre coisas impossíveis.

ANOTAÇÃO FUNCIONAL Existem algumas bases conhecidas e consolidadas: SWISS-PROT: Base de dados de proteínas curadas manualmente e mantida pela UNIPROT. NRDR: Base de dados de RNA não codificante.

ANOTAÇÃO FUNCIONAL Existem algumas bases conhecidas e consolidadas: EGGNOG: Base de dados de proteínas e grupos de Orthologia.

ANOTAÇÃO FUNCIONAL Esse processo é lento devido a grande quantidade de comparações. A escolha do algoritmo de comparação deve ser feita analisando o tipo de dado que será comparado. Nesse processo a escolha e formatação dos dados está diretamente ligado ao sucesso da técnica.

MÃOS NA MASSA 1- Pegue as proteinas 2,3,4,5 e descubra: Qual o organismo ? Qual é a proteína ? Qual a função da proteína ?

TERMOS GO Mas como descobrir a função de uma proteína ? Será que terei que difere o processo para organismos diferentes ?

TERMOS GO O Gene Onthology é a maior iniciativa da área de bioinformática para unificar os produtos gênicos atribuídos a todas as espécies. O GO é na verdade uma metodologia de classificar proteínas por: Componente Celular Processo Biológico Função Molecular

TERMOS GO Existem três tipos de termos GO: Componente celular: É um componente celular ou no desenvolvimento extracelular. Processo biológico: São produtos gênicos envolvidos processos vitais para a célula.

TERMOS GO Existem três tipos de termos GO: Função molecular: São produtos gênicos envolvidos em alguma função intracelular.

GO http://geneontology.org/

AMIGO http://amigo.geneontology.org/amigo

MÃOS NA MASSA 1- Pegue as proteinas 4 e descubra: Qual a função da proteína ?

Bioinformática Felipe G. Torres