A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Uso da bioinformática na análise genômica

Apresentações semelhantes


Apresentação em tema: "Uso da bioinformática na análise genômica"— Transcrição da apresentação:

1 Uso da bioinformática na análise genômica

2 Receber Processar Anotar Depositar
Início Bioinformática Receber Processar Anotar Depositar Fim

3 Processamento de seqüências
20 30 10 cromatograma acgatctcgctagctgctactgtagccgcgattattcgcgatctacgtatatcgcgatcgatc O programa Phred lê o cromatograma e nomeia as bases Cada base tem uma chance de erro de sua nomeação (10% = 0,1) DNA: FASTA Seq.qual A escala de Phred é semelhante à de pH multiplicado por 10: - chance de erro de 0,001 = 10-3 = Phred 30 A nomeação é praticamente aleatória no início e no final, onde a chance de erro é alta (baixo valor de Phred)

4 Crescimento do GenBank
Seqüências 15 milhões 24h Europeu Japonês 606 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 Ano

5 (seqüenciador grande) Eucariotos
Seqüencias do DNA (genoma) Seqüências do mRNA (genes expressos) Repetição calculada draft = 5x finished = 10x Amostragem tecidos momentos Genoma pequeno (seqüenciador grande) Eucariotos mRNA TR cDNA

6 Seqüenciamento parcial de transcritos

7 EST (Etiqueta de Seqüência Expressa)
Seqüênciamento de genes expressos: Documentar a existência de transcritos gênicos num transcriptoma [otorrin... e ...damonh...] EST (Etiqueta de Seqüência Expressa) seqüenciamento único de cada cDNA extremidades 5’ ou 3’ ORESTES (ESTs ricas em ORFs) seqüenciamento único do amplicon derivado de cDNA por PCR inespecífico prevalece o centro do cDNA (cds)

8 Um mRNA & suas ESTs 5’EST 3’EST 5’EST 3’EST mRNA AUG ATG cDNA (fita +)
ATCATGACTTACGGGCGCGCGAT AAATTTATTATCC (T)18 5’EST cDNA (fita -) 3’EST mRNA AUG cDNA (fita +) (A)200 (A)18 GGCGCGCGATATCC AAATTTATTATCCATCTACG (T)18 5’EST cDNA (fita -) 3’EST Quantas ESTs de Schistosoma mansoni há no NCBI? Quantas proteínas não mitocondriais?

9 PCR inespecífico & seu ORESTES
amplicon (fita -) amplicon (fita +) PCR (60ºC) +ORESTES (outros iniciadores) mRNA amplicon (fita +) AUG GGGCGCGCGATATCGAAAAATTTATAAGGCTAG (A)200 CCCCGGCGGCTCGGCCGGGGAGATCGATCATGAC AGATCGATCATGACTTACGGGCGCGCGATATCG ORESTES cDNA (fita -) Iniciador (60ºC ºC) Quantos ORESTES estão hoje no NCBI? Eles são ESTs? Só há ORESTES humanos?

10 250 200 150 100

11 2. Estudando coleções de sequências
Alinhamento de um grupo pequeno de sequências com MultiAlign Descarregando um grande número de sequências através do BatchEntrez Formação de aglomerados de sequências com Icatools, com Cap3 ou Megablast Estimando distância evolutiva com Phylip

12 Aglomerados ou Clusters
Uma das atividades em bioinformática é formar aglomerados de todas as sequências geradas no projeto (as figurinhas de um álbum) Podemos saber quantas vezes um gene foi seqüenciado, e detectar os freqüentes! E quantos dos genes foram detectados Usa-se também para validar bibliotecas Pode usar dados originais ou descarregados do NCBI

13 Alinhamento global: usar para publicar
Quando se quer comparar globalmente as sequências, busca-se o melhor alinhamento global Um bom algoritmo computacional é o usado no Fast Alignment, apelidado de FASTA

14 Descarregando muitas seqüências com BatchEntrez
Inicialmente busque suas seqüências Descarregue uma lista dos indicadores delas (GI) Use o BatchEntrez para baixar o FASTA das seqüências Estude-as localmente com seu programa predileto

15 Alinhamento Global Comparação exaustiva Visando
Use o BatchEntrez para baixar o FASTA das seqüências Estude-as localmente com seu programa predileto

16 Phylip Genes ortólogos são os homólogos mais próximos entre dois organismos (BestHit) A evolução os faz diferentes Phylip DNAdist mede Phylip Protdist para proteínas Plylip Neighbor faz uma matriz E um desenhador de árvore:

17 Programas para aglomerar
Icatools Phrap Cap3, Cap4 Swat BLAST MegaBLAST Um aglomerado = Um gene

18 UniGene Organização das sequências do GenBank em um conjunto de aglomerados Cada aglomerado do UniGene contém as sequências que representam um gene único E também informações relacionadas, como em que tecidos o gene é expresso, etc. E também onde está mapeado

19 MegaBLAST gera o UniGene
Todas ESTs contra todas Detecção de homologia > 96% de identidade > 70% do potencial Aglomerar

20 Qualidade das bibliotecas (100 primeiras ESTs)
Número de seqüências Boa biblioteca ? 1 2 3 4 5 7 9 11 Freqüência em que uma EST foi amostrada

21 SNP catcgatcgatcgtcgtagctacgtagctagctagctagctagctagctaactagctgactg
catcgatcgatcgtcgtagctacgtagctagctagctagctagctagctagctagctgactg catcgatcgatcgtcgtagctacgtagctagctagctagctagctagctagctagctgactg catcgatcgatggtcgtagctacgtagctagctagctagctagctagctagctagctgactg catcgatcgatcgtcgtagctacgtagctagctagctagctagctagctagctagctgactg catcgatcgatcgtcgtagctacgtagctagctagctagctagctagctagctagctgactg catcgatcgatcgtcgtagctacgtagctagctagctagctagctagctagctagctgactg catcgatcgatcgtcgtagctacgtagctagctagctagctagctagctagctagctgactg catcgatcgatcgtcgtagctacgtagctagctagctagctagctagctagctagctgactg catcgatcgatcgtcgtagctacgtagctatctagctagctagctagctagctagctgactg catcgatcgatcgtcgtagctacgtagctagctagctagctagctagctagctagctgactg catcgattgatcgtcgtagctacgtagctagctagctagctagctagctagctagctgactg catcgatcgatcgtcgtagctacgtagctagctagctagctagctagctagctagctgactg catcgatcgatcgtcgtagctacgtagctagctagctagctagctagctagctagctgactg catcgatcgatcgtcgtagctacgtagctagctagctagctagctagctagctagctgactg catcgatcgatcgtcgtagctacgtagctagctagctagctagctagctagctagctgactg catcgatcgatcgtcgtagctacgtagctagctagctagctagctagctagctagctgactg SNP


Carregar ppt "Uso da bioinformática na análise genômica"

Apresentações semelhantes


Anúncios Google