A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Gene Projects Marcelo Falsarella Carazzolle Laboratório de Genômica e Proteômica Unicamp.

Apresentações semelhantes


Apresentação em tema: "Gene Projects Marcelo Falsarella Carazzolle Laboratório de Genômica e Proteômica Unicamp."— Transcrição da apresentação:

1 Gene Projects mcarazzo@lge.ibi.unicamp.br Marcelo Falsarella Carazzolle Laboratório de Genômica e Proteômica Unicamp

2 Motivação Muitos dados são gerados num projeto genoma : –Fungo Crinipellis Perniciosa : 170.000 reads 26000 contigs + singlets 70% hits encontrados no NR –Café 200.000 reads 35000 contigs + singlets 80% hits encontrados NR Necessidade de explorar os dados no decorrer do sequenciamento

3 Estratégias mais eficientes para buscar genes : –Busca por palavras chaves em resultados de blasts (Keyword Search) –Busca por sequências similares (Blast Search) –Busca por padrões de repetição (Pattern Search) Estratégia para eliminar redundância : –Clusterização

4 Introdução Gene Projects é uma programa que permite : –Realizar buscas por : Palavra chave Similaridade de sequências Padrões –Fazer clusterizações dos reads de interesse e analisar a qualidade da montagem –Visualizar a sequência fasta e o resultado de blast dos reads e dos contigs formados –Ampliar o contig na busca de genes inteiros –Burcas ORFs (ORFFinder) –Armazenar todos em resultados em projetos –Trabalhar via WEB

5 Uma visão geral WWW Gene Projects Banco de Dados Ferramentas de Buscas Análise Palavra chave SequênciaPadrões Visualizar sequências e blasts Clusterização Visualizar sequências, blasts, montagens, ORFs e... Reads Contigs

6 Temáticas Fluxograma: projeto genoma

7 Submissão - Phred - Cross_Match Blastx/n contra nr/nt Relatório Sequência Fasta Qualidade das bases Informação sobre vetores Armazena os arquivos de Blasts Alimenta o banco de dados com : - Qualidade do read (qte bases > 20) - Tamanho do read - Resultado da blastagem (e-value, score, cabeçalho) - Vetores (qte bases com vetor) Serviço de submissão

8 >Unknown sequences #1 5 6 5 7 10 9 10 12 15 16 17 20 20 23 25 30 30 30 40 40 45 50 50 50...

9 Gene Projects - Busca de seqüências por: - Palavra chave; - Blast Sequences; - Seqüências específicas. - Pattern search - Filtros de qualidade de nucleotídeos. - Visualização das seqüências selecionadas: - “Clusterização” utilizando o software Phrap/Cap3 - Análise de contigs e singlets por : - Blast contra nr; - Blast contra reads; - ORFFinder. - Ferramenta para fechamento de contigs através de Blast saturação.

10 Iniciando um projeto Cadastro de usuário Inclusão de projetos Não usar espaços ou caracteres especiais para o usuário e nome do projeto

11 Ferramentas de busca

12 Reads search

13 Ferramentas de busca Keyword search

14 Ferramentas de busca Blast search

15 Ferramentas de busca Pattern search N - Qualquer nucleotídeo N(3) - Uma sequência de três nucleotídeos N(2,4) - Uma sequência de 2,3 ou 4 nucleotídeos [AC] - pode ser um A ou um C {AG} - não pode ser nem A e nem G Ex : [CG](5)TG{A}N(1,5)C

16 Interface de projetos

17 >Contig1 xxxxxxxxxtgatgcacgtcgac tctataggatcaatatcctagccag aaaacttctcggtcaaggtctgtat gacaaagtctcgcaagcatctgta gagctctactcggaag CP01-S0-001-001-A01-UC.F CP01-S0-001-001-A04-UC.F

18 >Contig1 xxxxxxxxxtgatgcacgtcgactctata ggatcaatatcctagccagaaaacttctcg gtcaaggtctgtatgacaaagtctcgcaag catctgtagagctctactcggaag Blastn/reads CP01-S0-001-001-A01-UC.F CP01-S0-001-001-A04-UC.F Blastando... Sequencias que produziram alinhamentos significantes : CP01-S0-001-001-A01-UC.F 1419 0.0 -> Existente CP01-S0-001-001-A04-UC.F 1291 0.0 -> Existente CP02-PF-012-001-D08-UE.R 1263 0.0 -> Incluido CP02-S2-000-028-H06-UE.F 1261 0.0 -> Incluido Se não existirem novas inclusões : FIM Se existirem novas inclusões : Acrescenta os novos reads Clusterizando novamente >Contig1 xxxxxxxxxtgatgcacgtcgactctataggatcaatatcctag ccagaaaacttctcggtcaaggtctgtatgacaaagtctcgcaa gcatctgtagagctctactcggaagatatatatatatatatatat … Se o tamanho do novo contig exceder o limite : FIM Blast Saturação

19 Anotação automática de genes GERAÇÃO DE SEMENTES: - Localização de uma ORF em um contig; - Comparação de ORFs novas com genes existentes; - Anotação automática nos bancos nr e GO (Gene Ontology Consortium); - Identificação de regiões promotora e codante; - Atualização de genes existentes INTERFACE DE ANOTAÇÃO: - Resultado do GO; - Resultados de Blast contra nr; - Classificação baseada no GO : - Função molecular; - Processo biológico; - Componente celular. - Ferramentas de busca em sites por: - Palavra chave; - Blast Sequences. - Histórico de anotação; - Consulta de genes anotados

20 ORFFinder Análise dos clusters

21 Blastn contra a montagem geral

22

23 Interface de Anotação GeneProjects

24 Conclusão Permite a mineração dos dados em qualquer instante do projeto Facilita a busca de genes específicos Armazena todos os resultados em projetos Possui ferramentas de ampliação e análise de seqüências codantes Faz a conexão do novo contig gerado com a montagem geral Disponibiliza todos os esses serviços via WEB

25 FIM


Carregar ppt "Gene Projects Marcelo Falsarella Carazzolle Laboratório de Genômica e Proteômica Unicamp."

Apresentações semelhantes


Anúncios Google