Carregar apresentação
A apresentação está carregando. Por favor, espere
PublicouAna Luísa Lagos Ferrão Alterado mais de 8 anos atrás
1
ANÁLISE EM LARGA ESCALA DE EXPRESSÃO GÊNICA DIFERENCIAL ENTRE DIVERSAS
BIBLIOTECAS DE SOJA Leandro Costa do Nascimento
2
OBJETIVOS Construção de um banco de dados local de ESTs de soja, separados por tecido e cultivar Montagem dos ESTs Interface web para análise de expressão gênica (Eletronic Northern) Anotação automática de genes Banco de dados local de microarrays de soja Integração entre os bancos de dados
4
RESUMO Introdução Projeto GENOSOJA
Banco local de ESTs de soja (baixados do NCBI) Montagem – contigs e singlets Interface web para análise de expressão gênica (Eletronic Northern)
5
A SOJA Origem na China Genoma com cerca de 1,1 Gbp
Genoma razoavelmente complexo – ciclos de duplicações e sequências repetitivas (40 a 60%) - (Shoemaker et al, 1996) Considerada planta modelo para estudo genético do grupo dos Phaseoloids
6
A IMPORTÂNCIA DA SOJA Alto poder nutritivo – grande quantidade de proteínas Óleo de soja responde por 25% dos óleos consumidos no mundo Uso na prevenção de doenças
7
A SOJA NO BRASIL Líder das exportações agropecuárias brasileiras – cerca de 24% O país é o 2º maior produtor mundial Área plantada aumentou 57 vezes desde 1961 Produção concentrada no Centro-Oeste Mais viável para biodiesel – explosão do cultivo
8
OS LÍDERES DA SOJA * Números em milhões de toneladas
Fonte: Departamento de Agricultura dos EUA (USDA –
9
PORQUE BIODIESEL DE SOJA??
Óleo de girassol tem o maior potencial para a produção, porém demanda grandes investimentos (à longo prazo) Parque produtivo da soja já está instalado e voltado para o agronegócio Desvantagens: provável aumento do preço do óleo de soja e do desmatamento da floresta amazônica
10
O PROJETO GENOSOJA Consórcio nacional integrando diversos grupos de pesquisa Busca integrar informações da estrutura física do genoma com informações sobre a expressão dos genes e as proteínas codificadas por eles Ênfase em genes ligados com estresses que comprometem a cultura – secas, doenças e pragas
11
O PROJETO GENOSOJA Disponibilizar informações referente a funcionalidade dos genes, a fim de gerar conhecimento que leve a novas alternativas de controle aos principais entraves que comprometem a cultura Criar um banco de dados relacional entre as diferentes estratégias do projeto e de outros grupos de pesquisa de espécies próximas
12
BIOINFORMÁTICA - GENOSOJA
Desenvolvimento de um serviço de submissão de sequências, análises computacionais e buscas comparativas nos bancos de dados gerados pelo consórcio e em bancos públicos Análises de expressão gênica através de tratamento de dados de microarray, SAGE e eletronic northern
14
BANCO LOCAL DE ESTs O banco de ESTs do NCBI contém quase sequências de soja Sequências não estão tratadas (sem exclusão de vetor, cauda Poly-A etc) Pertencem a diversos cultivares e bibliotecas Diversas são advindas de bibliotecas subtrativas
15
PIPELINE – MONTAGEM DO BANCO DE DADOS
As sequências foram filtradas por publicação Exclusão de sequências de publicações que usaram bibliotecas subtrativas Exclusão de sequências de publicações com menos de sequências submetidas Sequências resultantes:
16
PIPELINE – MONTAGEM DO BANCO DE DADOS
Junção de cultivares semelhantes – exemplo: Williams e Williams 82 17 cultivares, sendo que mais de 50% das sequências pertence a somente um deles 3696 sequências sem informação de cultivar 32212 sequências sem informação do tecido
17
DISTRIBUIÇÃO DAS SEQUÊNCIAS - CULTIVARES
18
DISTRIBUIÇÃO DAS SEQUÊNCIAS - TECIDOS
19
PREPARAÇÃO PARA A MONTAGEM
Quase 75 % das sequências tinham informações relativas à qualidade Bases consideradas de qualidade receberam nota 20, as outras nota 5 Para as sequências sem informação de qualidade todas as bases receberam nota 20 Montagem em conjunto ou separadamente??? BLAST CONTRA O GENOMA!!!
20
GENOMA DA SOJA Montagem preliminar disponibilizada no início do ano pelo JGI Cultivares Williams e Williams 82 13 milhões de reads de shotgun 3317 contigs -> quase 1 bilhão de pares de bases Cobertura: 8x Número de CDS: 62199
22
TRIMAGEM DAS SEQUÊNCIAS
ESTs Remoção de sequências ribossomais Remoção de regiões de baixa qualidade Remoção de Poly-A/T Remoção de sequências de vetor Remoção de sequências Curtas Montagem
23
TRIMAGEM DAS SEQUÊNCIAS
Programa bdtrimmer (Baudet et al, 2005) Remoção de sequências menores que 100 bases Sequências resultantes:
24
COMPARAÇÃO ENTRE AS MONTAGENS
Programa CAP3 Região de overlap = 100 bases
25
COMPARAÇÃO ENTRE AS MONTAGENS
26
COMPARAÇÃO ENTRE AS MONTAGENS
Média de reads por contig
27
COMPARAÇÃO ENTRE AS MONTAGENS
Média de bases por contig
28
COMPARAÇÃO ENTRE AS MONTAGENS
> Singlets > Contigs > Identidade < Reads /Contig < Bases / Contig Como escolher a melhor montagem?? MONTAGENS X CDS DO GENOMA
29
MONTAGEM X CDS Blastn dos reads (após trimagem) contra o CDS do genoma (evalue de corte 1e-10) Objetivos: Buscar contigs com reads que alinhavam com diferentes CDS Buscar reads pertencentes ao mesmo do CDS, mas que entravam em contigs diferentes
30
ANÁLISE DA MONTAGEM
31
CONTIGS DE BIBLIOTECAS ÚNICAS
32
BLASTx DOS CONTIGS
33
BLASTx DOS CONTIGS – FIRST HIT
34
ELETRONIC NORTHERN Inferência da expressão gênica à partir de uma montagem de ESTs Contig Tratado Controle
35
ELETRONIC NORTHERN Somente para bibliotecas não subtrativas
Frequência de ESTs de cada biblioteca em cada contig As estatísticas devem levar em conta o tamanho de cada biblioteca (normalização)
36
PORQUE UMA NOVA INTERFACE??
Facilidade de visualização Mais opções ao usuário Busca por biblioteca, contigs ou palavra-chave Análise estatística entre duas bibliotecas Agrupamento de genes diferencialmente expressos por G.O.
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.