A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

ANÁLISE EM LARGA ESCALA DE EXPRESSÃO GÊNICA DIFERENCIAL ENTRE DIVERSAS

Apresentações semelhantes


Apresentação em tema: "ANÁLISE EM LARGA ESCALA DE EXPRESSÃO GÊNICA DIFERENCIAL ENTRE DIVERSAS"— Transcrição da apresentação:

1 ANÁLISE EM LARGA ESCALA DE EXPRESSÃO GÊNICA DIFERENCIAL ENTRE DIVERSAS
BIBLIOTECAS DE SOJA Leandro Costa do Nascimento

2 OBJETIVOS Construção de um banco de dados local de ESTs de soja, separados por tecido e cultivar Montagem dos ESTs Interface web para análise de expressão gênica (Eletronic Northern) Anotação automática de genes Banco de dados local de microarrays de soja Integração entre os bancos de dados

3

4 RESUMO Introdução Projeto GENOSOJA
Banco local de ESTs de soja (baixados do NCBI) Montagem – contigs e singlets Interface web para análise de expressão gênica (Eletronic Northern)

5 A SOJA Origem na China Genoma com cerca de 1,1 Gbp
Genoma razoavelmente complexo – ciclos de duplicações e sequências repetitivas (40 a 60%) - (Shoemaker et al, 1996) Considerada planta modelo para estudo genético do grupo dos Phaseoloids

6 A IMPORTÂNCIA DA SOJA Alto poder nutritivo – grande quantidade de proteínas Óleo de soja responde por 25% dos óleos consumidos no mundo Uso na prevenção de doenças

7 A SOJA NO BRASIL Líder das exportações agropecuárias brasileiras – cerca de 24% O país é o 2º maior produtor mundial Área plantada aumentou 57 vezes desde 1961 Produção concentrada no Centro-Oeste Mais viável para biodiesel – explosão do cultivo

8 OS LÍDERES DA SOJA * Números em milhões de toneladas
Fonte: Departamento de Agricultura dos EUA (USDA –

9 PORQUE BIODIESEL DE SOJA??
Óleo de girassol tem o maior potencial para a produção, porém demanda grandes investimentos (à longo prazo) Parque produtivo da soja já está instalado e voltado para o agronegócio Desvantagens: provável aumento do preço do óleo de soja e do desmatamento da floresta amazônica

10 O PROJETO GENOSOJA Consórcio nacional integrando diversos grupos de pesquisa Busca integrar informações da estrutura física do genoma com informações sobre a expressão dos genes e as proteínas codificadas por eles Ênfase em genes ligados com estresses que comprometem a cultura – secas, doenças e pragas

11 O PROJETO GENOSOJA Disponibilizar informações referente a funcionalidade dos genes, a fim de gerar conhecimento que leve a novas alternativas de controle aos principais entraves que comprometem a cultura Criar um banco de dados relacional entre as diferentes estratégias do projeto e de outros grupos de pesquisa de espécies próximas

12 BIOINFORMÁTICA - GENOSOJA
Desenvolvimento de um serviço de submissão de sequências, análises computacionais e buscas comparativas nos bancos de dados gerados pelo consórcio e em bancos públicos Análises de expressão gênica através de tratamento de dados de microarray, SAGE e eletronic northern

13

14 BANCO LOCAL DE ESTs O banco de ESTs do NCBI contém quase sequências de soja Sequências não estão tratadas (sem exclusão de vetor, cauda Poly-A etc) Pertencem a diversos cultivares e bibliotecas Diversas são advindas de bibliotecas subtrativas

15 PIPELINE – MONTAGEM DO BANCO DE DADOS
As sequências foram filtradas por publicação Exclusão de sequências de publicações que usaram bibliotecas subtrativas Exclusão de sequências de publicações com menos de sequências submetidas Sequências resultantes:

16 PIPELINE – MONTAGEM DO BANCO DE DADOS
Junção de cultivares semelhantes – exemplo: Williams e Williams 82 17 cultivares, sendo que mais de 50% das sequências pertence a somente um deles 3696 sequências sem informação de cultivar 32212 sequências sem informação do tecido

17 DISTRIBUIÇÃO DAS SEQUÊNCIAS - CULTIVARES

18 DISTRIBUIÇÃO DAS SEQUÊNCIAS - TECIDOS

19 PREPARAÇÃO PARA A MONTAGEM
Quase 75 % das sequências tinham informações relativas à qualidade Bases consideradas de qualidade receberam nota 20, as outras nota 5 Para as sequências sem informação de qualidade todas as bases receberam nota 20 Montagem em conjunto ou separadamente??? BLAST CONTRA O GENOMA!!!

20 GENOMA DA SOJA Montagem preliminar disponibilizada no início do ano pelo JGI Cultivares Williams e Williams 82 13 milhões de reads de shotgun 3317 contigs -> quase 1 bilhão de pares de bases Cobertura: 8x Número de CDS: 62199

21

22 TRIMAGEM DAS SEQUÊNCIAS
ESTs Remoção de sequências ribossomais Remoção de regiões de baixa qualidade Remoção de Poly-A/T Remoção de sequências de vetor Remoção de sequências Curtas Montagem

23 TRIMAGEM DAS SEQUÊNCIAS
Programa bdtrimmer (Baudet et al, 2005) Remoção de sequências menores que 100 bases Sequências resultantes:

24 COMPARAÇÃO ENTRE AS MONTAGENS
Programa CAP3 Região de overlap = 100 bases

25 COMPARAÇÃO ENTRE AS MONTAGENS

26 COMPARAÇÃO ENTRE AS MONTAGENS
Média de reads por contig

27 COMPARAÇÃO ENTRE AS MONTAGENS
Média de bases por contig

28 COMPARAÇÃO ENTRE AS MONTAGENS
> Singlets > Contigs > Identidade < Reads /Contig < Bases / Contig Como escolher a melhor montagem?? MONTAGENS X CDS DO GENOMA

29 MONTAGEM X CDS Blastn dos reads (após trimagem) contra o CDS do genoma (evalue de corte 1e-10) Objetivos: Buscar contigs com reads que alinhavam com diferentes CDS Buscar reads pertencentes ao mesmo do CDS, mas que entravam em contigs diferentes

30 ANÁLISE DA MONTAGEM

31 CONTIGS DE BIBLIOTECAS ÚNICAS

32 BLASTx DOS CONTIGS

33 BLASTx DOS CONTIGS – FIRST HIT

34 ELETRONIC NORTHERN Inferência da expressão gênica à partir de uma montagem de ESTs Contig Tratado Controle

35 ELETRONIC NORTHERN Somente para bibliotecas não subtrativas
Frequência de ESTs de cada biblioteca em cada contig As estatísticas devem levar em conta o tamanho de cada biblioteca (normalização)

36 PORQUE UMA NOVA INTERFACE??
Facilidade de visualização Mais opções ao usuário Busca por biblioteca, contigs ou palavra-chave Análise estatística entre duas bibliotecas Agrupamento de genes diferencialmente expressos por G.O.

37


Carregar ppt "ANÁLISE EM LARGA ESCALA DE EXPRESSÃO GÊNICA DIFERENCIAL ENTRE DIVERSAS"

Apresentações semelhantes


Anúncios Google