Softwares de Análises Estatísticas em Biologia Sistêmica

Slides:



Advertisements
Apresentações semelhantes
PROJETOS GENOMA E PROTEOMA HUMANOS
Advertisements

BIBLIOTECAS DE DNA ou BANCOS DE DNA FABIANA SEIXAS
FOLHA DE CÁLCULO 1.
Construção de modelos tridimensionais de macromoléculas
Apresentação Tabular e Gráfica
Universidade Federal de Viçosa
MODELAGEM ESTOCÁSTICA DE SEQÜÊNCIAS DE DNA ATRAVÉS DE CADEIAS COM MEMÓRIA DE ALCANCE VARIÁVEL Denise Duarte 11 de junho de 2010.
BIOTECNOLOGIA E ENGENHARIA GENÉTICA
Introduction of RefSeq and LocusLink: resources at the NCBI
Metodologias para Aplicações Ambientais
Principios de Genética Microbiana
Clonagem A palavra "clone" vem do grego "klón", que significa "rebento" ou "broto". Os cientistas removem o material genético de uma óvulo não-fertilizado.
Educandário Nova Grécia Professor: Ronaldo Maio /Junho
O Surgimento dos Sistemas de Bioinformática
Anotação de SAGE Tags Rodrigo Martins Brandão.
DNA, GENES E CROMOSSOMAS
Word Professor: Leandro Crescencio
1 Validador dos Arquivos de Dados Questionário de Varejo 22/12/2006 Departamento de Operações Bancárias e de Sistema de Pagamentos.
Southern, Northern e Western Blot
Entendendo a herança genética (capítulo 5)
Microsoft Office Excel
CICLO CELULAR.
Emanuel Teixeira Nº24924 Bioengenharia
Genômica funcional e metagenômica
Introdução à Informática
ÁCIDO DESOXIRRIBONUCLEICO
Genômica e Proteômica 1) Genômica Estrutural O que é Genômica ?
Introdução ao Stata Aula 2 05 de abril de 2013.
Professor Antônio Ruas
Engenharia Genética.
A REVOLUÇÃO DA GENÉTICA
Bioinformática Prof. Paulo Fazendeiro Trabalho realizado por: • Ana Margarida Barata, nº • Ana Isabel Monteiro, nº • Henrique Matos Cardoso,
1 Validador dos Arquivos de Dados Quantitativos Questionário sobre Cartões de Pagamento Convênio BC, SDE e SEAE 19/9/2006 Departamento de Operações Bancárias.
Bancos de dados para análise de sequências de DNA
ANÁLISE EXPLORATÓRIA DE DADOS
REGULAÇÃO DA EXPRESSÃO GÊNICA
IF803 - Introdução à Biologia Molecular Computacional Profa. Katia Guimarães 2007/2.
Oficina de Aperfeiçoamento - Manejo de TABWIN e EPI INFO
Pesquisa e Captação de Recursos Humanos nas áreas de Automação Industrial, Software para Dispositivos Móveis e TV Digital FOMENTO: SAMSUNG.
Pensamento do Dia “O mais importante na vida não é o triunfo, mas a luta para o alcançar.” Pierre de Coubertin.
Bancos de Dados Natália F. Martins. BD de Seqüências Há uma quantidade gigantesca de informação sobre biomoléculas em BD públicos Mais de 348 BD –BD de.
Introdução ao Microsoft Word 2007
Diogo Silva Nº  1988 NCBI- Banco de dados público contendo sequências de DNA dos mais diversos organismos  1995 Técnica do microarranjo -perfil.
GENÉTICA Aula 7: Fundamentos das Tecnologias do DNA Recombinante
Graziele Fonseca de Sousa
Inferência de redes gênicas por métodos de seleção de características
Introdução à Biologia Molecular História Cadeias de DNA e de Proteínas.
Software de Apresentação: PowerPoint – conceitos básicos
ADN, genes e cromossomas
Bioinformática Nuno Santos a25303 Bioengenharia 2011/2012.
Marcílio C. P. de Souto DIMAp/UFRN
Estudo dos gráficos Objetivos: Como construir um gráfico.
Allan Lima  Revisão sobre BDs Biológicos  Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias  The Gene Ontology 
UNIVERSIDADE DA BEIRA INTERIOR Ana Rita Mendes, nº25167 Helena Pissarra, nº Rúben Pires, nº C. Biomédicas.
Introdução à Biologia Molecular Computacional
Neoplasia.
Sequenciamento de Genomas
IF803 - Introdução à Biologia Molecular Computacional Katia Guimarães 2008/2.
GENÉTICA E ENVELHECIMENTO
Representação gráfica dos dados estatísticos
Biologia 12 Unidade 2 – Património Genético Magda Charrua 2011/2012 Biologia 12º ano1.
Alinhamentos Múltiplos
Biologia 12 Unidade 2 – Património Genético Magda Charrua 2011/2012 Biologia 12º ano1.
EPIGENÉTICA.
FUNDAMENTOS DE BIOLOGIA
MatLab (Matrix Laboratory)
MEDICINA GENÔMICA Prof. MSc. Hélio Alves.
Profª Dalila Borges Justino Lins
Estatística Aplicada à Administração Prof. Alessandro Moura Costa INSTITUIÇÃO CURSO.
Transcrição da apresentação:

Softwares de Análises Estatísticas em Biologia Sistêmica V Conferência Sul em Modelagem Computacional Softwares de Análises Estatísticas em Biologia Sistêmica Prof. Dr. Éder Maiquel Simão Email: edersimao@gmail.com Rio Grande, Setembro de 2012

Roteiro 1- Teoria 2- Prática 1.1 Introdução; 1.2 Informação Genética; 1.3 Formação do Câncer; 1.4 Expressão de Proteínas; 2- Prática 2.1 Normalização; 2.2 Atividade Relativa - Diversidade Relativa; 2.3 Mudança de Expressão; 2.4 Mapas Funcionais.

1.1 Introdução Biologia Sistêmica: Integração entre os fenômenos e as teorias que envolvem os sistemas biológicos. - Informação; - Abordagem sistêmica; O objetivo do mini curso será mostrar a funcionalidade de alguns softwares de análises estatísticas usados pela biologia sistêmica para investigar a expressão de vias e genes relacionados a doenças humanas. 1- Dados de expressão do GEO e genes da Ontologia Ontocancro; 2- Software R, com pacotes do Bioconductor; 3- Software ViaComplex; 4- Mapas Funcionais – Banco de Dados String.

1.2 Informação Genética Um cromossomo é uma longa sequência de DNA, que contém vários genes, e outras sequências de nucleotídeos com funções específicas nas células dos seres vivos.

Um conjunto de proteínas desempenha uma função específica. Ex: - Proteínas que dão cor aos olhos; - Envolvidas na morte celular; - Na proliferação celular... (String)

1.4 EXPRESSÃO DE PROTEÍNAS GENOMA PROTEOMA METABOLOMA interação prot-gene interação prot-prot Citrate synthase Malate dehydrogenase Fumarase Succinate dehydrogenase TRANSCRIPTOMA INTERATOMA

COMO MEDIR A EXPRESSÃO DE PROTEÍNAS? Expressão de proteínas: Todos as células tem a mesma quantidade de genes e as células com funções diferentes produzem proteínas especializadas naquela função. COMO MEDIR A EXPRESSÃO DE PROTEÍNAS? 2 3 RNA-Seq MICROARRANJOS 2 3

Bancos de Dados http://www.ncbi.nlm.nih.gov/geo/

Adrenocortical Carcinomas , Adenomas Bancos de Dados Adrenocortical Carcinomas , Adenomas GSE10927 Glândulas suprarrenais: Estimulam a conversão de proteínas e gorduras em glicose, ao mesmo tempo que diminuem a captação de glicose pelas células, aumentando, assim, a utilização de gorduras. PASTA 1- ARQUIVOS .CEL (GSE10927)

Software R com pacotes do Bioconductor 2.1 Normalização Software R com pacotes do Bioconductor

Gráfico de “bigodes”, indica a dispersão entre as amostras Gráfico de “bigodes”, indica a dispersão entre as amostras. A linha preta é a mediana, a caixa representa os elementos entre o 10 e o 30 quadrante. ARQUIVOS .CEL

ABRINDO O ARQUIVO GSE10927_RMA.XLS MATRIZ NORMALIZADA - Cada elemento representa uma sonda de um gene; - Cada linha corresponde ao valor de expressão do mesmo gene; - Cada Coluna corresponde a uma amostra (microarranjo) de um determinado tecido.

AGRUPAR OS TECIDOS 1- Criar 2 colunas em branco, separando as amostras; 2- Fazer a média entre as amostras; 3- Expandir o cálculo para todos os genes. 4- Criar nova planilha e colar as sondas com as médias;

5- Para gerar o arquivo de expressão usado no software ViaComplex devemos baixar o arquivo da plataforma referente a série que estamos analisando: 6- Deste arquivo 2 colunas são extraídas: - A primeira corresponde ao IDENTIFICADOR da SONDA; - A segunda corresponde ao SÍMBOLO APROVADO DO GENE. OBS: Passo já realizado.

ADENOMA x NORMAL e CÂNCER x NORMAL 7- Com a plataforma devemos formar as combinações de expressão a serem analisadas: ADENOMA x NORMAL e CÂNCER x NORMAL Observações Importantes: No arquivo TXT de expressão não pode aparecer o caractere “/” ou espaços em branco nas células de cálculo. # Devemos sempre cuidar o espaço existente no final do arquivo.

ADENOMA x NORMAL e CÂNCER x NORMAL SALVAR CADA UM DESTES ARQUIVOS COMO: texto (separado por tabulação) PASTA 2 - Criar arquivos para o SOFTWARE VIACOMPLEX

BANCOS DE DADOS DE VIAS E GENES: NCI PATHAWAY, REACTOME, BIOCARTA e ONTOLOGIA ONTOCANCRO http://ontocancro.inf.ufsm.br/ PASTA 3 - VIAS E GENES - ONTOLOGIA ONTOCANCRO

2.2 Atividade Relativa - Diversidade Relativa Câncer Normal Diversidade Entropia de Shannon Frequência da diversidade do gene i Atividade relativa Diversidade relativa

1- Encontrar as vias de interesse: 2.3 Mudança de Expressão No de vezes que a expressão varia entre os genes de uma via (conjunto de genes com uma determinada função) Câncer, adenoma Normal Para encontrar a mudança de expressão entre os genes de uma via: 1- Encontrar as vias de interesse: http://ontocancro.inf.ufsm.br/

PASTA 5 - Fold Change

Software R com pacotes do Bioconductor Mudança de Expressão Software R com pacotes do Bioconductor Para efetuarmos os cálculos da mudança de expressão são necessários alguns arquivos importantes: 1- Vias de interesse; 2- Arquivo RData, salvo durante a Normalização dos dados; 3-Script.

2.4 Mapas funcionais http://ontocancro.inf.ufsm.br/ Objetivo: Através da atividade relativa iremos analisar a expressão das amostras de tecidos pré cancerosos do cólon em uma rede de proteínas envolvida na manutenção do genoma. Para isso precisaremos construir uma rede de interação. http://ontocancro.inf.ufsm.br/

Banco de Dados String Contém várias informações do genoma: Incluí mais de 5 milhões de proteínas de 1133 Organismos http://string-db.org/

Arquivo Medusa Passo 6 - Software STRING

Resultado

Artigos publicados com os Softwares