A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Softwares de Análises Estatísticas em Biologia Sistêmica

Apresentações semelhantes


Apresentação em tema: "Softwares de Análises Estatísticas em Biologia Sistêmica"— Transcrição da apresentação:

1 Softwares de Análises Estatísticas em Biologia Sistêmica
V Conferência Sul em Modelagem Computacional Softwares de Análises Estatísticas em Biologia Sistêmica Prof. Dr. Éder Maiquel Simão Rio Grande, Setembro de 2012

2 Roteiro 1- Teoria 2- Prática 1.1 Introdução; 1.2 Informação Genética;
1.3 Formação do Câncer; 1.4 Expressão de Proteínas; 2- Prática 2.1 Normalização; 2.2 Atividade Relativa - Diversidade Relativa; 2.3 Mudança de Expressão; 2.4 Mapas Funcionais.

3 1.1 Introdução Biologia Sistêmica: Integração entre os fenômenos e as teorias que envolvem os sistemas biológicos. - Informação; - Abordagem sistêmica; O objetivo do mini curso será mostrar a funcionalidade de alguns softwares de análises estatísticas usados pela biologia sistêmica para investigar a expressão de vias e genes relacionados a doenças humanas. 1- Dados de expressão do GEO e genes da Ontologia Ontocancro; 2- Software R, com pacotes do Bioconductor; 3- Software ViaComplex; 4- Mapas Funcionais – Banco de Dados String.

4 1.2 Informação Genética Um cromossomo é uma longa sequência de DNA, que contém vários genes, e outras sequências de nucleotídeos com funções específicas nas células dos seres vivos.

5 Um conjunto de proteínas desempenha uma função específica.
Ex: - Proteínas que dão cor aos olhos; - Envolvidas na morte celular; - Na proliferação celular... (String)

6 1.4 EXPRESSÃO DE PROTEÍNAS
GENOMA PROTEOMA METABOLOMA interação prot-gene interação prot-prot Citrate synthase Malate dehydrogenase Fumarase Succinate dehydrogenase TRANSCRIPTOMA INTERATOMA

7 COMO MEDIR A EXPRESSÃO DE PROTEÍNAS?
Expressão de proteínas: Todos as células tem a mesma quantidade de genes e as células com funções diferentes produzem proteínas especializadas naquela função. COMO MEDIR A EXPRESSÃO DE PROTEÍNAS? 2 3 RNA-Seq MICROARRANJOS 2 3

8 Bancos de Dados

9 Adrenocortical Carcinomas , Adenomas
Bancos de Dados Adrenocortical Carcinomas , Adenomas GSE10927 Glândulas suprarrenais: Estimulam a conversão de proteínas e gorduras em glicose, ao mesmo tempo que diminuem a captação de glicose pelas células, aumentando, assim, a utilização de gorduras. PASTA 1- ARQUIVOS .CEL (GSE10927)

10 Software R com pacotes do Bioconductor
2.1 Normalização Software R com pacotes do Bioconductor

11

12

13

14

15

16 Gráfico de “bigodes”, indica a dispersão entre as amostras
Gráfico de “bigodes”, indica a dispersão entre as amostras. A linha preta é a mediana, a caixa representa os elementos entre o 10 e o 30 quadrante. ARQUIVOS .CEL

17 ABRINDO O ARQUIVO GSE10927_RMA.XLS
MATRIZ NORMALIZADA - Cada elemento representa uma sonda de um gene; - Cada linha corresponde ao valor de expressão do mesmo gene; - Cada Coluna corresponde a uma amostra (microarranjo) de um determinado tecido.

18 AGRUPAR OS TECIDOS 1- Criar 2 colunas em branco, separando as amostras; 2- Fazer a média entre as amostras; 3- Expandir o cálculo para todos os genes. 4- Criar nova planilha e colar as sondas com as médias;

19 5- Para gerar o arquivo de expressão usado no software ViaComplex devemos baixar o arquivo da plataforma referente a série que estamos analisando: 6- Deste arquivo 2 colunas são extraídas: - A primeira corresponde ao IDENTIFICADOR da SONDA; - A segunda corresponde ao SÍMBOLO APROVADO DO GENE. OBS: Passo já realizado.

20 ADENOMA x NORMAL e CÂNCER x NORMAL
7- Com a plataforma devemos formar as combinações de expressão a serem analisadas: ADENOMA x NORMAL e CÂNCER x NORMAL Observações Importantes: No arquivo TXT de expressão não pode aparecer o caractere “/” ou espaços em branco nas células de cálculo. # Devemos sempre cuidar o espaço existente no final do arquivo.

21 ADENOMA x NORMAL e CÂNCER x NORMAL
SALVAR CADA UM DESTES ARQUIVOS COMO: texto (separado por tabulação) PASTA 2 - Criar arquivos para o SOFTWARE VIACOMPLEX

22 BANCOS DE DADOS DE VIAS E GENES:
NCI PATHAWAY, REACTOME, BIOCARTA e ONTOLOGIA ONTOCANCRO PASTA 3 - VIAS E GENES - ONTOLOGIA ONTOCANCRO

23 2.2 Atividade Relativa - Diversidade Relativa
Câncer Normal Diversidade Entropia de Shannon Frequência da diversidade do gene i Atividade relativa Diversidade relativa

24

25

26

27

28 1- Encontrar as vias de interesse:
2.3 Mudança de Expressão No de vezes que a expressão varia entre os genes de uma via (conjunto de genes com uma determinada função) Câncer, adenoma Normal Para encontrar a mudança de expressão entre os genes de uma via: 1- Encontrar as vias de interesse:

29 PASTA 5 - Fold Change

30 Software R com pacotes do Bioconductor
Mudança de Expressão Software R com pacotes do Bioconductor Para efetuarmos os cálculos da mudança de expressão são necessários alguns arquivos importantes: 1- Vias de interesse; 2- Arquivo RData, salvo durante a Normalização dos dados; 3-Script.

31

32

33

34

35

36

37 2.4 Mapas funcionais http://ontocancro.inf.ufsm.br/
Objetivo: Através da atividade relativa iremos analisar a expressão das amostras de tecidos pré cancerosos do cólon em uma rede de proteínas envolvida na manutenção do genoma. Para isso precisaremos construir uma rede de interação.

38 Banco de Dados String Contém várias informações do genoma:
Incluí mais de 5 milhões de proteínas de 1133 Organismos

39

40

41

42

43

44 Arquivo Medusa Passo 6 - Software STRING

45

46

47

48 Resultado

49 Artigos publicados com os Softwares


Carregar ppt "Softwares de Análises Estatísticas em Biologia Sistêmica"

Apresentações semelhantes


Anúncios Google