Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel
Abordagens da aula... 1. Tipos de variárveis 2. Apresentação dos dados através de gráficos e tabelas 3. Interpretação de tabelas 4. Interpretação de gráficos
Divisão da estatística Estatística descritiva Apenas descreve os dados observações – conjunto de dados amostra – número de indivíduos variáveis – qualquer aspecto do indivíduo que pode ser medido e que apresenta distintos valores Estatística analítica Testa formalmente diferenças, isto é, compara grupos
Estatística descritiva Técnicas estatísticas que permitem uma primeira aproximação à realidade estudada, na procura de algum padrão As técnicas estatísticas diferem em função do tipo de variável que está sendo analisada
Duas principais classes de variáveis Desfecho – variável principal que estamos interessados, cuja variação ou ocorrência estamos interessados em entender Ex: Bebês nascidos com baixo peso (s/n) Ex: Expressão gênica do gene Bcl-2 em células tumorais Exposição – fator que pode influenciar o tamanho ou a ocorrência do desfecho Ex: Mãe fumou durante a gestação (s/n) Ex: Dif. conc. de droga usada para inibir o crescimento da célula tumoral
Outros termos usados Desfecho Exposição Variável resposta Variável explanatória Variável dependente Variável independente Fator de risco
Tipos de variáveis Qualitativa ou categórica Quantitativa ou numérica Politômica Dicotômica ou binária Discreta (números inteiros) Contínua (números reais) Nominal Ordinal
Qualitativa ou categórica Dicotômica ou binária sim / não morreu / não morreu doente / saudável desnutrido / normal masculino / feminino maturo / imaturo viável / não-viável
Qualitativa ou categórica Politômica Nominal (não existe uma ordem nas respostas) estado civil tipo de acidente de trânsito cor da pele religião genótipo Ordinal (existe uma ordem) nível econômico idade (em grupos) grau de instrução grau de progressão do tumor grau de desenvolvimento embrionário
Quantitativa ou numérica Discreta Só números inteiros contagens idade (em anos) número de filhos número de blastômeros tempo de resposta Contínua Números com vírgula medidas nível de expressão gênica altura peso toxicicidade celular
Variáveis derivadas Idade Renda familiar Coletada em anos completos numérica discreta Categorizada em grupos de idade categórica ordinal (20 a 29; 30 a 39; 40 a 49 anos) Renda familiar Coletada em reais numérica contínua Categorizada em quintis de renda categórica ordinal (1º a 5º quintil)
Variáveis derivadas IMC (Índice de Massa Corporal- kg/m2) Altura em m Peso em Kg numérica contínua (23,3; 25,1; 30,3; 31,0...) categórica ordinal (normal / sobrepeso / obeso) dicotômica: obeso (s/n)
Apresentação dos dados Tabelas Gráficos Tipo de variável Tipo de apresentação
Apresentação dos dados Os dados podem ser resumidos e organizados com o uso de estatísticas Em tabelas quando é importante a apresentação dos valores Em gráficos ou mapas apresentação de distribuições, tendências ou relacionamentos entre variáveis
Tabelas Apresentação sumária dos resultados “mais importantes” Auto-explicativas Idealmente não precisa recorrer ao texto Abreviações explicadas Apresentação clara Tabelas não têm linhas verticais (quadro sim) Linhas horizontais entre título e cabeçalhos das colunas entre cabeçalhos e dados no final
Variável categórica dicotômica Qual a freqüência de inatividade física nos indivíduos da amostra? Inativos | Freq. Percent Cum. ------------+----------------------------------- nao | 1837 58.90 58.90 sim | 1282 41.10 100.00 Total | 3119 100.00
Variável categórica dicotômica Tabela 1 - Frequência de inatividade física em indivíduos adultos e idosos residentes em Pelotas, RS. Variável N Percentual Inatividade física Sim Não 1282 1837 41,1% 58,9% 2 variáveis dicotômicas
Duas variáveis dicotômicas Qual a frequência de inatividade física conforme o sexo? Inativos | sexo | masculino feminino | Total -----------+----------------------+---------- não | 809 1028 | 1837 | 59.79 58.21 | 58.90 sim | 544 738 | 1282 | 40.21 41.79 | 41.10 Total | 1353 1766 | 3119 | 100.00 100.00 | 100.00 Pearson chi2(1) = 0.7924 Pr = 0.373
Duas variáveis dicotômicas Tabela 2 - Frequência de inatividade física (IF) conforme o sexo em 3119 indivíduos adultos e idosos residentes em Pelotas, RS. * Teste do qui-quadrado para heterogeneidade Variável Percentual de IF Valor-p Sexo Masculino Feminino 40,2% 41,8% 0,4*
Variável categórica ordinal Qual a distribuição dos indivíduos da amostra por nível econômico? Nível econ.| | Freq. Percent Cum. ------------+----------------------------------- A | 147 4.64 4.64 B | 600 18.93 23.56 C | 1270 40.06 63.63 D | 1026 32.37 95.99 E | 127 4.01 100.00 Total | 3170 100.00
Variável categórica ordinal Tabela 3 - Distribuição da amostra de adultos e idosos conforme o nível econômico. Pelotas, RS, Brasil, 2002. Variável N Percentual Nível econômico A B C D E 147 600 1270 1026 127 4,6% 18,9% 40,2% 32,4% 4,0%
Variável categórica ordinal Tabela 4 – Estado civil dos indivíduos.
2 variáveis categóricas: 1 ordinal x 1 nominal Tabela 5 – Estado civil dos indivíduos por faixa etária.
Quantitativa ou numérica Qual o nível de expressão gênica do NPY em peixes adultos e juvenis? Descriptive Statistics for JUVENIS = 1 Variable N Mean SD Minimum Maximum Juvenis 4 1.0000 0.1225 0.8176 1.0714 Descriptive Statistics for ADULTOS = 2 Adultos 4 1.8569 0.2445 1.5868 2.1727
Exemplo: médias estratificadas por sexo Barbosa-Silva MC, Barros AJ, Post CL et al. Can Bioelectrical Impedance Analysis Identify Malnutrition in Preoperative Nutrition Assessment? Nutrition 2003;19:422– 426.
Gráfico de barras Distribuição de frequência de variáveis categóricas Barras separadas No eixo X marcar as categorias No eixo Y marcar a frequência absoluta ou relativa (%) Quando se tem um no. pequeno de observações, marcar o no. absoluto em vez da % Escala do Y: SEMPRE iniciar do zero
Por que iniciar o eixo Y do zero? Taxas de inflação (dados fictícios)
Gráfico de barras
Gráfico de barras - apresentação Figura 1 - Percentual dos níveis sociais (Abipeme) para o Brasil (1991) e famílias de crianças freqüentando creches gratuitas em Campinas (1994).
Gráfico de barras – artigo científico Figura 1 - Percentual dos níveis sociais (Abipeme) para o Brasil (1991) e famílias de crianças freqüentando creches gratuitas em Campinas (1994).
Gráfico de barras - apresentação
Gráfico de barras - artigo
Expressão gênica do NPY e sbGnRH associada ao desenvolvimento gonadal em linguados juvenis e adultos
Exemplo de colunas empilhadas Busca de serviços de saúde por quintis de nível econômico
Tipo de atividade física realizada pelos indivíduos da amostra Gráfico de pizza Outra forma de distribuição de freqüência de variáveis categóricas Tipo de atividade física realizada pelos indivíduos da amostra
Histograma Distribuição de frequência de variáveis contínuas Divide os dados em classes de amplitudes iguais Área deve somar 100% Barras encostam O resto..., igual ao gráfico de barras
Histograma – variável contínua, distribuição simétrica
Histograma – variável contínua, distribuição simétrica
Histograma – variável contínua, distribuição assimétrica Freqüência relativa (%) Renda familiar (R$) 100 200 300 400 500 10 20 30 40 50 60 70 Figura 3 - Renda familiar (R$) de crianças freqüentando creches gratuitas em Fortaleza, CE, 1995.
Histograma – variável numérica discreta Figura 4 - Distribuição dos pontos da classificação socioeconômica Abipeme por domicílio de crianças frequentando creches gratuitas em Campinas, 1994.
Gráfico de área Figura 4 - Distribuição dos pontos da classificação socioeconômica Abipeme por domicílio de crianças freqüentando creches gratuitas em Campinas, 1994.
A mesma variável agrupada em categorias Figura 5 - Distribuição dos pontos da classificação socioeconômica Abipeme por domicílio de crianças freqüentando creches gratuitas em Campinas, 1994.
Outros gráficos: pizza de pizza 43% 57% 3,7% Figura 6 – Indivíduos que deixaram de tomar os medicamentos que necessitavam nos últimos 15 dias e procura ao PSF
Outros gráficos: Linha Figure 8. Prevalence of low body mass index (BMI) in females according to schooling level.
Mudanças no perfil dos medicamentos mais utilizados aos três, 12 e 24 meses de idade. Coorte de nascimentos 2004, Pelotas – RS.
Dados agrupados
Obrigado pela atenção!!! Vinicius Farias Campos fariascampos@gmail.com vcampos_ib@ufpel.edu.br