Carregar apresentação
PublicouMatheushenrique Silveira Alterado mais de 10 anos atrás
1
Representação gráfica e tabular da distribuição dos dados e
Medidas resumo Paula Strassmann PGS Medical Statistics MAIO/2010
2
Tópicos abordados na última aula PGS Medical Statistics
Definição e classificação de variáveis; Codificação de dados; Armazenamento dos dados (Exemplo de banco de dados); Construção de tabelas de frequências (Variáveis qualitativas). Paula Strassmann PGS Medical Statistics MAIO/2010
3
Tópicos abordados nessa aula PGS Medical Statistics
Construção e interpretação de gráficos para cada tipo de variável; Definição e Cálculo das medidas de posição: Média, Mediana, Quartis e Moda; Medidas de dispersão. Paula Strassmann PGS Medical Statistics MAIO/2010
4
Estatística descritiva - Definição PGS Medical Statistics
Conjunto de técnicas que resumem e descrevem os dados simplificando as informações para torná-las mais rapidamente compreensíveis. Etapa inicial da análise dos dados Tabelas Gráficos Medidas resumo Paula Strassmann PGS Medical Statistics MAIO/2010
5
PGS Medical Statistics
Representação gráfica para Variáveis qualitativas (categóricas) ou quantitativas discretas GRÁFICO DE BARRAS / COLUNAS: É utilizado para apresentar variáveis categóricas ou numéricas discretas. Em geral, no eixo das abscissas encontram-se as categorias e a altura das colunas correspondem às freqüências (simples ou relativas) das categorias. Paula Strassmann PGS Medical Statistics MAIO/2010
6
PGS Medical Statistics
Exemplo de gráfico de colunas para variáveis quantitativas discretas: Nº de filhos Nº de funcionários casados 1 9 2 13 3 7 4 Paula Strassmann PGS Medical Statistics MAIO/2010
7
PGS Medical Statistics
Exemplo de gráfico de colunas para variáveis qualitativas: Satisfação Indivíduos Insatisfeito 50 Pouco satisfeito 75 Muito satisfeito 120 Paula Strassmann PGS Medical Statistics MAIO/2010
8
PGS Medical Statistics
Exemplo de gráfico de barras para variáveis qualitativas: 3 4 5 8 10 16 17 20 52 30 40 50 60 OUTROS* SANTANA DE PARNAIBA TABOÃO DA SERRA COTIA BARUERI CAIEIRAS CARAPICUIBA GUARULHOS OSASCO SÃO PAULO número de casos Cidade Nº de casos São Paulo 52 Osasco 20 Guarulhos 17 Carapicuiba 16 Caieiras 10 Barueri 8 Cotia Taboão da Serra 5 Santana de Parnaíba 4 Outros 3 Paula Strassmann PGS Medical Statistics MAIO/2010
9
Cruzamentos: Variáveis categóricas x Variáveis categóricas Total
Sexo \ Tabagismo Sim Não Total Masculino 175 (81%) 40 (19%) 215 (100%) Feminino 50 (83%) 10 (17%) 60 225 (82%) (18%) 275 Paula Strassmann PGS Medical Statistics MAIO/2010
10
Cruzamentos: Variáveis categóricas x Variáveis categóricas
(Continuação) Sexo \ Tabagismo Sim Não Total Masculino 175 (81%) 40 (19%) 215 (100%) Feminino 50 (83%) 10 (17%) 60 225 (82%) (18%) 275 Paula Strassmann PGS Medical Statistics MAIO/2010
11
Cruzamentos: Variáveis categóricas x Variáveis categóricas
(Outro exemplo) Faixa etária \ Estado civil Solteiro Casado Separado / viúvo Total Até 30 anos 62 (73%) 18 (21%) 5 (6%) 85 (100%) 30 a 50 anos 23 (24%) 57 (59%) 17 (18%) 97 Mais de 50 anos 12 (14%) 42 (50%) 30 (36%) 84 117 (44%) 52 (20%) 266 Paula Strassmann PGS Medical Statistics MAIO/2010
12
Cruzamentos: Variáveis categóricas x Variáveis categóricas
(Outro exemplo – Continuação) Paula Strassmann PGS Medical Statistics MAIO/2010
13
Representação gráfica para variáveis qualitativas (categóricas)
GRÁFICO DE SETORES (PIZZA): Cada “fatia” corresponde à porcentagem de ocorrências em cada categoria de resposta da variável. É indicado para variáveis qualitativas (preferencialmente nominais). Neste tipo de gráfico, todas as observações da amostra estão classificadas em uma das categorias, ou seja, a soma das porcentagens deve ser igual a 100%. Paula Strassmann PGS Medical Statistics MAIO/2010
14
Exemplo de gráfico de setores (pizza) para variáveis qualitativas:
Paula Strassmann PGS Medical Statistics MAIO/2010
15
PGS Medical Statistics
Exemplo de gráfico de setores (pizza) para variáveis qualitativas: Sexo f (%) Homens 150 (75,0%) Mulheres 50 (25,0%) Total 200 (100,0%) Paula Strassmann PGS Medical Statistics MAIO/2010
16
Representação gráfica para Variáveis quantitativas contínuas
Histograma: Gráfico de barras justapostas em que no eixo horizontal está a variável de interesse, dividida em classes geralmente de mesmo tamanho. No eixo vertical, constrói-se uma barra para cada classe com altura igual à freqüência absoluta ou relativa correspondente. A barra é centrada no ponto médio da classe. Polígono de Freqüências: Construído a partir do histograma, onde se une através de segmentos de reta as ordenadas correspondentes aos pontos médios de cada classe. Paula Strassmann PGS Medical Statistics MAIO/2010
17
Concentração de chumbo umol/24 hrs PGS Medical Statistics
Exemplo de histograma: Dados de registro pediátrico da concentração de chumbo na urina de 140 crianças de uma determinada região. Concentração de chumbo umol/24 hrs Nº de crianças 0|0.4 2 0.4 | 0.8 7 0.8 |1.2 10 1.2 |1.6 16 1.6 |2.0 23 2.0 |2.4 28 2.4 |2.8 19 2.8 |3.2 3.2 |3.6 11 3.6 |4.0 4.0 |4.4 1 Total 140 Paula Strassmann PGS Medical Statistics MAIO/2010
18
Construção do Histograma para os dados da Tabela 1
Tabela 1. Ácido úrico sérico em homens sadios (Finn et al. (1966)). Paula Strassmann PGS Medical Statistics MAIO/2010
19
Histograma para os dados da Tabela 1 PGS Medical Statistics
Paula Strassmann PGS Medical Statistics MAIO/2010
20
Polígono de frequência para os dados da Tabela 1
Paula Strassmann PGS Medical Statistics MAIO/2010
21
Estatística descritiva – Análise exploratória dos dados
Como resumir VARIÁVEIS NUMÉRICAS? Medidas de posição ou Medidas de tendência central Moda Média Mediana Quartis, percentis Medidas de dispersão Amplitude Variância Desvio padrão Paula Strassmann PGS Medical Statistics MAIO/2010 21
22
Medidas de posição – Moda PGS Medical Statistics
Valor que ocorre com maior freqüência. Exemplo: As idades dos alunos de uma classe são: 19, 19, 20, 20, 20, 21, 22. Nesse caso, Moda = 20 anos; Pode existir mais de uma moda. Distribuição é bimodal, trimodal, ... Exemplo: As idades dos alunos de uma classe são: 19, 19, 19, 20, 20, 20, 21, 22. Nesse caso, Moda = 19 e 20 anos (bimodal); Pode não existir moda (não ter um valor mais freqüente). Exemplo: As idades dos alunos de uma classe são: 18, 19, 20, 21, 22. Nesse caso, Não existe Moda. Paula Strassmann PGS Medical Statistics MAIO/2010 22
23
Medidas de posição – Média PGS Medical Statistics
É a medida de tendência central mais utilizada; Leva em conta todos os valores da variável; É afetada por valores extremos; É o “ponto de equilíbrio” da distribuição dos dados. (Dados ordenados) Média 1 (Dados ordenados) Média 2 Paula Strassmann PGS Medical Statistics MAIO/2010 23
24
Medidas de posição – Cálculo da Média PGS Medical Statistics
Exemplo: Um estudante fez 5 provas e obteve notas 75, 90, 83, 77 e 92. Então sua nota média é: Paula Strassmann PGS Medical Statistics MAIO/2010 24
25
Medidas de posição – Mediana PGS Medical Statistics
Divide os dados ordenados ao meio; Medida resistente: pouco afetada por mudanças de valores discrepantes (extremos). 50% 50% (Dados ordenados) mediana Paula Strassmann PGS Medical Statistics MAIO/2010 25
26
Medidas de posição – Cálculo da Mediana PGS Medical Statistics
Ordenam-se os dados; Seleciona-se a observação central. n ímpar: valor da observação central Posição da mediana = 3 Mediana = 83 n par: média das duas observações centrais Posição da mediana = 3,4 Mediana = ( )/2 = 86,5 Paula Strassmann PGS Medical Statistics MAIO/2010 26
27
Medidas de posição central PGS Medical Statistics
São valores únicos representativos dos dados. Os mais usados são média aritmética, moda e mediana. Exemplo: Moda = 39 anos (idade mais freqüente) Mediana = 49 anos (posição central) Média = (575/11) = 52,3 anos Paula Strassmann PGS Medical Statistics MAIO/2010 27
28
PGS Medical Statistics
Concluindo: Média: É o “ponto de equilíbrio” da distribuição dos dados. Moda: É o valor que ocorre com mais frequência. Mediana: Divide os dados ordenados ao meio. MAIO/2010 Paula Strassmann PGS Medical Statistics
29
PGS Medical Statistics
Exercício 1: Com base nos dados da tabela abaixo, calcule: Nº Aluno Turma Sexo Idade Altura Peso Fuma 1 A M 17 1,6 69 Sim 2 F 18 1,78 68 Não 3 B 24 1,65 76 4 33 1,82 106 5 35 1,7 78 6 48 1,59 71 7 1,72 70 8 21 1,66 80 9 39 1,71 89 10 1,55 68,5 a) Peso médio b) Moda para Idade. c) Altura Mediana. Paula Strassmann PGS Medical Statistics MAIO/2010
30
PGS Medical Statistics
Resolução do Exercício 1: Peso médio: Portanto, peso médio = 77,55 kg. b) Moda para a Idade: Observando todas as idades da tabela, vemos que a idade que mais aparece é 24 anos (3 alunos têm 24 anos). As demais idades aparecem uma única vez. Portanto, Moda = 24 anos. Paula Strassmann PGS Medical Statistics MAIO/2010
31
PGS Medical Statistics
Resolução do Exercício 1 (Continuação): Altura mediana: Ordenação dos dados: 1,55; 1,59; 1,6; 1,65; 1,66; 1,7; 1,71; 1,72; 1,78; 1,82. Nesse caso, n = 10 (número par de elementos) e então a mediana é a média entre os 2 valores centrais. Posição da mediana: 5, 6. Mediana = Portanto, a altura mediana é 1,68 metros. Paula Strassmann PGS Medical Statistics MAIO/2010
32
Q1 Q2 Q3 Medidas de posição – Quartis Dados em ordem crescente
Dividem os dados ordenados em 4 partes iguais: 25% dos dados estão abaixo do 1º quartil (Q1) 50% dos dados estão abaixo do 2º quartil (Q2 ou mediana) 75% dos dados estão abaixo do 3º quartil (Q3) Dados Resistentes Paula Strassmann PGS Medical Statistics MAIO/2010 32
33
PGS Medical Statistics
Box-plot Ponto discrepante 3o quartil (Q3) 1,5 (Q3 - Q1) Valor máximo entre os não discrepantes Mediana Valor mínimo entre os não discrepantes 1o quartil (Q1) 1,5 (Q3 - Q1) Paula Strassmann PGS Medical Statistics MAIO/2010
34
Exemplo: Gráfico de Box-Plot comparando dois tratamentos
Temp. (ºC) 39,7 39,5 39,1 39,0 38,5 38,4 38,3 38,2 38,0 37,9 37,8 36,5 Tratamento 1 Temp. (ºC) 38,2 38,0 37,5 37,4 37,3 37,0 36,9 36,8 Tratamento 2 Paula Strassmann PGS Medical Statistics MAIO/2010
35
Medidas de dispersão – Amplitude PGS Medical Statistics
Distância entre os valores máximo e mínimo; Amplitude = valor máximo – valor mínimo; Ignora a distribuição dos dados; Exemplo: amplitude = 10 – 7 = 3 amplitude = 10 – 7 = 3 Paula Strassmann PGS Medical Statistics MAIO/2010 35
36
Medidas de dispersão – Cálculo da Amplitude PGS Medical Statistics
Exemplo 1: Duas amostras de 20 indivíduos. Amostra 1: Estatura mínima: 140 cm e Estatura máxima: 180 cm Amostra 2: Estatura mínima: 150 cm e Estatura máxima: 175 cm Em qual das duas amostras os indivíduos variam mais em relação à estatura ? Paula Strassmann PGS Medical Statistics MAIO/2010 36
37
Medidas de dispersão – Cálculo da Amplitude (Continuação)
Resolução do Exemplo 1: Amostra 1: Estatura mínima: 140 cm Estatura máxima: 180 cm Amostra 2: Estatura mínima: 150 cm Estatura máxima: 175 cm Máx – mín = 180 cm – 140 cm= 40 cm Máx – mín = 175 cm – 150 cm= 25 cm Os cálculos sugerem que a Amostra 1 contém mais estaturas diferentes, pois abrange uma faixa maior de valores Paula Strassmann PGS Medical Statistics MAIO/2010 37
38
PGS Medical Statistics
Medidas de dispersão – Cálculo da Amplitude (Continuação) Exemplo 2: Duas amostras de estatura (cm) de 6 indivíduos. Amostra 1: 150, 151, 153, 155, 158, 160 Amostra 2: 150, 155, 155, 155, 155, 160 A amplitude é a mesma nas duas amostras. Em qual das duas amostras os indivíduos variam mais em relação à estatura ? Observando os valores um a um, percebemos que a Amostra 1 varia mais. Paula Strassmann PGS Medical Statistics MAIO/2010 38
39
PGS Medical Statistics
Medidas de dispersão (Continuação) No exemplo, vimos que amostras com a mesma média podem ter variabilidades muito diferentes. Como medir a variabilidade de um conjunto de dados? A forma mais comum de medir a variabilidade é quantificá-la pelas distâncias das observações com relação á média. Paula Strassmann PGS Medical Statistics MAIO/2010 39
40
PGS Medical Statistics
Medidas de Dispersão – Variância amostral A variância quantifica a variabilidade ou espalhamento ao redor da média das medidas. Tende a ser um número grande e o seu valor sai dos limites dos valores observados em um conjunto de dados. Além disso, sua unidade de medida corresponde a unidade de medida da média elevada ao quadrado. Paula Strassmann PGS Medical Statistics MAIO/2010 40
41
PGS Medical Statistics
Medidas de Dispersão – Desvio padrão amostral O desvio padrão, que é a raiz quadrada da variância, tem a mesma unidade de medida da média e pode ser usado para descrever a quantidade de dispersão na distribuição da freqüência. Paula Strassmann PGS Medical Statistics MAIO/2010 41
42
PGS Medical Statistics
Medidas de Dispersão (Continuação) O desvio padrão por si só não nos diz muita coisa. Um desvio padrão de 2 unidades pode ser considerado pequeno para um conjunto de dados cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar dois ou mais conjuntos de dados, relativamente à sua dispersão ou variabilidade, quando expressas em unidades diferentes. Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos ao seu valor médio, medida essa denominada coeficiente de variação (CV). Paula Strassmann PGS Medical Statistics MAIO/2010
43
PGS Medical Statistics
Medidas de Dispersão – Coeficiente de correlação Indica a dispersão em relação à média; É uma medida de variabilidade relativa, definida como a razão entre o desvio padrão e a média, sendo uma medida adimensional expressa em percentual. Pode ser usado para comparar a dispersão de dois conjuntos de dados, sem que eles estejam necessariamente na mesma unidade de medida. Paula Strassmann PGS Medical Statistics MAIO/2010 43
44
PGS Medical Statistics
Coeficiente de variação – Exemplo 1 Por exemplo, em uma amostra de pacientes para determinação do clearance de creatinina, constatou-se que a média era de 72 ml/min e o desvio- padrão, de 13. Como 13 representa 18% de 72, então o CV é de 18% Paula Strassmann PGS Medical Statistics MAIO/2010 44
45
PGS Medical Statistics
Coeficiente de variação – Exemplo 2 Medidas as estaturas de 1017 indivíduos, obtivemos = 162,2 cm e s = 8,01 cm. O peso médio desses mesmos indivíduos é 58 kg, com um desvio padrão de 2,3 kg. Esses indivíduos apresentam maior variabilidade em estatura ou em peso? Coeficiente de variação para as estaturas: Coeficiente de variação para o peso: CV = 8,01 = 0,0494 = 4,94%; 162,2 CV = 2,3 = 0,0397 = 3,97%. 58,0 Paula Strassmann PGS Medical Statistics MAIO/2010
46
Bibliografias recomendadas PGS Medical Statistics
PAGANO, Marcello (1945) – Princípios de bioestatística / Marcello Pagano, Kimberlee Gauvreau; tradução Luiz Sérgio de Castro Paiva; revisão técnica Lúcia Pereira Barroso. – São Paulo: Pioneira Thomson Learning, (paginas ). Titulo original: Principles of bioestatistics Bussab, W.O. e Morettin, P.A. (2005) - Estatística Básica. 5ª Edição. São Paulo: Saraiva. 526p. Dawson-Saunders, Beth e Trapp, Robert G. (1994) - Basic & Clinical Biostatistics – A Lange medical book. Second Edition – Prentice-Hall Internationl Inc. 344p. Riffenburgh, Robert H. (2006) – Statistics in Medicine – Second Edition – San Diego, Caifornia – Elsevier Academic Press – 622p. Del Giglio, Auro (2008) – Conselhos para um jovem médico – 1ª Ed. – Editora Manole Ltda. – 118 p. Paula Strassmann PGS Medical Statistics MAIO/2010
47
PGS Medical Statistics PGS Medical Statistics
Paula G. Strassmann Paula Strassmann PGS Medical Statistics MAIO/2010 47
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.