A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Representação gráfica e tabular da distribuição dos dados e

Apresentações semelhantes


Apresentação em tema: "Representação gráfica e tabular da distribuição dos dados e"— Transcrição da apresentação:

1 Representação gráfica e tabular da distribuição dos dados e
Medidas resumo Paula Strassmann PGS Medical Statistics MAIO/2010

2 Tópicos abordados na última aula PGS Medical Statistics
Definição e classificação de variáveis; Codificação de dados; Armazenamento dos dados (Exemplo de banco de dados); Construção de tabelas de frequências (Variáveis qualitativas). Paula Strassmann PGS Medical Statistics MAIO/2010

3 Tópicos abordados nessa aula PGS Medical Statistics
Construção e interpretação de gráficos para cada tipo de variável; Definição e Cálculo das medidas de posição: Média, Mediana, Quartis e Moda; Medidas de dispersão. Paula Strassmann PGS Medical Statistics MAIO/2010

4 Estatística descritiva - Definição PGS Medical Statistics
Conjunto de técnicas que resumem e descrevem os dados simplificando as informações para torná-las mais rapidamente compreensíveis. Etapa inicial da análise dos dados Tabelas Gráficos Medidas resumo Paula Strassmann PGS Medical Statistics MAIO/2010

5 PGS Medical Statistics
Representação gráfica para Variáveis qualitativas (categóricas) ou quantitativas discretas GRÁFICO DE BARRAS / COLUNAS: É utilizado para apresentar variáveis categóricas ou numéricas discretas. Em geral, no eixo das abscissas encontram-se as categorias e a altura das colunas correspondem às freqüências (simples ou relativas) das categorias. Paula Strassmann PGS Medical Statistics MAIO/2010

6 PGS Medical Statistics
Exemplo de gráfico de colunas para variáveis quantitativas discretas: Nº de filhos Nº de funcionários casados 1 9 2 13 3 7 4 Paula Strassmann PGS Medical Statistics MAIO/2010

7 PGS Medical Statistics
Exemplo de gráfico de colunas para variáveis qualitativas: Satisfação Indivíduos Insatisfeito 50 Pouco satisfeito 75 Muito satisfeito 120 Paula Strassmann PGS Medical Statistics MAIO/2010

8 PGS Medical Statistics
Exemplo de gráfico de barras para variáveis qualitativas: 3 4 5 8 10 16 17 20 52 30 40 50 60 OUTROS* SANTANA DE PARNAIBA TABOÃO DA SERRA COTIA BARUERI CAIEIRAS CARAPICUIBA GUARULHOS OSASCO SÃO PAULO número de casos Cidade Nº de casos São Paulo 52 Osasco 20 Guarulhos 17 Carapicuiba 16 Caieiras 10 Barueri 8 Cotia Taboão da Serra 5 Santana de Parnaíba 4 Outros 3 Paula Strassmann PGS Medical Statistics MAIO/2010

9 Cruzamentos: Variáveis categóricas x Variáveis categóricas Total
Sexo \ Tabagismo Sim Não Total Masculino 175 (81%) 40 (19%) 215 (100%) Feminino 50 (83%) 10 (17%) 60 225 (82%) (18%) 275 Paula Strassmann PGS Medical Statistics MAIO/2010

10 Cruzamentos: Variáveis categóricas x Variáveis categóricas
(Continuação) Sexo \ Tabagismo Sim Não Total Masculino 175 (81%) 40 (19%) 215 (100%) Feminino 50 (83%) 10 (17%) 60 225 (82%) (18%) 275 Paula Strassmann PGS Medical Statistics MAIO/2010

11 Cruzamentos: Variáveis categóricas x Variáveis categóricas
(Outro exemplo) Faixa etária \ Estado civil Solteiro Casado Separado / viúvo Total Até 30 anos 62 (73%) 18 (21%) 5 (6%) 85 (100%) 30 a 50 anos 23 (24%) 57 (59%) 17 (18%) 97 Mais de 50 anos 12 (14%) 42 (50%) 30 (36%) 84 117 (44%) 52 (20%) 266 Paula Strassmann PGS Medical Statistics MAIO/2010

12 Cruzamentos: Variáveis categóricas x Variáveis categóricas
(Outro exemplo – Continuação) Paula Strassmann PGS Medical Statistics MAIO/2010

13 Representação gráfica para variáveis qualitativas (categóricas)
GRÁFICO DE SETORES (PIZZA): Cada “fatia” corresponde à porcentagem de ocorrências em cada categoria de resposta da variável. É indicado para variáveis qualitativas (preferencialmente nominais). Neste tipo de gráfico, todas as observações da amostra estão classificadas em uma das categorias, ou seja, a soma das porcentagens deve ser igual a 100%. Paula Strassmann PGS Medical Statistics MAIO/2010

14 Exemplo de gráfico de setores (pizza) para variáveis qualitativas:
Paula Strassmann PGS Medical Statistics MAIO/2010

15 PGS Medical Statistics
Exemplo de gráfico de setores (pizza) para variáveis qualitativas:  Sexo f (%) Homens 150 (75,0%) Mulheres 50 (25,0%) Total 200 (100,0%) Paula Strassmann PGS Medical Statistics MAIO/2010

16 Representação gráfica para Variáveis quantitativas contínuas
Histograma: Gráfico de barras justapostas em que no eixo horizontal está a variável de interesse, dividida em classes geralmente de mesmo tamanho. No eixo vertical, constrói-se uma barra para cada classe com altura igual à freqüência absoluta ou relativa correspondente. A barra é centrada no ponto médio da classe. Polígono de Freqüências: Construído a partir do histograma, onde se une através de segmentos de reta as ordenadas correspondentes aos pontos médios de cada classe. Paula Strassmann PGS Medical Statistics MAIO/2010

17 Concentração de chumbo umol/24 hrs PGS Medical Statistics
Exemplo de histograma: Dados de registro pediátrico da concentração de chumbo na urina de 140 crianças de uma determinada região. Concentração de chumbo umol/24 hrs Nº de crianças 0|0.4 2 0.4 | 0.8 7 0.8 |1.2 10 1.2 |1.6 16 1.6 |2.0 23 2.0 |2.4 28 2.4 |2.8 19 2.8 |3.2 3.2 |3.6 11 3.6 |4.0 4.0 |4.4 1 Total 140 Paula Strassmann PGS Medical Statistics MAIO/2010

18 Construção do Histograma para os dados da Tabela 1
Tabela 1. Ácido úrico sérico em homens sadios (Finn et al. (1966)). Paula Strassmann PGS Medical Statistics MAIO/2010

19 Histograma para os dados da Tabela 1 PGS Medical Statistics
Paula Strassmann PGS Medical Statistics MAIO/2010

20 Polígono de frequência para os dados da Tabela 1
Paula Strassmann PGS Medical Statistics MAIO/2010

21 Estatística descritiva – Análise exploratória dos dados
Como resumir VARIÁVEIS NUMÉRICAS? Medidas de posição ou Medidas de tendência central Moda Média Mediana Quartis, percentis Medidas de dispersão Amplitude Variância Desvio padrão Paula Strassmann PGS Medical Statistics MAIO/2010 21

22 Medidas de posição – Moda PGS Medical Statistics
Valor que ocorre com maior freqüência. Exemplo: As idades dos alunos de uma classe são: 19, 19, 20, 20, 20, 21, 22. Nesse caso, Moda = 20 anos; Pode existir mais de uma moda. Distribuição é bimodal, trimodal, ... Exemplo: As idades dos alunos de uma classe são: 19, 19, 19, 20, 20, 20, 21, 22. Nesse caso, Moda = 19 e 20 anos (bimodal); Pode não existir moda (não ter um valor mais freqüente). Exemplo: As idades dos alunos de uma classe são: 18, 19, 20, 21, 22. Nesse caso, Não existe Moda. Paula Strassmann PGS Medical Statistics MAIO/2010 22

23 Medidas de posição – Média PGS Medical Statistics
É a medida de tendência central mais utilizada; Leva em conta todos os valores da variável; É afetada por valores extremos; É o “ponto de equilíbrio” da distribuição dos dados. (Dados ordenados) Média 1 (Dados ordenados) Média 2 Paula Strassmann PGS Medical Statistics MAIO/2010 23

24 Medidas de posição – Cálculo da Média PGS Medical Statistics
Exemplo: Um estudante fez 5 provas e obteve notas 75, 90, 83, 77 e 92. Então sua nota média é: Paula Strassmann PGS Medical Statistics MAIO/2010 24

25 Medidas de posição – Mediana PGS Medical Statistics
Divide os dados ordenados ao meio; Medida resistente: pouco afetada por mudanças de valores discrepantes (extremos). 50% 50% (Dados ordenados) mediana Paula Strassmann PGS Medical Statistics MAIO/2010 25

26 Medidas de posição – Cálculo da Mediana PGS Medical Statistics
Ordenam-se os dados; Seleciona-se a observação central. n ímpar: valor da observação central Posição da mediana = 3 Mediana = 83 n par: média das duas observações centrais Posição da mediana = 3,4 Mediana = ( )/2 = 86,5 Paula Strassmann PGS Medical Statistics MAIO/2010 26

27 Medidas de posição central PGS Medical Statistics
São valores únicos representativos dos dados. Os mais usados são média aritmética, moda e mediana. Exemplo: Moda = 39 anos (idade mais freqüente) Mediana = 49 anos (posição central) Média = (575/11) = 52,3 anos Paula Strassmann PGS Medical Statistics MAIO/2010 27

28 PGS Medical Statistics
Concluindo: Média: É o “ponto de equilíbrio” da distribuição dos dados. Moda: É o valor que ocorre com mais frequência. Mediana: Divide os dados ordenados ao meio. MAIO/2010 Paula Strassmann PGS Medical Statistics

29 PGS Medical Statistics
Exercício 1: Com base nos dados da tabela abaixo, calcule: Nº Aluno Turma Sexo Idade Altura Peso Fuma 1 A M 17 1,6 69 Sim 2 F 18 1,78 68 Não 3 B 24 1,65 76 4 33 1,82 106 5 35 1,7 78 6 48 1,59 71 7 1,72 70 8 21 1,66 80 9 39 1,71 89 10 1,55 68,5 a) Peso médio b) Moda para Idade. c) Altura Mediana. Paula Strassmann PGS Medical Statistics MAIO/2010

30 PGS Medical Statistics
Resolução do Exercício 1: Peso médio: Portanto, peso médio = 77,55 kg. b) Moda para a Idade: Observando todas as idades da tabela, vemos que a idade que mais aparece é 24 anos (3 alunos têm 24 anos). As demais idades aparecem uma única vez. Portanto, Moda = 24 anos. Paula Strassmann PGS Medical Statistics MAIO/2010

31 PGS Medical Statistics
Resolução do Exercício 1 (Continuação): Altura mediana: Ordenação dos dados: 1,55; 1,59; 1,6; 1,65; 1,66; 1,7; 1,71; 1,72; 1,78; 1,82. Nesse caso, n = 10 (número par de elementos) e então a mediana é a média entre os 2 valores centrais. Posição da mediana: 5, 6. Mediana = Portanto, a altura mediana é 1,68 metros. Paula Strassmann PGS Medical Statistics MAIO/2010

32 Q1 Q2 Q3 Medidas de posição – Quartis Dados em ordem crescente
Dividem os dados ordenados em 4 partes iguais: 25% dos dados estão abaixo do 1º quartil (Q1) 50% dos dados estão abaixo do 2º quartil (Q2 ou mediana) 75% dos dados estão abaixo do 3º quartil (Q3) Dados Resistentes Paula Strassmann PGS Medical Statistics MAIO/2010 32

33 PGS Medical Statistics
Box-plot Ponto discrepante 3o quartil (Q3) 1,5 (Q3 - Q1) Valor máximo entre os não discrepantes Mediana Valor mínimo entre os não discrepantes 1o quartil (Q1) 1,5 (Q3 - Q1) Paula Strassmann PGS Medical Statistics MAIO/2010

34 Exemplo: Gráfico de Box-Plot comparando dois tratamentos
Temp. (ºC) 39,7 39,5 39,1 39,0 38,5 38,4 38,3 38,2 38,0 37,9 37,8 36,5 Tratamento 1 Temp. (ºC) 38,2 38,0 37,5 37,4 37,3 37,0 36,9 36,8 Tratamento 2 Paula Strassmann PGS Medical Statistics MAIO/2010

35 Medidas de dispersão – Amplitude PGS Medical Statistics
Distância entre os valores máximo e mínimo; Amplitude = valor máximo – valor mínimo; Ignora a distribuição dos dados; Exemplo: amplitude = 10 – 7 = 3 amplitude = 10 – 7 = 3 Paula Strassmann PGS Medical Statistics MAIO/2010 35

36 Medidas de dispersão – Cálculo da Amplitude PGS Medical Statistics
Exemplo 1: Duas amostras de 20 indivíduos. Amostra 1: Estatura mínima: 140 cm e Estatura máxima: 180 cm Amostra 2: Estatura mínima: 150 cm e Estatura máxima: 175 cm Em qual das duas amostras os indivíduos variam mais em relação à estatura ? Paula Strassmann PGS Medical Statistics MAIO/2010 36

37 Medidas de dispersão – Cálculo da Amplitude (Continuação)
Resolução do Exemplo 1: Amostra 1: Estatura mínima: 140 cm Estatura máxima: 180 cm Amostra 2: Estatura mínima: 150 cm Estatura máxima: 175 cm Máx – mín = 180 cm – 140 cm= 40 cm Máx – mín = 175 cm – 150 cm= 25 cm Os cálculos sugerem que a Amostra 1 contém mais estaturas diferentes, pois abrange uma faixa maior de valores Paula Strassmann PGS Medical Statistics MAIO/2010 37

38 PGS Medical Statistics
Medidas de dispersão – Cálculo da Amplitude (Continuação) Exemplo 2: Duas amostras de estatura (cm) de 6 indivíduos. Amostra 1: 150, 151, 153, 155, 158, 160 Amostra 2: 150, 155, 155, 155, 155, 160 A amplitude é a mesma nas duas amostras. Em qual das duas amostras os indivíduos variam mais em relação à estatura ? Observando os valores um a um, percebemos que a Amostra 1 varia mais. Paula Strassmann PGS Medical Statistics MAIO/2010 38

39 PGS Medical Statistics
Medidas de dispersão (Continuação) No exemplo, vimos que amostras com a mesma média podem ter variabilidades muito diferentes. Como medir a variabilidade de um conjunto de dados? A forma mais comum de medir a variabilidade é quantificá-la pelas distâncias das observações com relação á média. Paula Strassmann PGS Medical Statistics MAIO/2010 39

40 PGS Medical Statistics
Medidas de Dispersão – Variância amostral A variância quantifica a variabilidade ou espalhamento ao redor da média das medidas. Tende a ser um número grande e o seu valor sai dos limites dos valores observados em um conjunto de dados. Além disso, sua unidade de medida corresponde a unidade de medida da média elevada ao quadrado. Paula Strassmann PGS Medical Statistics MAIO/2010 40

41 PGS Medical Statistics
Medidas de Dispersão – Desvio padrão amostral O desvio padrão, que é a raiz quadrada da variância, tem a mesma unidade de medida da média e pode ser usado para descrever a quantidade de dispersão na distribuição da freqüência. Paula Strassmann PGS Medical Statistics MAIO/2010 41

42 PGS Medical Statistics
Medidas de Dispersão (Continuação) O desvio padrão por si só não nos diz muita coisa. Um desvio padrão de 2 unidades pode ser considerado pequeno para um conjunto de dados cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar dois ou mais conjuntos de dados, relativamente à sua dispersão ou variabilidade, quando expressas em unidades diferentes. Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos ao seu valor médio, medida essa denominada coeficiente de variação (CV). Paula Strassmann PGS Medical Statistics MAIO/2010

43 PGS Medical Statistics
Medidas de Dispersão – Coeficiente de correlação Indica a dispersão em relação à média; É uma medida de variabilidade relativa, definida como a razão entre o desvio padrão e a média, sendo uma medida adimensional expressa em percentual. Pode ser usado para comparar a dispersão de dois conjuntos de dados, sem que eles estejam necessariamente na mesma unidade de medida. Paula Strassmann PGS Medical Statistics MAIO/2010 43

44 PGS Medical Statistics
Coeficiente de variação – Exemplo 1 Por exemplo, em uma amostra de pacientes para determinação do clearance de creatinina, constatou-se que a média era de 72 ml/min e o desvio- padrão, de 13. Como 13 representa 18% de 72, então o CV é de 18% Paula Strassmann PGS Medical Statistics MAIO/2010 44

45 PGS Medical Statistics
Coeficiente de variação – Exemplo 2 Medidas as estaturas de 1017 indivíduos, obtivemos = 162,2 cm e s = 8,01 cm. O peso médio desses mesmos indivíduos é 58 kg, com um desvio padrão de 2,3 kg. Esses indivíduos apresentam maior variabilidade em estatura ou em peso? Coeficiente de variação para as estaturas: Coeficiente de variação para o peso: CV = 8,01 = 0,0494 = 4,94%; 162,2 CV = 2,3 = 0,0397 = 3,97%. 58,0 Paula Strassmann PGS Medical Statistics MAIO/2010

46 Bibliografias recomendadas PGS Medical Statistics
PAGANO, Marcello (1945) – Princípios de bioestatística / Marcello Pagano, Kimberlee Gauvreau; tradução Luiz Sérgio de Castro Paiva; revisão técnica Lúcia Pereira Barroso. – São Paulo: Pioneira Thomson Learning, (paginas ). Titulo original: Principles of bioestatistics Bussab, W.O. e Morettin, P.A. (2005) - Estatística Básica. 5ª Edição. São Paulo: Saraiva. 526p. Dawson-Saunders, Beth e Trapp, Robert G. (1994) - Basic & Clinical Biostatistics – A Lange medical book. Second Edition – Prentice-Hall Internationl Inc. 344p. Riffenburgh, Robert H. (2006) – Statistics in Medicine – Second Edition – San Diego, Caifornia – Elsevier Academic Press – 622p. Del Giglio, Auro (2008) – Conselhos para um jovem médico – 1ª Ed. – Editora Manole Ltda. – 118 p. Paula Strassmann PGS Medical Statistics MAIO/2010

47 PGS Medical Statistics PGS Medical Statistics
Paula G. Strassmann Paula Strassmann PGS Medical Statistics MAIO/2010 47


Carregar ppt "Representação gráfica e tabular da distribuição dos dados e"

Apresentações semelhantes


Anúncios Google