A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Representação gráfica e tabular da distribuição dos dados e Medidas resumo MAIO/2010 Paula Strassmann PGS Medical Statistics.

Apresentações semelhantes


Apresentação em tema: "Representação gráfica e tabular da distribuição dos dados e Medidas resumo MAIO/2010 Paula Strassmann PGS Medical Statistics."— Transcrição da apresentação:

1 Representação gráfica e tabular da distribuição dos dados e Medidas resumo MAIO/2010 Paula Strassmann PGS Medical Statistics

2 Tópicos abordados na última aula Definição e classificação de variáveis; Codificação de dados; Armazenamento dos dados (Exemplo de banco de dados); Construção de tabelas de frequências (Variáveis qualitativas). MAIO/2010 Paula Strassmann PGS Medical Statistics

3 Tópicos abordados nessa aula Construção e interpretação de gráficos para cada tipo de variável; Definição e Cálculo das medidas de posição: Média, Mediana, Quartis e Moda; Medidas de dispersão. MAIO/2010 Paula Strassmann PGS Medical Statistics

4 Conjunto de técnicas que resumem e descrevem os dados simplificando as informações para torná-las mais rapidamente compreensíveis. Etapa inicial da análise dos dados Tabelas Gráficos Medidas resumo MAIO/2010 Paula Strassmann PGS Medical Statistics Estatística descritiva - Definição

5 Representação gráfica para Variáveis qualitativas (categóricas) ou quantitativas discretas GRÁFICO DE BARRAS / COLUNAS: É utilizado para apresentar variáveis categóricas ou numéricas discretas. Em geral, no eixo das abscissas encontram-se as categorias e a altura das colunas correspondem às freqüências (simples ou relativas) das categorias. MAIO/2010 Paula Strassmann PGS Medical Statistics

6 MAIO/2010 Paula Strassmann PGS Medical Statistics Exemplo de gráfico de colunas para variáveis quantitativas discretas: Nº de filhos Nº de funcionários casados

7 Exemplo de gráfico de colunas para variáveis qualitativas: MAIO/2010 Paula Strassmann PGS Medical Statistics SatisfaçãoIndivíduos Insatisfeito50 Pouco satisfeito75 Muito satisfeito120

8 MAIO/2010 Paula Strassmann PGS Medical Statistics Cidade Nº de casos São Paulo52 Osasco20 Guarulhos17 Carapicuiba16 Caieiras10 Barueri8 Cotia8 Taboão da Serra5 Santana de Parnaíba4 Outros3 Exemplo de gráfico de barras para variáveis qualitativas: OUTROS* SANTANA DE PARNAIBA TABOÃO DA SERRA COTIA BARUERI CAIEIRAS CARAPICUIBA GUARULHOS OSASCO SÃO PAULO número de casos

9 Cruzamentos: Variáveis categóricas x Variáveis categóricas MAIO/2010 Paula Strassmann PGS Medical Statistics Sexo \ TabagismoSimNãoTotal Masculino175(81%)40(19%)215(100%) Feminino50(83%)10(17%)60(100%) Total225(82%)50(18%)275(100%)

10 MAIO/2010 Paula Strassmann PGS Medical Statistics Cruzamentos: Variáveis categóricas x Variáveis categóricas (Continuação) Sexo \ TabagismoSimNãoTotal Masculino175(81%)40(19%)215(100%) Feminino50(83%)10(17%)60(100%) Total225(82%)50(18%)275(100%)

11 MAIO/2010 Paula Strassmann PGS Medical Statistics Cruzamentos: Variáveis categóricas x Variáveis categóricas (Outro exemplo) Faixa etária \ Estado civil SolteiroCasadoSeparado / viúvoTotal Até 30 anos62(73%)18(21%)5(6%)85(100%) 30 a 50 anos23(24%)57(59%)17(18%)97(100%) Mais de 50 anos12(14%)42(50%)30(36%)84(100%) Total97(36%)117(44%)52(20%)266(100%)

12 MAIO/2010 Paula Strassmann PGS Medical Statistics Cruzamentos: Variáveis categóricas x Variáveis categóricas (Outro exemplo – Continuação)

13 Representação gráfica para variáveis qualitativas (categóricas) GRÁFICO DE SETORES (PIZZA): Cada fatia corresponde à porcentagem de ocorrências em cada categoria de resposta da variável. É indicado para variáveis qualitativas (preferencialmente nominais). Neste tipo de gráfico, todas as observações da amostra estão classificadas em uma das categorias, ou seja, a soma das porcentagens deve ser igual a 100%. MAIO/2010 Paula Strassmann PGS Medical Statistics

14 MAIO/2010 Paula Strassmann PGS Medical Statistics Exemplo de gráfico de setores (pizza) para variáveis qualitativas:

15 MAIO/2010 Paula Strassmann PGS Medical Statistics Exemplo de gráfico de setores (pizza) para variáveis qualitativas: Sexof(%) Homens150(75,0%) Mulheres50(25,0%) Total200(100,0%)

16 Histograma: Gráfico de barras justapostas em que no eixo horizontal está a variável de interesse, dividida em classes geralmente de mesmo tamanho. No eixo vertical, constrói-se uma barra para cada classe com altura igual à freqüência absoluta ou relativa correspondente. A barra é centrada no ponto médio da classe. Polígono de Freqüências: Construído a partir do histograma, onde se une através de segmentos de reta as ordenadas correspondentes aos pontos médios de cada classe. MAIO/2010 Paula Strassmann PGS Medical Statistics Representação gráfica para Variáveis quantitativas contínuas

17 Exemplo de histograma: Dados de registro pediátrico da concentração de chumbo na urina de 140 crianças de uma determinada região. Concentração de chumbo umol/24 hrsNº de crianças 0| | | | | | | | | | | Total140 Paula Strassmann PGS Medical Statistics MAIO/2010

18 Construção do Histograma para os dados da Tabela 1 Tabela 1. Ácido úrico sérico em homens sadios (Finn et al. (1966)). MAIO/2010 Paula Strassmann PGS Medical Statistics

19 Histograma para os dados da Tabela 1 MAIO/2010 Paula Strassmann PGS Medical Statistics

20 MAIO/2010 Paula Strassmann PGS Medical Statistics Polígono de frequência para os dados da Tabela 1

21 Estatística descritiva – Análise exploratória dos dados Como resumir VARIÁVEIS NUMÉRICAS? Medidas de posição ou Medidas de tendência central Moda Média Mediana Quartis, percentis Medidas de dispersão Amplitude Variância Desvio padrão MAIO/2010 Paula Strassmann PGS Medical Statistics

22 Valor que ocorre com maior freqüência. Exemplo: As idades dos alunos de uma classe são: 19, 19, 20, 20, 20, 21, 22. Nesse caso, Moda = 20 anos; Pode existir mais de uma moda. Distribuição é bimodal, trimodal,... Exemplo: As idades dos alunos de uma classe são: 19, 19, 19, 20, 20, 20, 21, 22. Nesse caso, Moda = 19 e 20 anos (bimodal); Pode não existir moda (não ter um valor mais freqüente). Exemplo: As idades dos alunos de uma classe são: 18, 19, 20, 21, 22. Nesse caso, Não existe Moda. Medidas de posição – Moda Paula Strassmann PGS Medical Statistics MAIO/2010

23 É a medida de tendência central mais utilizada; Leva em conta todos os valores da variável; É afetada por valores extremos; É o ponto de equilíbrio da distribuição dos dados. Média 2 (Dados ordenados) Média 1 (Dados ordenados) Paula Strassmann PGS Medical Statistics MAIO/2010 Medidas de posição – Média

24 Exemplo: Um estudante fez 5 provas e obteve notas 75, 90, 83, 77 e 92. Então sua nota média é: Paula Strassmann PGS Medical Statistics MAIO/2010 Medidas de posição – Cálculo da Média

25 Divide os dados ordenados ao meio; Medida resistente: pouco afetada por mudanças de valores discrepantes (extremos). mediana 50% (Dados ordenados) Paula Strassmann PGS Medical Statistics MAIO/2010 Medidas de posição – Mediana

26 Ordenam-se os dados; Seleciona-se a observação central. n ímpar: valor da observação central n par: média das duas observações centrais Posição da mediana = 3Mediana = 83 Posição da mediana = 3,4 Mediana = ( )/2 = 86,5 Paula Strassmann PGS Medical Statistics MAIO/2010 Medidas de posição – Cálculo da Mediana

27 Medidas de posição central São valores únicos representativos dos dados. Os mais usados são média aritmética, moda e mediana. Exemplo: Mediana = 49 anos (posição central) Moda = 39 anos (idade mais freqüente) Média = (575/11) = 52,3 anos Paula Strassmann PGS Medical Statistics MAIO/2010

28 Concluindo: Média: É o ponto de equilíbrio da distribuição dos dados. Moda: É o valor que ocorre com mais frequência. Mediana: Divide os dados ordenados ao meio. MAIO/2010 Paula Strassmann PGS Medical Statistics

29 Exercício 1: Com base nos dados da tabela abaixo, calcule: N º Aluno TurmaSexoIdadeAlturaPesoFuma 1AM171,669Sim 2AF181,7868Não 3BM241,6576Sim 4AM331,82106Não 5AF351,778Não 6BF481,5971Não 7BF241,7270Sim 8BM211,6680Não 9AM391,7189Não 10AM241,5568,5Não a) Peso médio b) Moda para Idade. c) Altura Mediana. MAIO/2010 Paula Strassmann PGS Medical Statistics

30 MAIO/2010 Paula Strassmann PGS Medical Statistics Resolução do Exercício 1: a)Peso médio: Portanto, peso médio = 77,55 kg. b) Moda para a Idade: Observando todas as idades da tabela, vemos que a idade que mais aparece é 24 anos (3 alunos têm 24 anos). As demais idades aparecem uma única vez. Portanto, Moda = 24 anos.

31 MAIO/2010 Paula Strassmann PGS Medical Statistics Resolução do Exercício 1 (Continuação): c)Altura mediana: Ordenação dos dados: 1,55; 1,59; 1,6; 1,65; 1,66; 1,7; 1,71; 1,72; 1,78; 1,82. Nesse caso, n = 10 (número par de elementos) e então a mediana é a média entre os 2 valores centrais. Posição da mediana: 5, 6. Mediana = Portanto, a altura mediana é 1,68 metros.

32 Q1Q1 Q2Q2 Q3Q3 Dados em ordem crescente Dividem os dados ordenados em 4 partes iguais: 25% dos dados estão abaixo do 1º quartil (Q 1 ) 50% dos dados estão abaixo do 2º quartil (Q 2 ou mediana) 75% dos dados estão abaixo do 3º quartil (Q 3 ) Dados Resistentes Paula Strassmann PGS Medical Statistics MAIO/2010 Medidas de posição – Quartis

33 3 o quartil (Q3) Mediana 1 o quartil (Q1) 1,5 (Q3 - Q1) Ponto discrepante Box-plot 1,5 (Q3 - Q1) Valor máximo entre os não discrepantes Valor mínimo entre os não discrepantes Paula Strassmann PGS Medical Statistics MAIO/2010

34 Temp. (ºC) 39,7 39,5 39,1 39,0 38,5 38,4 38,3 38,2 38,0 37,9 37,8 36,5 Tratamento 1 Temp. (ºC) 38,2 38,0 37,5 37,4 37,3 37,0 36,9 36,8 Tratamento 2 Exemplo: Gráfico de Box-Plot comparando dois tratamentos Paula Strassmann PGS Medical Statistics MAIO/2010

35 Distância entre os valores máximo e mínimo; Amplitude = valor máximo – valor mínimo; Ignora a distribuição dos dados; Exemplo: amplitude = 10 – 7 = 3 Paula Strassmann PGS Medical Statistics MAIO/2010 Medidas de dispersão – Amplitude

36 Exemplo 1: Duas amostras de 20 indivíduos. Amostra 1: Estatura mínima: 140 cme Estatura máxima: 180 cm Amostra 2: Estatura mínima: 150 cme Estatura máxima: 175 cm Em qual das duas amostras os indivíduos variam mais em relação à estatura ? Paula Strassmann PGS Medical Statistics MAIO/2010 Medidas de dispersão – Cálculo da Amplitude

37 Resolução do Exemplo 1: Amostra 1: Estatura mínima: 140 cm Estatura máxima: 180 cm Amostra 2: Estatura mínima: 150 cm Estatura máxima: 175 cm Máx – mín = 180 cm – 140 cm= 40 cm Máx – mín = 175 cm – 150 cm= 25 cm Os cálculos sugerem que a Amostra 1 contém mais estaturas diferentes, pois abrange uma faixa maior de valores Paula Strassmann PGS Medical Statistics MAIO/2010 Medidas de dispersão – Cálculo da Amplitude (Continuação)

38 Exemplo 2: Duas amostras de estatura (cm) de 6 indivíduos. Amostra 1: 150, 151, 153, 155, 158, 160 Amostra 2: 150, 155, 155, 155, 155, 160 A amplitude é a mesma nas duas amostras. Em qual das duas amostras os indivíduos variam mais em relação à estatura ? Observando os valores um a um, percebemos que a Amostra 1 varia mais. Paula Strassmann PGS Medical Statistics MAIO/2010 Medidas de dispersão – Cálculo da Amplitude (Continuação)

39 No exemplo, vimos que amostras com a mesma média podem ter variabilidades muito diferentes. Como medir a variabilidade de um conjunto de dados? A forma mais comum de medir a variabilidade é quantificá-la pelas distâncias das observações com relação á média. Paula Strassmann PGS Medical Statistics MAIO/2010 Medidas de dispersão (Continuação)

40 Medidas de Dispersão – Variância amostral Paula Strassmann PGS Medical Statistics MAIO/2010 A variância quantifica a variabilidade ou espalhamento ao redor da média das medidas. Tende a ser um número grande e o seu valor sai dos limites dos valores observados em um conjunto de dados. Além disso, sua unidade de medida corresponde a unidade de medida da média elevada ao quadrado.

41 Paula Strassmann PGS Medical Statistics MAIO/2010 Medidas de Dispersão – Desvio padrão amostral O desvio padrão, que é a raiz quadrada da variância, tem a mesma unidade de medida da média e pode ser usado para descrever a quantidade de dispersão na distribuição da freqüência.

42 O desvio padrão por si só não nos diz muita coisa. Um desvio padrão de 2 unidades pode ser considerado pequeno para um conjunto de dados cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar dois ou mais conjuntos de dados, relativamente à sua dispersão ou variabilidade, quando expressas em unidades diferentes. Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos ao seu valor médio, medida essa denominada coeficiente de variação (CV). Medidas de Dispersão (Continuação) MAIO/2010 Paula Strassmann PGS Medical Statistics

43 Paula Strassmann PGS Medical Statistics MAIO/2010 Indica a dispersão em relação à média; É uma medida de variabilidade relativa, definida como a razão entre o desvio padrão e a média, sendo uma medida adimensional expressa em percentual. Pode ser usado para comparar a dispersão de dois conjuntos de dados, sem que eles estejam necessariamente na mesma unidade de medida. Medidas de Dispersão – Coeficiente de correlação

44 Coeficiente de variação – Exemplo 1 Como 13 representa 18% de 72, então o CV é de 18% Por exemplo, em uma amostra de pacientes para determinação do clearance de creatinina, constatou-se que a média era de 72 ml/min e o desvio- padrão, de 13. Paula Strassmann PGS Medical Statistics MAIO/2010

45 Medidas as estaturas de 1017 indivíduos, obtivemos = 162,2 cm e s = 8,01 cm. O peso médio desses mesmos indivíduos é 58 kg, com um desvio padrão de 2,3 kg. Esses indivíduos apresentam maior variabilidade em estatura ou em peso? Coeficiente de variação para as estaturas: Coeficiente de variação para o peso: CV = 8,01 = 0,0494 = 4,94%; 162,2 Coeficiente de variação – Exemplo 2 CV = 2,3 = 0,0397 = 3,97%. 58,0 MAIO/2010 Paula Strassmann PGS Medical Statistics

46 Bibliografias recomendadas PAGANO, Marcello (1945) – Princípios de bioestatística / Marcello Pagano, Kimberlee Gauvreau; tradução Luiz Sérgio de Castro Paiva; revisão técnica Lúcia Pereira Barroso. – São Paulo: Pioneira Thomson Learning, (paginas ). Titulo original: Principles of bioestatistics Bussab, W.O. e Morettin, P.A. (2005) - Estatística Básica. 5ª Edição. São Paulo: Saraiva. 526p. Dawson-Saunders, Beth e Trapp, Robert G. (1994) - Basic & Clinical Biostatistics – A Lange medical book. Second Edition – Prentice-Hall Internationl Inc. 344p. Riffenburgh, Robert H. (2006) – Statistics in Medicine – Second Edition – San Diego, Caifornia – Elsevier Academic Press – 622p. Del Giglio, Auro (2008) – Conselhos para um jovem médico – 1ª Ed. – Editora Manole Ltda. – 118 p. MAIO/2010 Paula Strassmann PGS Medical Statistics

47 Paula G. Strassmann MAIO/2010 Paula Strassmann PGS Medical Statistics


Carregar ppt "Representação gráfica e tabular da distribuição dos dados e Medidas resumo MAIO/2010 Paula Strassmann PGS Medical Statistics."

Apresentações semelhantes


Anúncios Google