Carregar apresentação
A apresentação está carregando. Por favor, espere
PublicouRaquel Mascarenhas Assunção Alterado mais de 6 anos atrás
1
Bioestatística e Epidemiologia Aula 4: Medidas de Dispersão para uma Amostra
2
Medidas de Dispersão para uma amostra
As medidas de tendência central, vistas na aula passada, são apropriadas para descrever a amostra quanto menor é a dispersão dos dados. Para entender o que é dispersão, imagine que quatro alunos obtiveram, em cinco provas, as notas apresentadas na tabela 4.1.
3
Todos os alunos obtiveram média igual a 5, mas a dispersão das notas em torno da média não é a mesma para todos os alunos. A tabela mostra que: As notas do Antônio não variam (a dispersão é nula). As notas do João variaram menos que as notas de José (a dispersão das notas de João é menor do que a dispersão das notas de José). As notas de Pedro variaram mais do que as notas de todos os outros (a dispersão das notas de Pedro é a maior.
4
Essas observações serão verificadas através das seguintes medidas de dispersão: amplitude, variância e desvio padrão. Amplitude: Por definição, a amplitude é a diferença entre o maior e o menor dado observado. É fácil calcular a amplitude para os dados apresentados na Tabela 4.1. As notas de Antônio têm amplitude: a = 5 – 5 = 0 As notas de João têm amplitude de: a = 6 – 4 = 2 As notas de José têm amplitude de: a = 10 – 0 = 10 As notas de Pedro têm amplitude de:
5
Amplitude: A amplitude nem sempre capta certas diferenças. No caso das notas dos alunos, a amplitude mostra, acertadamente, que as notas de Antônio não variaram (a = 0) e que as notas de João variaram menos que as de José (a = 2 no primeiro caso e a = 10 no segundo). No entanto, a amplitude não mostra que as notas de Pedro variaram mais que as notas de José (a = 10 nos dois casos). A amplitude não mede bem a dispersão dos dados porque, em seu cálculo, usam-se apenas valores extremos – e não todos os dados. De qualquer forma, a amplitude é muito usada, principalmente porque é fácil de calcular e interpretar.
6
Variância: Os dados distribuem-se em torno da média. Então, o grau de dispersão de um conjunto de dados pode ser medido pelos desvios em relação à média. Desvio em relação à média é a diferença entre cada dado e a média do conjunto. Por exemplo: se a média de idade de uma família for 30 anos, a pessoa que tiver 54 anos terá um desvio em relação à média de: 54 – 30 = 24 anos.
7
Variância: Como cada dado tem um desvio em relação à média, para julgar o grau de dispersão de uma amostra é preciso observar todos os desvios. Não se pode calcular a média dos desvios porque a soma é sempre igual a zero. Considere os seguintes dados: 0, 4, 6, 8 e 7 A média desses dados é: = 25 = 5 Os desvios em relação à média são os seguintes: 0 – 5 = -5 4 – 5 = -1 6 – 5 = 1 8 – 5 = 3 7 – 5 = 2
8
Variância: Em conjunto, esses desvios mostram o grau de dispersão dos dados em torno da média. Mas a soma dos desvios é igual a zero, como é fácil verificar: -5 – = = 0 Qualquer que seja o conjunto de dados, a soma dos desvios é sempre igual a zero porque os valores negativos e positivos se anulam. Desta forma, para medir a dispersão dos dados em torno da média, usa-se a soma dos quadrados dos desvios. Como os quadrados de números negativos são positivos, toda soma de quadrados é positiva ou, no mínimo, nula.
9
No exemplo, a soma de quadrado dos desvios é igual a 40.
A soma de quadrados dos desvios não é usada como medida de dispersão porque seu valor cresce com o número de dados. Para medir a dispersão dos dados em torno da média usa-se então a variância, que leva em consideração o tamanho da amostra.
10
Variância: A variância (s2) é definida como a soma dos quadrados dos desvios dividida pelo tamanho da amostra, menos 1 (n – 1). Os estatísticos chamam o valor (n – 1) de graus de liberdade. No exemplo, a soma dos quadrados dos desvios = 40. Amostra = 5, n – 1 = 4. Portanto a variância é 40 / 4 = 10. Variância das notas dos alunos: Notas do Antônio, que não variaram, s2 = 0. Notas do João: s2 = 1 Notas José: s2 = 12,5 Notas Pedro: s2 = 25.
12
Desvio Padrão: Como medida de dispersão, a variância tem a desvantagem de apresentar unidade de medida igual ao quadrado da unidade de medida dos dados. Por exemplo: se os dados estão em metros, a variância fica em metros quadrados. O desvio padrão (s) é uma medida de dispersão que apresenta as propriedades da variância e tem a mesma unidade de medida dos dados. O desvio padrão é definido como a raiz quadrada da variância, com sinal positivo. Exemplo: Variância notas de José: 12,5 Desvio Padrão: √12,5 = 3,54
13
Coeficiente de Variação:
O coeficiente de variação é a razão entre o desvio padrão e a média. O resultado é multiplicado por 100, para que o coeficiente de variação seja dado em porcentagem. Então: CV = Desvio padrão (s) x 100 média (x) Exemplo: Dois grupos de pessoas Primeiro grupo: idades de 3, 1 e 5 anos Segundo grupo: idades de 55, 57 e 53 anos No primeiro grupo a média de idade é de 3 anos e no segundo, de 55 anos. Ambos têm variância s2 = 4. Mas as diferenças de 2 anos são muito mais importantes no primeiro grupo, que tem média 3, do que no segundo que tem média 55.
14
O coeficiente de variação no primeiro grupo é:
CV = 2/3 x 100 = 66,67% E, no segundo grupo é: CV = 2/55 x 100 = 3,64% Um coeficiente de variação de 66,67% indica que a dispersão dos dados em relação à média é muito grande, ou seja, a dispersão relativa é alta. Já um coeficiente de variação de 3,64% indica que a dispersão dos dados em relação à média é pequena. O coeficiente de variação mede dispersão em relação à média.
15
Exercícios: São dados os níveis de colesterol de cinco pessoas: 260, 160, 200, 210 e 140. Calcule a média e a variância. Calcule a média, o desvio padrão e o coeficiente de variação dos dados apresentados na tabela a seguir:
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.