Bioestatística e Epidemiologia Medidas de Tendência Central
Medidas de Tendência Central para uma amostra Os dados quantitativos, apresentados em gráficos e tabelas, constituem a informação básica do problema em estudo. Além da apresentação dos dados, é conveniente que se mostre a informação de forma resumida. As medidas de tendência central dão o valor do ponto em torno do qual os dados se distribuem. São medidas de tendência central: média aritmética, mediana e moda
Média Aritmética Para se obter a média aritmética basta somar os valores de todos os dados e dividir o total pelo número deles. Exemplo: Tabela 3.1 Peso, em gramas, de ratos machos da raça Wistar com 30 dias de vida. A média aritmética dos dados apresentados na Tabela 3.1 é: 50 + 86 + ... + 74 = 804 = 67 12 12
É conveniente introduzir, neste ponto, a fórmula da média aritmética É conveniente introduzir, neste ponto, a fórmula da média aritmética. A variável em estudo será indicada pela letra maiúscula X, e os valores observados dessa variável serão indicados pela letra minúscula x. Para distinguir um valor do outro, serão usados índices. Então, o i-ésimo valor observado de X será indicado por xi. No exemplo, a variável é o peso de ratos, e os valores observados são: x1 = 50, x2 = 86, .... x12 = 74 A média aritmética, se representa por: O símbolo lê-se somatório de x1, i de 1 a n e indica que todos os valores xi devem ser somados, desde o primeiro (xi) até o n-ésimo (xn).
Média de dados em tabelas de distribuição de frequências Para dados que estão em uma tabela de distribuição de frequências, o cálculo da média aritmética é feito de outra forma. Considere os dados da Tabela 3.2: O número de nascidos vivos nessa amostra é: n = 3 + 16 + 31 + 34 + 11 + 4 + 1 = 100
Para obter a média dos pesos ao nascer dos nascidos vivos da amostra, multiplica-se o ponto médio de cada classe pela respectiva frequência, somam-se os produtos e divide-se a soma por n. Então a média é: Tabela 3.3. x = 1,75 . 3 + 2,25 . 16 + .... + 4,25 . 1 = 300,00 = 3,00 100 100
Generalizando, considere uma tabela de distribuição de frequências com k classes. Sejam x1, x2, ... , xk os valores dos pontos médios de classe e sejam ƒ1, ƒ2, ... ƒk as respectivas frequências, como mostra a Tabela 3.3: A média dos dados da Tabela 3.3 é dada pela soma x1ƒ1 + x2ƒ2 + ... +xkƒk dividida por n, isto é:
Mediana Mediana é o valor que ocupa a posição central do conjunto dos dados ordenados. Se a amostra é constituída por um numero ímpar de dados, a mediana é o valor que fica no centro dos dados ordenados. Por exemplo, a mediana dos valores 1, 2, 3, 5 e 9 é 3. Se a amostra é constituída por um número par de dados, a mediana é a média aritmética dos dois valores que ficam na posição central dos dados ordenados. Por exemplo, a mediana dos valores 1, 2, 3, 4, 7 e 9 é 3 + 4 / 2 = 3,5.
Em algumas circunstâncias a mediana mais bem descreve a tendência central dos dados. É o caso dos conjuntos com dados discrepantes, isto é, dados de conjuntos que têm um ou alguns valores bem maiores ou bem menores que os demais. Veja no exemplo a seguir: o valor 42 é discrepante e “puxa” a média para cima.
Existem casos, porém, em que o uso da média aritmética é mais razoável do que a mediana, mesmo que haja um valor discrepante. Como por exemplo, considere que você jogou três vezes na loteria e ganhou: Na primeira vez, x1 = R$ 0,00 Na segunda vez, x2 = R$ 0,00 Na terceira vez, x3 = R$ 1.000.000,00 Qual medida descreve melhor o seu ganho? A mediana é zero, mas a média é 1/3 do valor de x3, e esse valor diz mais sobre seu ganho nas três tentativas.
Moda Moda é o valor que ocorre com maior frequência. Um conjunto de dados pode não ter moda porque nenhum valor se repete maior número de vezes, ou ter duas ou mais modas. Assim, o conjunto de dados 0, 2, 4, 6, 8, 10 não tem moda, e o conjunto de dados 1, 2, 2, 3, 4, 4, 5, 6, 7 Tem duas modas: 2 e 4.
A moda também pode ser usada para descrever dados qualitativos A moda também pode ser usada para descrever dados qualitativos. Nesse caso, a moda é a categoria que ocorre com maior frequência.
A moda é bastante informativa quando o conjunto de dados é grande A moda é bastante informativa quando o conjunto de dados é grande. Se o conjunto de dados for relativamente pequeno (menos de 30 observações), você pode até obter a moda, mas, na maioria das vezes, ela não terá qualquer sentido prático. A média e a mediana fornecem, nesses casos, melhor descrição da tendência central dos dados.
Exercícios 1. De acordo com os dados da Tabela 3.1, calcule o peso médio dos ratos em cada idade. TABELA 3.1
2. Determine a mediana dos dados apresentados na Tabela 3.2.
3. Foi feito um experimento para testar o efeito de um anti-inflamatório em pacientes com osteoartrite. Os pacientes foram sorteados para receber placebo (2 x ao dia) ou droga (60 mg 2 x ao dia). Os dados, apresentados na tabela 3.4, são uma medida de dor à noite (0 = nenhuma; 100 = dor extrema), relatada pelo paciente. Calcule as diferenças entre os valores obtidos no final e no início da pesquisa para placebo e para droga. Calcule as médias dessas diferenças e discuta. TABELA 3.4