Estatística Inferencial
É um processo de tomada de decisão baseado em probabilidades e pode ser de dois tipos: - Estimação de parâmetros – usando a informação de uma estatística amostral podem tirar-se conclusões sobre um valor de um parâmetro populacional; - Testes de hipóteses – usando a informação da amostra é possível decidir se uma hipótese (pressuposto) sobre um parâmetro populacional, por exemplo, a média ou proporção, deve ou não ser rejeitada. (Denisa Mendonça – ICBAS-UP, 2004)
Testes de Hipóteses... usando a informação da amostra é possível decidir se uma hipótese (pressuposto) sobre um parâmetro populacional, por exemplo, a média ou proporção, deve ou não ser rejeitada. (Denisa Mendonça – ICBAS-UP, 2004)... Definição da hipótese nula H 0 e alternativa H 1... Construção de uma estatística teste... Cálculo do valor de prova (p) de um teste estatístico... Contraste do valor de prova (p) e nível de significância (α)
Definição da Hipótese nula (H 0 ) e alternativa (H 1 ) Hipótese nula, H 0, é uma afirmação que indica não haver diferença entre a média da população, u, e o valor hipotético assumido; isto é, nula significa que não há diferença. Hipótese alternativa, H 1, é uma afirmação que discorda da hipótese nula.... se a hipótese nula é rejeitada em resultado da evidência, a hipótese alternativa é a conclusão.... se não tivermos evidência suficiente para rejeitar a hipótese nula, ela mantém-se mas não a aceitamos, dizemos apenas que não a podemos rejeitar. (Denisa Mendonça – ICBAS-UP, 2004)
Testes unilaterais e bilaterais Bilaterais (não direccionais) - na hipótese de investigação não há conhecimento apriori da direcção da associação (μ1 ≠ μ2). H 0 : μ1 = μ2 H 1 : μ1 ≠ μ2 Unilaterais (direccionais) - a hipótese de investigação não só refere que há uma associação como indica a direcção (positiva ou negativa) dessa associação (μ1 > μ2). H 0 : μ1 ≤ μ2 H 1 : μ1 > μ2
Analogia com o sistema judicial (Denisa Mendonça – ICBAS-UP, 2004)
Sistema judicial e a estatística têm pontos comuns Hipótese alternativa - razão pela qual um réu é preso. Obviamente a polícia não pensa prender ninguém que seja inocente. Na estatística a H 1 é a hipótese que o investigador deseja avaliar. Hipótese nula - no sistema judicial esta é a presunção de inocência. Em ambos os sistemas, judicial e estatística, a H 0 indica que o suspeito e o tratamento não fazem nada. O nulo é logicamente o oposto do alternativo.
Hipótese: Indivíduo é inocente A acusação tem de encontrar provas suficientes para considerar que o índivíduo não é inocente e rejeitar a hipótese de inocência SUSPEITA
Construção da estatística teste Um determinado teste estatístico segue uma determinada distribuição, segundo a hipótese nula (i.e. se H 0 fosse verdadeira) Por exemplo, a estatística... para testar médias segue uma distribuição t de student,... para testar proporções segue uma distribuição qui-quadrado,... para testar variâncias segue uma distribuição F,... etc. (Denisa Mendonça – ICBAS-UP, 2004) Valores elevados de um teste estatístico indicam que os dados estão longe do esperado, mostrando evidência contra a hipótese nula e favorecendo a hipótese alternativa
Cálculo do valor de prova (p) de um teste de significância estatística Valor de prova (p-value) - a probabilidade (p) de obter por acaso o resultado observado no teste estatístico realizado, ou outro ainda mais extremo, admitindo que a hipótese nula é verdadeira.... o teste estatístico é então convertido numa probabilidade condicional chamada valor de prova.... o valor de prova responde à seguinte questão “Se a hipótese nula for verdadeira, qual é a probabilidade de se encontrarem os dados observados, ou outros mais extremos?”
Contraste do valor de prova (p) com o nível de significância (α)... se o valor de prova (p) é menor que uma certa quantidade (α) consideramos H 0 improvável e portanto rejeitamos H esta quantidade é chamada nível de significância (α). Indica a probabilidade de rejeitar a hipótese nula quando ela é verdadeira.... esta quantidade deve ser pequena, porque não queremos rejeitar H 0, quando ela é verdadeira (cometer o erro tipo I)... os valores tradicionais para α são 0.05, 0.01 e
Se utilizarmos um nível de significância (α) de quando o valor de prova é >0.05 → a diferença observada não é “significativa”... quando o valor de prova é ≤0.05 → a diferença é “significativa”... neste contexto, entende-se por “significativa” que a “diferença observada não é provável por acaso. Não significa, necessariamente, “importância” ou “relevância” substantiva.
Um exemplo....
Foi aplicado um programa de musculação a 20 homens, durante 6 semanas, com o objectivo de verificar o seu efeito no peso corporal. No final da aplicação do programa verificou-se uma diminuição média, no peso corporal, de 1.1 Kg. A amostra foi retirada de uma população cuja variável segue uma distribuição normal onde é conhecido = 2.8 Kg, e onde é sabido que programas desta natureza não produzem qualquer efeito
1º Passo - Formulação das hipóteses estatísticas H 0 : = 0 Kg (a média na população é 0 Kg) H 1 : 0 Kg (a média na população é 0 Kg). Nesta hipótese não se conhece o sentido (logo é bilateral).
2º passo - escolher o nível de significância para o teste estatístico = º passo - decidir qual o teste apropriado para a hipótese admitida (com conhecido ou não) Tendo em conta que se conhece o desvio padrão da população, a estatística a utilizar baseia-se na distribuição N(0,1)
4º passo - Fazer os cálculos Média da amostra = -1.1 Média da população = 0 Desvio padrão população = 2.8 N = 20 sujeitos
5º passo - Cálculo do valor de prova Valor de prova (p) = 7.84 Como esta probabilidade é superior a 0.05 ou 5.0 % (nível de significância), não se rejeita H Z= Z= 1.76 p = Z= p =
ALTERNATIVA Definição da área de rejeição e não rejeição na distribuição normal, usando um = 0.05 (bilateral) Z=? Z= 1.96 Z= % Zona não rejeição Zona rejeição Como > cai na região de não rejeição de H Z=- 1.96Z= 1.96