Testes de Hipóteses Forma mais clássica de inferência estatística Consiste em verificar se a informação estatística é suficientemente significante para rejeitar uma dada hipótese em favor de outra (que é, de fato, o que se pretende comprovar estatisticamente).
Elementos de um teste Hipótese nula (H0: q Q0) Hipótese alternativa (H1: q Q1) Estatística do teste: T(X) Região de rejeição: RR (a hipótese nula é rejeitada quando T(X) RR). Erro Tipo I: rejeitar a hipótese nula quando ela é verdadeira. Erro Tipo II: não rejeitar a hipótese nula quando ela é falsa. Nível de significância (a): probabilidade máxima aceitável de rejeição da hipótese nula, caso ela seja verdadeira.
Definição Um teste baseado na estatística T(X), com região de rejeição RR, para testar H0 vs.H1, tem nível de significância a quando Pq (T(X) RR) ≤ a, q Q0 (ou seja, quando a probabilidade de se cometer erro do tipo I é no máximo a). Note que a probabilidade de se cometer erro do tipo II não é considerada na definição.
Exemplo Sejam X1, X2, ..., Xn i.i.d. U[0, q]. Construir um teste de nível de significância 0,05 para testar H0: q = 100 vs. H1: q < 100, baseado em T(X) = max Xi. Se n = 20 e T(X) = 90, a hipótese nula é rejeitada?
Probabilidade de erro tipo II Dado um teste de hipóteses, a probabilidade de erro tipo II quando o valor do parâmetro é igual a q é denotada por b(q). Assim: b(q) = Pq (T(X) RR), para q Q1 .
Exemplo No exemplo anterior, quais são os valores de b(99), b(95) e b(80)? Qual deveria ser o tamanho mínimo da amostra para que b(95) fosse no máximo igual a 0,1?
Observação Embora a probabilidade de erro tipo II não seja considerada na definição, o objetivo, ao construir um teste, é o de obter o teste que satisfaça a condição de erro tipo I (a) e que tenha a menor probabilidade de erro tipo II (b) possível. Em alguns casos (tipicamente quando os testes são unilaterais), tais testes existem e são chamados de testes uniformemente mais poderosos de nível a.
Testes para distribuição normal X1, X2, ..., Xn i.i.d. N(m, s2) Como no caso de I.C., há quatro casos: Testes para m, com s2 conhecido Testes para s2, com m conhecido Testes para m, com s2 desconhecido Testes para s2, com m desconhecido
Testes para m, com s2 conhecido Testes z Estatística de teste: X Teste bilateral: H0: m = m0 vs. H1: m ≠ m0 Rejeita H0 quando
Testes para m, com s2 conhecido Teste unilateral: H0: m = m0 vs. H1: m > m0 H0: m ≤ m0 vs. H1: m > m0 H0: m = m0 vs. H1: m = m1 (com m1> m0) Rejeita H0 quando
Testes para m, com s2 desconhecido Testes t Estatística de teste: X, S Teste bilateral: H0: m = m0 vs. H1: m ≠ m0 Rejeita H0 quando
Testes para m, com s2 desconhecido Teste unilateral: H0: m = m0 vs. H1: m > m0 H0: m ≤ m0 vs. H1: m > m0 H0: m = m0 vs. H1: m = m1 (com m1> m0) Rejeita H0 quando
Testes para s2, com m conhecido Estatística de teste: S (Xi – m)2 Teste bilateral: H0: s2 = s02 vs. H1: s2 ≠ s02. Rejeita H0 quando S (Xi – m)2 / s02 > c2n(a/2) ou S (Xi – m)2 / s02 < c2n(1–a/2)
Testes para s2, com m conhecido Teste unilateral: H0: s2 = s02 vs. H1: s2 > s02 H0: s2 ≤ s02 vs. H1: s2 > s02 H0: s2 = s02 vs. H1: s2 = s12 (com s12> s02) Rejeita H0 quando S (Xi – m)2 / s02 > c2n(a)
Testes para s2, com m desconhecido Estatística de teste: S (Xi – X)2 Teste bilateral: H0: s2 = s02 vs. H1: s2 ≠ s02. Rejeita H0 quando S (Xi – X)2 / s02 > c2n-1(a/2) ou S (Xi – X)2 / s02 < c2n-1(1–a/2)
Testes para s2, com m desconhecido Teste unilateral: H0: s2 = s02 vs. H1: s2 > s02 H0: s2 ≤ s02 vs. H1: s2 > s02 H0: s2 = s02 vs. H1: s2 = s12 (com s12> s02) Rejeita H0 quando S (Xi – X)2 / s02 > c2n-1(a)
Exemplo Suponha que n = 25, SXi = 550 e SXi2 = 16000. Testar m = 20 vs. m ≠ 20 e s = 10 vs s > 10 ao nível de significância 0,05.
Probabilidade de significância Normalmente, pacotes estatísticos não fornecem diagnósticos em termos de rejeição ou não da hipótese nula. Em lugar disso, eles fornecem a probabilidade de significância ou valor p do teste, que é o menor valor de a para o qual a hipótese nula é rejeitada.
Exemplo Quais são os p-valores dos testes do exemplo anterior?