Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp
Os métodos não - paramétricos são usados para situações que violam as suposições dos procedimentos paramétricos Introdução: estatística não-paramétrica
Procedimentos não-paramétricos usam sinais (indicadores de se um nº é positivo, negativo, ou zero), contagens, e postos (ranks) e não usam médias e desvios padrão Introdução: estatística não-paramétrica
Quando os dados não seguem a normal ou são assimétricos Quando usamos a estatística não paramétrica? Negativa NormalPositiva Assimetria Distribuição Assimetria * dados na escala ordinal * quando não há igualdade de variância (dp)
Suposição de Normalidade para os Testes Paramétricos Os testes não-paramétricos exigem poucas suposições, por exemplo, não exigem distribuição normal dos dados Distribuição de QI
Teste de Kruskal-Wallis Uma alternativa não-paramétrica à ANOVA 1 fator Pode ser usada para analisar dados ordinais Não assume determinada forma da população Assume que os C grupos são independentes Assume seleção aleatória de amostras individuais
Exemplo: Nº de Pacientes por Dia, por Médico, em Três Categorias Organizacionais G1 G2 G Ho: As três populacões são idênticas Ha: Pelo menos uma das três populações é diferente
Teste de Kruskal-Wallis Alternativa ao teste one-way ANOVA H o :As k populações têm idêntica distribuições de probabilidade H a :pelo menos duas das populações diferem em localização KW = - 3(n + 1) 12 n(n + 1) Ti2Ti2niniTi2Ti2ninik i = 1 Rejeita Ho se KW é grande
KW (ou K ou H) é a estatística do teste
G1G2G H o : As três populacões são idênticas H a : Pelo menos uma das três populações é diferente Exemplo: Nº de Pacientes por Dia por Médico em Três Categorias Organizacionais
Dados: Pacientes por Dia Cálculos Preliminares n = n 1 + n 2 + n 3 = = 18 Two Partners Three or More PartnersHMO PatientsRankPatientsRankPatientsRank T 1 = 29T 2 = 52.5T 3 = 89.5 n 1 = 5n 2 = 7n 3 = 6
Dados: Pacientes por Dia Cálculos Preliminares
Exemplo do com dados (ranks = postos) iguais (empates) Cálculo da estatística H do teste de Kruskal-Wallis na presença de empates ANOVA de Kruskal-Wallis
Teste de Kruskal-Wallis com tied ranks Example (Zar, 1999) – comparison of pH among 4 ponds Ho: As quatro populacões são idênticas Ha: Pelo menos uma das quatro populações é diferente
Teste de Kruskal-Wallis com tied ranks Ho: As quatro populacões são idênticas Ha: Pelo menos uma das quatro populações é diferente
Teste de Kruskal-Wallis com tied ranks N = = 31 H = {12/[N(N + 1)]} (R i 2 /n i ) - 3(N + 1) H = {12/[31(31 + 1)]} (8917.8) - 3(31 + 1) = Número de grupos de tied ranks = m = 7
Teste de Kruskal-Wallis com tied ranks Number of groups of tied ranks = m = 7 T = (t i 3 - t i ) = (23 - 2) + (33 - 3) + (33 - 3) + (43 - 4) + (33 - 3) + (23 - 2) + (33 - 3) = 168 T = (t i 3 - t i ) = 168 C = 1 - T / (N 3 - N) = 1 - (168/ ( )) = H c = H / C = / = Fator de Correção = C = 1 - T / (N 3 - N) H corrigido = H calculado / C
Teste de Kruskal-Wallis com tied ranks Number of groups of tied ranks = m = 7 T = (t i 3 - t i ) = (23 - 2) + (33 - 3) + (33 - 3) + (43 - 4) + (33 - 3) + (23 - 2) + (33 - 3) = 168 C = 1 - T / (N 3 - N) = 1 - (168/ ( )) = H c = H/C = / = = k - 1 = 4 -1 = , 3 = < = 0.01 rejeita Ho (Tabela Qui-quadrado ) Fator de Correção = C = 1 - T / (N 3 - N) H corrigido = H calculado / C
Não preocupemo-nos com os empates. Porque os programas de computador (Minitab, por exemplo) já calculam E, também, porque há equivalência com o teste ANOVA paramétrica efetuada com os dados transformados Calculamos ANOVA on rank data daí obtemos o valor de F que designamos por F r H corrigido = F r (N-1) / [F r + (N-K) / (K – 1) ] K = número de grupos ; N = tamanho total da amostra
Não preocupemo-nos com os empates Há equivalência com o teste ANOVA paramétrica efetuada com os dados transformados Calculamos ANOVA on rank data daí obtemos o valor de F que designamos por F r F r = [H calculado / (K-1) ] / [(N – 1 – H) / (N – K)] Ao obtermos Fr, se aplicarmos a fórmula acima, então, obtemos H corrigido
Há equivalência entre KRUSKAL-WALLIS com o teste ANOVA paramétrica efetuada com os dados transformados Calculamos ANOVA on rank data daí obtemos o valor de F que designamos por F r F r = [H calculado / (K-1) ] / [(N – 1 – H) / (N – K)] H corrigido = Fr(N-1) / [Fr + (N-K) / (K – 1) ] ou
Vale a pena ler: W.J. CONOVER and R. L. IMAN – Rank Transformations as a Bridge Between Parametric and Nonparametric Statistics The American Statistician. vol. 35, nº 3, p , Conclusão: são equivalentes os testes: de Kruskal-Wallis e o ANOVA on rank data
Paramétrico ANOVA on rank Equivalência entre os testes Termos que devem ser familiares Não Paramétrico Kruskal-Wallis correção devido a empates