Análise de Variância (ANOVA) Pontos mais importantes: -metodologia -cálculo de “within sample sum of square”, SSW -cálculo de “between samples sum of square”, SSB -comparação de SSw e SSB -tabela de ANOVA -ANOVA é um modelo aditivo 1
Já tínhamos visto como se construi um teste para a igualdade das médias de duas populações: Hipótese nula: H0 : mX=mY Hipótese alternativa: H1 : mX mY O que acontece, quando temos mais do que duas médias (tratamentos) para comparar? 2
O tempo de coagulação da sangue (segundo) em animais sujeitos à quatro dietas diferentes i/j A 62 60 63 59 B 67 71 64 65 66 C 68 D 56 61 [X]= 3
Questão: Os dados observados indicam qualquer evidência que existe uma diferença entre os (valor médio) tratamentos? Hipótese nula: H0 : mA=mB =mC=mD Hipótese alternativa: H1 : mA mB mC mD Conceito: avaliar, se a dispersão do valor médio entre tratamentos estivesse maior do que podia ser esperado (provável) baseado no cálculo de dispersão dos dados dentro dos tratamentos. Metodologia: -cálculo da estimativa da s2, só válida quando H0 é verdadeira -cálculo da estimativa da s2, sempre válida -comparação de estas duas 4
Cálculo de estimativa da s2, sempre válida- “within sample sum of squares” (soma dos quadrados dentro da amostra), SSW A média amostral de tratamento “i” obtenha-se: i=1, 2, ...,m Variância amostral de tratamento i: i=1, 2, ...,m 5
como aplicando independência, a distribuição conjunta da soma de estas variâncias amostrais tem: 6
-Exemplo Xi S2i A 62 60 63 59 61 3.3 B 67 71 64 65 66 8 C 68 2.8 D 56 6.8 SSw =112 SSW=33.3 + 58 + 52.8 + 76.8 = 112 7
Cálculo de estimativa da s2, só válida quando H0 é verdadeira - “between sample sum of squares” (soma dos quadrados entre as amostras), SSB Se H0 for verdadeira, cada Xij tem uma distribuição normal com m e s2. Uma estimativa para o valor médio m pode ser calculada: Se H0 for verdadeira, Xi também tem uma distr. com valor médio m mas com variância igual à s2/ni. Uma estimativa da variância do valor médio é dada pela: 8
Considerando o facto que: ns2/s2 ~ c2n Temos: Por isso Nota: pode-se mostrar que quando H0 é falso, SSB/(m-1) sobre estima a variância (s2) 9
-Exemplo Xi S2i A 62 60 63 59 61 3.3 B 67 71 64 65 66 8 C 68 2.8 D 56 6.8 X= SSB= 228 SSB=4(61-64)2 + 6(66-64)2 + 6(68-64)2 + 8(61-64)2 = 228 10
Comparação de SSw e SSB A divisão de duas v.a.s 2k e 2l resulta uma v.a. de distribuição F com k e l graus de liberdade a forma seguinte: Aplicando isto para as duas estimativas da variância temos quando H0 é verdade: 11
Assim, já é relativamente fácil avaliar o teste de hipótese: Hipótese nula: H0 : mA=mB =mC=mD Hipótese alternativa: H1 : mA mB mC mD porque -aceita H0 se -rejeita H0 se 12
Tabela de analise de variância (ANOVA) Para simplificar o cálculo e visualização dos resultados da ANOVA, é costumo apresentar a tabela ANOVA Fonte de variabilidade Soma quadrada Grau de liberdade F Entre das amostras m-1 dentro da amostra 13
Fonte de variabilidade -Exemplo Fonte de variabilidade Soma quadrada Grau de liberdade F Entre das amostras SSB=228 3 F3,20= (228/3)/(112/20)=13.6 dentro da amostra SSW=112 20 14
15
-Output de programa SPSS10.0 16
Fonte de variabilidade Caso especial: o número de dados em cada tratamento e igual, n1= n2=...= nm Fonte de variabilidade Soma quadrada Grau de liberdade F Entre das amostras m-1 dentro da amostra m(n-1) 17
Analogia entre o conceito de analise de variância (ANOVA) e um modelo aditivo Modelo linear: y=aX+b Dados experimentais: Suponha que a=1, a equação anterior pode ser escrita após de aplicar a uma amostra: resíduo valor médio amostral incremento de linha (tratamento) 18
A equação anterior pode ser apresentada em forma matricial: [X]=[A]+[T]+[R] Exemplo: Xji X Xi-X Xji-Xi valor médio amostral incremento de coluna (tratamento) resíduo 19
Questão: [T] pode ser considerada 0 ou não? Para dar a resposta, determina-se o “tamanho” da matrizes utilizando a norma. e.g. {v}={a b c} ||v||=a2+b2+c2 SSB SSW Assim: O teste de ANOVA é a avaliação de SSB em relação de SSW. Se for pequeno, aceita H0, se for grande, rejeita H0. 20