A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia.

Apresentações semelhantes


Apresentação em tema: "Mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia."— Transcrição da apresentação:

1 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia Programa: 1. Introdução aos MLG 2. Regressão Logística 3. MLG aplicados a variáveis resposta com distribuição contínua 4. MLG aplicados a dados de contagens 5. Análise de variância (ANOVA) com MLG 1. Programa

2 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia Objectivo da Análise de Variância Avaliar como uma ou mais variáveis categóricas influenciam uma variável aleatória (resposta). Modelos disponíveis MLG PoissonMLG BinomialMLG Binomial Negativa MLG NormalMLG GamaMLG Gaussiana Inversa 2. Objectivo

3 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia Introdução à Análise de Variância Uma variável categórica também se designa por Factor. Os valores que toma são designados Níveis. Exemplos: FactorNíveis CorAzul, Verde, Vermelho SexoMasculino, Feminino IdadeJuvenil, Adulto 3. Introdução

4 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia ANOVA a um factor Y tem distribuição Normal Y tem distribuição Binomial Negativa Questão: As populações têm a mesma distribuição? ANOVA a um factor 4. ANOVA 1 factor

5 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia ANOVA a um factor Hipóteses: H 0 : Para todos os p níveis do factor estudado, a variável resposta Y tem a mesma distribuição H 1 : Para pelo menos um dos p níveis a distribuição de Y é distinta dos restantes (i.e., as médias das p populações não são idênticas). Pressupostos: •Foi recolhida uma amostra aleatória (plantas, animais, etc.) de cada uma das p populações. •Para cada unidade experimental registou-se o valor da variável resposta Y. •Y tem distribuição pertencente à família exponencial. •O parâmetro de dispersão  é constante. 4. ANOVA 1 factor

6 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia ANOVA a um factor Trabalho utilizado como exemplo: BUZZING BEES (HYMENOPTERA: APIDAE, HALICTIDAE) ON SOLANUM (SOLANACEAE): FLORAL CHOICE AND HANDLING TIME TRACK POLLEN AVAILABILITY Entre outros objectivos, pretendeu-se saber se o tempo [s] de recolecção de pólen em flores ‘novas’ de Solanum wendlandi difere entre 3 espécies de abelhas: Sp1: Pseudaugochloropsis graminea Sp2: Euglossa erythrochlora Sp3: Bombus pullatus Shelley, T.E., Villalobos, E., and students of the Fall 1997 OTS-USAP Florida Entomologist 83(2) June, 2000 4. ANOVA 1 factor X – espécie para a qual se registou o tempo de recolecção de pólen  – tempo médio de recolecção de pólen

7 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia Formulação mais simples do modelo Y I1I1 I2I2 I3I3 5010 3001 1100 18100 7010 2001 onde A variável resposta (tempo de recolecção) é uma variável contínua positiva. O MLG Gama poderá ser adequado ANOVA a um factor A análise que se pretende constitui um modelo linear (generalizado ou não, consoante a distribuição de Y Configuração dos dados 4. ANOVA 1 factor

8 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia ANOVA a um factor Valor médio de Y 11 > summary(glm(e5a$Y~ -1+e5a$ I 1+ e5a$ I 2+e5a$ I 3, family=Gamma (link=identity))) Estimate Std. Error t value Pr(>|t|) e5a$ I 1 38.083 4.484 8.494 2.72e-13 *** e5a$ I 2 18.528 2.918 6.349 7.37e-09 *** e5a$ I 3 14.660 1.500 9.772 5.08e-16 *** (Dispersion parameter for Gamma family taken to be 0.4712827) Null deviance: NaN on 98 degrees of freedom Residual deviance: 53.109 on 95 degrees of freedom 22 33 >1-pchisq(53.1,95) 0.9998438 Com esta formulação, é difícil testar a significância das diferenças entre níveis. 4. ANOVA 1 factor

9 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia O método de “Reference Cell Coding” ANOVA a um factor A espécie 3 pode ser descrita como “não sendo nem a espécie 1 nem a espécie 2”, se essas forem as 3 únicas alternativas Configuração dos dados Y I1I1 I2I2 501 300 110 1810 701 200 RFC A espécie 3 constitui o nível de referência Espécie Sp1 Sp2 Sp3 I1I1 I2I2 10 01 00 (exemplo5a.txt) Eliminação da terceira coluna 4. ANOVA 1 factor Formulação do modelo

10 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia ANOVA a um factor Valor médio de Y 11 22 00 11 22 33 Estimate Std. Error t value Pr(>|t|) e5a$ I 1 38.083 4.484 8.494 2.72e-13 e5a$ I 2 18.528 2.918 6.349 7.37e-09 e5a$ I 3 14.660 1.500 9.772 5.08e-16 Relação entre os  ’s e os  ’s Estimate Std. Error t value Pr(>|t|) (Intercept) 14.660 1.500 9.772 5.08e-16 e5a$ I 1 23.423 4.728 4.954 3.16e-06 e5a$ I 2 3.869 3.281 1.179 0.241 4. ANOVA 1 factor

11 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia ANOVA a um factor Teste à significância do factor H 0 : Para todos os p níveis do factor estudado, a variável resposta Y tem a mesma distribuição H 1 : Para pelo menos um dos p níveis a distribuição de Y é distinta dos restantes. Null deviance: 72.086 on 97 degrees of freedom Residual deviance: 53.109 on 95 degrees of freedom Modelo Nulo > 1-pchisq(72.086-53.109,97-95) [1] 7.57176e-05 H 0 é rejeitada 4. ANOVA 1 factor

12 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia ANOVA a dois factores Objectivo : Saber se o tempo de recolecção de pólen pelas 3 espécies de abelhas difere entre si e ao longo da manhã. Y I1I1 I2I2 I ini 5011 3001 1101 18100 7010 2000 07h-09h exemplo5b.txt 5. ANOVA 2 fact.

13 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia ANOVA a dois factores Sp1 Sp2 Sp3 Início Fim Início Fim Sp1 Sp2 Sp3 Efeito do nível “Início” Interacção entre “Início” e Sp2 Interacção entre “Início” e Sp1 5. ANOVA 2 fact.

14 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia Início Fim Sp1 Sp2 Sp3 ANOVA a dois factores 5. ANOVA 2 fact.

15 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia Início Fim Sp1 Sp2 Sp3 H 0 : Para todas as combinações dos factores estudado, a variável resposta Y tem a mesma distribuição,i.e. ANOVA a dois factores Método: Aplicação da estatística de teste  para comparar o M. Nulo com o M. Completo > summary(glm(e5b$Y~e5b$ I 1*e5b$ I ini+ e5b$ I 2*e5b$ I ini,family=Gamma(link=identity))) Estimate Std. Error t value Pr(>|t|) (Intercept) 8.0062 0.9407 8.510 1.15e-14 *** e5b$ I 1 7.2080 2.2390 3.219 0.001554 ** e5b$ I ini 6.6536 1.7115 3.888 0.000148 *** e5b$ I 2 0.1993 1.7157 0.116 0.907654 e5b$ I 1:e5b$ I ini 16.2153 5.0314 3.223 0.001537 ** e5b$ I ini:e5b$ I 2 3.6693 3.5667 1.029 0.305123 Null deviance: 131.89 on 166 degrees of freedom Residual deviance: 82.00 on 161 degrees of freedom > summary(glm(e5b$Y~1,family=Gamma (link=identity))) Estimate Std. Error t value Pr(>|t|) (Intercept) 18.172 1.327 13.69 <2e-16 *** > 1-pchisq(131.89-82,5) [1] 1.459511e-09 Rejeita-se H 0  Modelo Nulo 5. ANOVA 2 fact.

16 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia Início Fim Sp1 Sp2 Sp3 H 0 : O factor “Espécie” não afecta a distribuição de Y (tempo de recolecção de pólen), i.e. ANOVA a dois factores > 1-pchisq(107.60-82,165-161) [1] 3.809866e-05 Rejeita-se H 0 Desvio do M. Completo g.l. do M. Completo > summary(glm(e5b$Y~e5b$ I ini, family=Gamma(link=identity))) Estimate Std. Error t value Pr(>|t|) (Intercept) 10.554 1.015 10.397 < 2e-16 *** e5b$ I ini 12.982 2.154 6.028 1.05e-08 *** Residual deviance: 107.60 on 165 degrees of freedom 5. ANOVA 2 fact.

17 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia Início Fim Sp1 Sp2 Sp3 H 0 : O factor “Altura do dia” não afecta a distribuição de Y (tempo de recolecção de pólen), i.e. ANOVA a dois factores > summary(glm(e5b$Y~e5b$ I 1+e5b$ I 2, family=Gamma(link=identity))) Estimate Std. Error t value Pr(>|t|) (Intercept) 11.946 1.070 11.167 < 2e-16 *** e5b$ I 1 16.674 3.123 5.340 3.06e-07 *** e5b$ I 2 2.203 2.200 1.001 0.318 Residual deviance: 104.30 on 164 degrees of freedom > 1-pchisq(104.30-82,164-161) [1] 5.649585e-05 Rejeita-se H 0 5. ANOVA 2 fact.

18 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia Início Fim Sp1 Sp2 Sp3 H 0 : Os dois factores não interagem de forma significativa, i.e. ANOVA a dois factores > 1-pchisq(87.131-82,163-161) [1] 0.07688073 Não se rejeita H 0 > summary(glm(e5b$Y~e5b$ I 1+e5b$ I 2+ e5b$ I ini,family=Gamma(link=identity))) Estimate Std. Error t value Pr(>|t|) (Intercept) 7.3973 0.8553 8.648 4.72e-15 *** e5b$ I 1 13.1891 2.3367 5.644 7.19e-08 *** e5b$ I 2 1.0142 1.5380 0.659 0.511 e5b$ I ini 9.4337 1.5278 6.175 5.09e-09 *** Residual deviance: 87.131 on 163 degrees of freedom A ANOVA foi concluída 5. ANOVA 2 fact.

19 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia Análise da qualidade de ajustamento (goodness of fit) Análise global (Desvio) : > 1-pchisq(87.131,163) [1] 0.9999998 Análise dos resíduos (quantile residuals) : > k<-(glm(e5b$Y~e5b$ I 1*e5b$ I ini+ e5b$ I 2*e5b$ I ini,family= Gamma(link=identity))) > qqnorm(qres.gamma(k, dispersion=0.45)) > abline(0,1) O modelo final parece estar bem ajustado 6. GOF

20 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia 1) As três espécies de abelhas estudadas possuem tempos de recolecção de pólen significativamente distintos. 2) Nas três espécies, o tempo de recolecção de pólen varia de forma significativa do início para o fim da manhã. 3) A alteração no tempo de recolecção discutido em 2) é sensivelmente idêntica para as três espécies Interpretação do modelo Para além destas conclusões, típicas de uma análise de variância, pode-se ainda usufruir dos resultados do modelo final. 7. Interpretação Conclusões

21 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia Interpretação do modelo Estimate (Intercept) 7.3973 e5b$ I 1 13.1891 e5b$ I 2 1.0142 e5b$ I ini 9.4337 Dispersion parameter taken to be 0.4494806  = 1/  =2.22 Distribuição do tempo de recolecção [s] para Pseudaugochloropsis graminea (Sp1), no início da manhã http://ic.net/~jnbohr/java/CdfDemoArgs.html Atenção: …no final da manhã 0 60 0.91 0.98 Pr[Y≤60]=? 7. Interpretação

22 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia Análise de variância e covariância (ANCOVA) Suponha-se que não foi feita uma categorização do factor “Altura do dia”. Originalmente, esta variável é contínua, podendo ser discretizada p.ex. como o tempo [minutos] decorrido desde as 07:00. Neste caso, como testar se o tempo de recolecção de pólen pelas 3 espécies de abelhas difere entre si e ao longo da manhã? 1 Preditor Categórico (Espécie) e 1 Preditor Discreto (minutos desde 07:00) ANCOVA minuto desde 07:00 Sp1 Sp2 Sp3 0 240 8. ANCOVA

23 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia Análise de variância e covariância (ANCOVA) Sp1 Sp2 Sp3 0 240 minuto desde 07:00 Y I1I1 I2I2T 50112 300132 110198 181076 70134 20019 exemplo5c.txt > k<-glm(e5c$Y~e5c$ I 1*e5c$T +e5c$ I 2*e5c$T, family=Gamma (link=identity)) > c(k$deviance,k$df.residual) [1] 70.35788 161.00000 Desvio do M. Completo g.l. do M. Completo 8. ANCOVA

24 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia Análise de variância e covariância (ANCOVA) H 0 : A distribuição da variável resposta Y não depende do preditor discreto T, i.e. Método: Aplicação da estatística de teste  para comparar o M. Nulo com o M. Completo Rejeita-se H 0 (para  = 0.05) Sp1 Sp2 Sp3 0 240 T > j<-glm(e5c$Y~e5c$ I 1+e5c$ I 2, family=Gamma(link=identity)) > c(j$deviance,j$df.residual) [1] 80.4074 164.0000 > 1-pchisq(j$deviance-k$deviance, j$df.residual-k$df.residual) [1] 0.01814984 8. ANCOVA

25 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia Análise de variância e covariância (ANCOVA) H 0 : O efeito do tempo decorrido desde as 07:00 sobre a duração da recolha de polén é idêntico para as três espécies, i.e. Não se rejeita H 0 Sp1 Sp2 Sp3 0 240 T > j<-(glm(e5c$Y~e5c$ I 1+e5c$ I 2 +e5c$T,family=Gamma(link=identity))) > summary(j) Estimate Std. Error t value Pr(>|t|) (Intercept) 22.65989 2.41458 9.385 < 2e-16 *** e5c$ I 1 21.55560 3.24785 6.637 4.52e-10 *** e5c$ I 2 2.19150 2.17282 1.009 0.315 e5c$T -0.06103 0.01350 -4.520 1.18e-05 *** (Dispersion parameter for Gamma family taken to be 0.4227247) Residual deviance: 72.721 on 163 d.f. > 1-pchisq(j$deviance-k$deviance, j$df.residual-k$df.residual) [1] 0.3067945 8. ANCOVA

26 mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia Bibliografia •Fromentin, J.-M., 2003. The East Atlantic and Mediterranean bluefin tuna stock management: uncertainties and alternatives. Scientia Marina 67 (Suppl. 1): 51-62. •Shelly, T.E., et al., 2000. Buzzing bees (Hymenoptera : Apidae, Halictidae) on Solanum (Solanaceae): floral choice and handling time track pollen availability. Florida Entomologist 83(2): 180-187. •Terpes, G., et al., 2001. Assessment of the Mediterranean swordfish stock based on Greek and Italian fisheries data. ICCAT Col. Vol. Sci. Pap. 55(1): 94-106. PDF 9. Bibliografia


Carregar ppt "Mini-curso mlge 1. Programa 2. Objectivo 5. ANOVA com MLG 3. Introdução 4. ANOVA 1 factor 5. ANOVA 2 fact. 6. GOF 7. Interpretação 8. ANCOVA 9. Bibliografia."

Apresentações semelhantes


Anúncios Google