A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

MLG aplicados a variáveis resposta com distribuição contínua

Apresentações semelhantes


Apresentação em tema: "MLG aplicados a variáveis resposta com distribuição contínua"— Transcrição da apresentação:

1 MLG aplicados a variáveis resposta com distribuição contínua
Programa: 1. Programa Introdução aos MLG Regressão Logística MLG aplicados a variáveis resposta com distribuição contínua MLG aplicados a dados de contagens Análise de variância (ANOVA) com MLG I

2 Objectivo da Análise de Variância
Avaliar como uma ou mais variáveis categóricas influenciam uma variável aleatória (resposta). 2. Objectivo Modelos disponíveis MLG Normal MLG Gama MLG Gaussiana Inversa MLG Poisson MLG Binomial MLG Binomial Negativa I

3 Introdução à Análise de Variância
Uma variável categórica também se designa por Factor. Os valores que toma são designados Níveis. 3. Introdução Exemplos: Factor Níveis Cor Azul, Verde, Vermelho Sexo Masculino, Feminino Idade Juvenil, Adulto I

4 ANOVA a um factor ANOVA a um factor Questão: 4. ANOVA 1 factor
Y tem distribuição Normal Y tem distribuição Binomial Negativa Questão: As populações têm a mesma distribuição? I

5 ANOVA a um factor Hipóteses: Pressupostos:
H0: Para todos os p níveis do factor estudado, a variável resposta Y tem a mesma distribuição H1: Para pelo menos um dos p níveis a distribuição de Y é distinta dos restantes (i.e., as médias das p populações não são idênticas). 4. ANOVA 1 factor Pressupostos: Foi recolhida uma amostra aleatória (plantas, animais, etc.) de cada uma das p populações. Para cada unidade experimental registou-se o valor da variável resposta Y. Y tem distribuição pertencente à família exponencial. O parâmetro de dispersão f é constante. I

6 ANOVA a um factor Trabalho utilizado como exemplo:
BUZZING BEES (HYMENOPTERA: APIDAE, HALICTIDAE) ON SOLANUM (SOLANACEAE): FLORAL CHOICE AND HANDLING TIME TRACK POLLEN AVAILABILITY 4. ANOVA 1 factor Shelley, T.E., Villalobos, E., and students of the Fall 1997 OTS-USAP Florida Entomologist 83(2) June, 2000 Entre outros objectivos, pretendeu-se saber se o tempo [s] de recolecção de pólen em flores ‘novas’ de Solanum wendlandi difere entre 3 espécies de abelhas: Sp1: Pseudaugochloropsis graminea Sp2: Euglossa erythrochlora Sp3: Bombus pullatus X – espécie para a qual se registou o tempo de recolecção de pólen m – tempo médio de recolecção de pólen I

7 ANOVA a um factor Formulação mais simples do modelo
Configuração dos dados Y I1 I2 I3 5 1 3 18 7 2 onde A análise que se pretende constitui um modelo linear (generalizado ou não, consoante a distribuição de Y 4. ANOVA 1 factor A variável resposta (tempo de recolecção) é uma variável contínua positiva. O MLG Gama poderá ser adequado I

8 ANOVA a um factor > summary(glm(e5a$Y~ -1+e5a$I1+ e5a$I2+e5a$I3, family=Gamma (link=identity))) Estimate Std. Error t value Pr(>|t|) e5a$I e-13 *** e5a$I e-09 *** e5a$I e-16 *** (Dispersion parameter for Gamma family taken to be ) Null deviance: NaN on 98 degrees of freedom Residual deviance: on 95 degrees of freedom 4. ANOVA 1 factor Valor médio de Y >1-pchisq(53.1,95) Com esta formulação, é difícil testar a significância das diferenças entre níveis. m1 m2 m3 I

9 ANOVA a um factor O método de “Reference Cell Coding”
Espécie Sp1 Sp2 Sp3 I1 I2 1 RFC A espécie 3 pode ser descrita como “não sendo nem a espécie 1 nem a espécie 2”, se essas forem as 3 únicas alternativas 4. ANOVA 1 factor A espécie 3 constitui o nível de referência Configuração dos dados (exemplo5a.txt) Y I1 I2 5 1 3 18 7 2 Eliminação da terceira coluna Formulação do modelo I

10 ANOVA a um factor Relação entre os m’s e os b’s m1 b1 m2 b2 m3 b0
Valor médio de Y 4. ANOVA 1 factor m1 b1 m2 b2 m3 b0 Estimate Std. Error t value Pr(>|t|) e5a$I e-13 e5a$I e-09 e5a$I e-16 Estimate Std. Error t value Pr(>|t|) (Intercept) e-16 e5a$I e-06 e5a$I I

11 ANOVA a um factor Teste à significância do factor
H0: Para todos os p níveis do factor estudado, a variável resposta Y tem a mesma distribuição H1: Para pelo menos um dos p níveis a distribuição de Y é distinta dos restantes. 4. ANOVA 1 factor Modelo Nulo Null deviance: on 97 degrees of freedom Residual deviance: on 95 degrees of freedom > 1-pchisq( ,97-95) [1] e-05 H0 é rejeitada I

12 ANOVA a dois factores Objectivo:
Saber se o tempo de recolecção de pólen pelas 3 espécies de abelhas difere entre si e ao longo da manhã. 5. ANOVA 2 fact. Y I1 I2 Iini 5 1 3 18 7 2 07h-09h exemplo5b.txt I

13 ANOVA a dois factores Início Início Fim Fim Sp3 Sp3 Sp2 Sp2 Sp1 Sp1
Interacção entre “Início” e Sp2 Efeito do nível “Início” Interacção entre “Início” e Sp1 5. ANOVA 2 fact. Início Início Fim Fim Sp3 Sp3 Sp2 Sp2 Sp1 Sp1 I

14 ANOVA a dois factores 5. ANOVA 2 fact. Início Fim Sp3 Sp2 Sp1 I

15 ANOVA a dois factores H0: Para todas as combinações dos factores estudado, a variável resposta Y tem a mesma distribuição,i.e.  Modelo Nulo Método: Aplicação da estatística de teste L para comparar o M. Nulo com o M. Completo > summary(glm(e5b$Y~e5b$I1*e5b$Iini+ e5b$I2*e5b$Iini,family=Gamma(link=identity))) Estimate Std. Error t value Pr(>|t|) (Intercept) e-14 *** e5b$I ** e5b$Iini *** e5b$I e5b$I1:e5b$Iini ** e5b$Iini:e5b$I Null deviance: on 166 degrees of freedom Residual deviance: on 161 degrees of freedom 5. ANOVA 2 fact. Início Fim Sp3 Sp2 Sp1 > summary(glm(e5b$Y~1,family=Gamma (link=identity))) Estimate Std. Error t value Pr(>|t|) (Intercept) <2e-16 *** > 1-pchisq( ,5) [1] e-09 Rejeita-se H0 I

16 ANOVA a dois factores H0: O factor “Espécie” não afecta a distribuição de Y (tempo de recolecção de pólen), i.e. > summary(glm(e5b$Y~e5b$Iini, family=Gamma(link=identity))) Estimate Std. Error t value Pr(>|t|) (Intercept) < 2e-16 *** e5b$Iini e-08 *** Residual deviance: on 165 degrees of freedom 5. ANOVA 2 fact. Início Fim Sp3 > 1-pchisq( , ) [1] e-05 Sp2 Sp1 Rejeita-se H0 Desvio do M. Completo g.l. do M. Completo I

17 ANOVA a dois factores H0: O factor “Altura do dia” não afecta a distribuição de Y (tempo de recolecção de pólen), i.e. > summary(glm(e5b$Y~e5b$I1+e5b$I2, family=Gamma(link=identity))) Estimate Std. Error t value Pr(>|t|) (Intercept) < 2e-16 *** e5b$I e-07 *** e5b$I Residual deviance: on 164 degrees of freedom 5. ANOVA 2 fact. Início Fim Sp3 Sp2 Sp1 > 1-pchisq( , ) [1] e-05 Rejeita-se H0 I

18 ANOVA a dois factores H0: Os dois factores não interagem de forma significativa, i.e. > summary(glm(e5b$Y~e5b$I1+e5b$I2+ e5b$Iini,family=Gamma(link=identity))) Estimate Std. Error t value Pr(>|t|) (Intercept) e-15 *** e5b$I e-08 *** e5b$I e5b$Iini e-09 *** Residual deviance: on 163 degrees of freedom 5. ANOVA 2 fact. Início Fim Sp3 Sp2 Sp1 > 1-pchisq( , ) [1] Não se rejeita H0 A ANOVA foi concluída I

19 Análise da qualidade de ajustamento (goodness of fit)
Análise global (Desvio): > 1-pchisq(87.131,163) [1] Análise dos resíduos (quantile residuals): 6. GOF > k<-(glm(e5b$Y~e5b$I1*e5b$Iini+ e5b$I2*e5b$Iini,family= Gamma(link=identity))) > qqnorm(qres.gamma(k, dispersion=0.45)) > abline(0,1) O modelo final parece estar bem ajustado I

20 Interpretação do modelo
Conclusões 1) As três espécies de abelhas estudadas possuem tempos de recolecção de pólen significativamente distintos. 2) Nas três espécies, o tempo de recolecção de pólen varia de forma significativa do início para o fim da manhã. 3) A alteração no tempo de recolecção discutido em 2) é sensivelmente idêntica para as três espécies 7. Interpretação Para além destas conclusões, típicas de uma análise de variância, pode-se ainda usufruir dos resultados do modelo final. I

21 Interpretação do modelo
Distribuição do tempo de recolecção [s] para Pseudaugochloropsis graminea (Sp1), no início da manhã Estimate (Intercept) e5b$I e5b$I e5b$Iini Dispersion parameter taken to be Pr[Y≤60]=? 0.91 a = 1/f =2.22 7. Interpretação …no final da manhã 0.98 Atenção: I

22 Análise de variância e covariância (ANCOVA)
Suponha-se que não foi feita uma categorização do factor “Altura do dia”. Originalmente, esta variável é contínua, podendo ser discretizada p.ex. como o tempo [minutos] decorrido desde as 07:00. Neste caso, como testar se o tempo de recolecção de pólen pelas 3 espécies de abelhas difere entre si e ao longo da manhã? 1 Preditor Categórico (Espécie) e 1 Preditor Discreto (minutos desde 07:00) 8. ANCOVA ANCOVA Sp1 Sp2 minuto desde 07:00 Sp3 240 I

23 Análise de variância e covariância (ANCOVA)
> k<-glm(e5c$Y~e5c$I1*e5c$T +e5c$I2*e5c$T, family=Gamma (link=identity)) > c(k$deviance,k$df.residual) [1] Desvio do M. Completo 8. ANCOVA g.l. do M. Completo Y I1 I2 T 5 1 12 3 132 198 18 76 7 34 2 19 Sp1 Sp2 minuto desde 07:00 Sp3 exemplo5c.txt 240 I

24 Análise de variância e covariância (ANCOVA)
H0: A distribuição da variável resposta Y não depende do preditor discreto T, i.e. Método: Aplicação da estatística de teste L para comparar o M. Nulo com o M. Completo > j<-glm(e5c$Y~e5c$I1+e5c$I2, family=Gamma(link=identity)) > c(j$deviance,j$df.residual) [1] > 1-pchisq(j$deviance-k$deviance, j$df.residual-k$df.residual) [1] 8. ANCOVA Sp1 Sp2 Rejeita-se H0 (para a = 0.05) T Sp3 240 I

25 Análise de variância e covariância (ANCOVA)
H0: O efeito do tempo decorrido desde as 07:00 sobre a duração da recolha de polén é idêntico para as três espécies, i.e. > j<-(glm(e5c$Y~e5c$I1+e5c$I2 +e5c$T,family=Gamma(link=identity))) > summary(j) Estimate Std. Error t value Pr(>|t|) (Intercept) < 2e-16 *** e5c$I e-10 *** e5c$I e5c$T e-05 *** (Dispersion parameter for Gamma family taken to be ) Residual deviance: on 163 d.f. 8. ANCOVA Sp1 Sp2 T Sp3 240 > 1-pchisq(j$deviance-k$deviance, j$df.residual-k$df.residual) [1] Não se rejeita H0 I

26 Bibliografia Fromentin, J.-M., The East Atlantic and Mediterranean bluefin tuna stock management: uncertainties and alternatives. Scientia Marina 67 (Suppl. 1): Shelly, T.E., et al., Buzzing bees (Hymenoptera : Apidae, Halictidae) on Solanum (Solanaceae): floral choice and handling time track pollen availability. Florida Entomologist 83(2): Terpes, G., et al., Assessment of the Mediterranean swordfish stock based on Greek and Italian fisheries data. ICCAT Col. Vol. Sci. Pap. 55(1): PDF PDF PDF 9. Bibliografia I


Carregar ppt "MLG aplicados a variáveis resposta com distribuição contínua"

Apresentações semelhantes


Anúncios Google