ANÁLISE DE VARIÂNCIA MULTIVARIADA - MANOVA

Slides:



Advertisements
Apresentações semelhantes
DISTRIBUIÇÕES AMOSTRAIS
Advertisements

ANOVA 1 fator Prof. Ivan Balducci FOSJC / Unesp.
Departamento de Informática em Saúde Universidade Federal de São Paulo – UNIFESP UNIFESP Teste de Mann-Whitney Alex E. J. Falcão (
Aprendizado de Máquina
Analise de Regressão Parte 2.
Análise de Variância da Regressão
Análise de variância.
Intervalos de Confiança
TESTE PARA ESTRUTURA ESPECIAL DE CORRELAÇÃO
ANÁLISE DISCRIMINANTE LIG, 13 de novembro de 2008.
2.5 INFERÊNCIAS SOBRE A DIFERENÇA NAS MÉDIAS, COMPARAÇÕES EMPARELHADAS
ANÁLISE DISCRIMINANTE LIG, 18 de novembro de 2008.
ANÁLISE DISCRIMINANTE
ANÁLISE DISCRIMINANTE
CAPÍTULO 7 TESTE DE HIPÓTESE
Análise de regressão linear simples: abordagem matricial
DELINEAMENTO COMPLETAMENTE CASUALIZADO
Prof. Marllus Gustavo Ferreira Passos das Neves
Prof. Marllus Gustavo Ferreira Passos das Neves
Estatística 8 - Distribuições Amostrais
MANOVA Análise de variância multivariada
Capítulo 8 Inferências com Base em Duas Amostras
MB751 – Modelos de previsão
Análise de Medidas Repetidas: Áreas de Uso
FUNÇÃO MODULAR.
Distribuição F Considere duas populações com distribuição de Gauss com médias 1, 2 e variâncias 12 e 22 . Retire uma amostra aleatória de tamanho.
Testes de Hipóteses Forma mais clássica de inferência estatística
One-Way ANOVA Com mais de duas amostras independentes de indivíduos queremos saber se as médias dos grupos na população são iguais.
ANOVA Prof. Herondino.
ME623 Planejamento e Pesquisa
Análise de Variância (ANOVA)
EXPERIMENTO FATORIAL SHEILA REGINA ORO.
Estatística Básica Aula 2 Medidas de Dispersão
Análise da Regressão múltipla: Inferência Revisão da graduação
4. Experimentos em Blocos
ME623A Planejamento e Pesquisa
ME623 Planejamento e Pesquisa
ME623A Planejamento e Pesquisa
ME623A Planejamento e Pesquisa
ME623 Planejamento e Pesquisa
Análise Exploratória de Dados R – LIG/08 – maio de 2008.
ANÁLISE EXPLORATÓRIA DE DADOS
Estatística e Probabilidade
ANOVA: Análise de Variância APLICAÇÃO.
Intervalos de confiança simultâneos (Método de Bonferroni)
Etapa Estatística Planejamento Análise Estatística Efeito de sequência
Diogo Fernando Bornancin Costa Fábio de H.C.R. dos Santos
Regressão Pontos mais importantes: -objectivo -regressão linear
COMPARAÇÃO DE DUAS POPULAÇÕES
Estatística e Probabilidade
Teste de Hipóteses Pontos mais importantes: -objectivo
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Análise de Variância (ANOVA) Camilo Daleles Rennó
Regressão e Previsão Numérica.
análise dos estimadores
ME623A Planejamento e Pesquisa
ANOVA.
COMPARAÇÃO DE MÉDIAS TESTE DE TUKEY.
Prof. Marllus Gustavo Ferreira Passos das Neves
Análise de Variância (ANOVA)
Teste de Tukey Comparação Múltipla de Médias
AULA 6 Planejamento Experimental
Métodos Estatísticos Aplicados às Ciências Biológicas
PPGTI AULA 3 Prof. Dr. Márcio A. Fiori –
Métodos Estatísticos Aplicados às Ciências Biológicas - 9ª aula -
Métodos Estatísticos Aplicados às Ciências Biológicas 8ª aula - Prática.
AULA 2 Prof. Dr. Márcio A. Fiori -
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
1. C.Dougherty “Introduction to Econometrics” 2. Capítulo 16. Bussab&Morettin “Estatística Básica” 7ª Edição.
AULA 11 – REGRESSÃO Parte I
Como construir modelos empíricos. Nos modelos estudados, cada fator foi fixado em dois níveis Por esta razão temos que nos contentar com uma visão limitada.
Transcrição da apresentação:

ANÁLISE DE VARIÂNCIA MULTIVARIADA - MANOVA Outubro de 2008

OBJETIVOS DA AULA Usar o R para realizar análises de variância univariadas (aov) e multivariadas (manova). Realizar comparações simultâneas no caso de rejeição da hipótese nula de ausência de efeito de tratamento.

EXEMPLO 1 Para começar vamos trabalhar com a base de dados milk.txt. Descrição dos dados: as unidades de observação referem-se a caminhões de transporte de leite e os dados observados são custos (combustível, consertos, capital) associados ao veículo. O fator refere-se ao tipo de combustível que pode ser gasolina ou diesel.

Dados de transporte de leite Primeiro, é necessário verificar se as suposições básicas do modelo são plausíveis: normalidade e variância constante. milk=read.table(http://www.im.ufrj.br/~flavia/mad484/milk.txt,header=T) Para isso vamos usar as funções Shapiro.test (verifica a normalidade dos dados) e var.test (realiza um teste de comparação das variâncias nos dois tipos de combustível).

Dados de transporte de leite Verificadas as suposições básicas, estamos prontos para realizar a análise de variância univariada para verificar a hipótese de não haver diferença nas médias de custo de combustível. comb=aov(milk$x1~milk$comb)

TABELA ANOVA PARA CUSTO DE COMBUSTÍVEL summary(comb) g.l. SQ QM F p-valor tratamento 1 19,96 19,96 2,7874 0,1007 resíduos 55 393,80 7,16 Total 56 413,76 Portanto, não rejeitamos a hipótese nula de igualdade entre os custos médios de combustível.

Análise de variância do custo sobre consertos cons=aov(milk$x2~milk$comb) summary(cons) g.l. SQ QM F p-valor tratamento 1 134,34 134.34 7,1096 0.01005 * resíduos 55 1039,26 18.90 Portanto, ao nível de significância de 5%, rejeitamos a hipótese nula de igualdade entre as médias de custo de conserto para os dois tipos de caminhão.

Análise de variância do custo sobre capital cap=aov(milk$x3~milk$comb) summary(cap) gl SQ QM F p-valor Tratamento 1 1016,25 1016,25 39,307 5.885e-08 Residuals 55 1421,98 25,85 Portanto, para esse custo também rejeitamos a hipótese nula.

Análise de variância multivariada Agora vamos realizar a análise de variância multivariada. Observe que aqui também é necessário verificar as suposições básicas do modelo, a saber, normalidade, variância igual e independência entre as diferentes observações. Será necessário carregar o pacote stats do R.

ESTATÍSTICAS PARA TESTAR A HIPÓTESE DE AUSÊNCIA DE EFEITO DE TRATAMENTO Vimos em aula a estatística lambda de Wilks dada pela razão entre os determinantes da matriz de somas de quadrados e produtos cruzados devida aos resíduos sobre o determinante da matriz de somas de quadrados e produtos cruzados da variação total. Quanto menor for o valor dessa estatística, maior a evidência a favor da hipótese nula de ausência de efeito de tratamento.

Estatística de Hotelling-Lawley: Estatística de Pillai: ESTATÍSTICAS PARA TESTAR A HIPÓTESE DE AUSÊNCIA DE EFEITO DE TRATAMENTO Outras estatísticas usadas para esse teste são baseadas nos auto-valores da matriz Sejam Estatística de Hotelling-Lawley: Estatística de Pillai: Estatística de Roy: os respectivos auto-valores

ESTATÍSTICAS PARA TESTAR A HIPÓTESE DE AUSÊNCIA DE EFEITO DE TRATAMENTO O R calcula todas essas estatísticas. Voltando aos dados de transporte de leite, suponha que após análise inicial, as suposições básicas do modelo tenham sido consideradas adequadas (normalidade, variâncias iguais e independência das observações).

MANOVA Após carregar o pacote stats, defina o vetor-resposta Y de dimensão 3 por: Y=cbind(milk$x1,milk$x2,milk$x3) Defina o fator combustível por classe=milk$comb Faça então: geral=manova(Y~classe) geral2=summary.manova(geral)

Call: manova(Y ~ classe) Terms: classe Residuals resp 1 19.9576 393.7967 resp 2 134.3407 1039.2641 resp 3 1016.249 1421.979 Deg. of Freedom 1 55 Residual standard error: 2.675806 4.34692 5.084699 geral2$SS $classe [,1] [,2] [,3] [1,] 19.95757 -51.77947 -142.4144 [2,] -51.77947 134.34071 369.4910 [3,] -142.41438 369.49102 1016.2490 $Residuals [1,] 393.7967 186.8572 157.6213 [2,] 186.8572 1039.2641 311.6113 [3,] 157.6213 311.6113 1421.9791

geralW=summary.manova(geral,test="Wilks") geralP=summary.manova(geral,test="Pillai") geralR=summary.manova(geral,test="Roy") geralHL=summary.manova(geral,test="Hotelling-Lawley") Df Wilks approx F num Df den Df Pr(>F) classe 1 0.5122 16.8262 3 53 8.358e-08 *** Df Pillai approx F num Df den Df Pr(>F) classe 1 0.4878 16.8262 3 53 8.358e-08 *** Df Roy approx F num Df den Df Pr(>F) classe 1 0.9524 16.8262 3 53 8.358e-08 *** Df Hotelling-Lawley approx F num Df den Df Pr(>F) classe 1 0.9524 16.8262 3 53 8.358e-08 *** Residuals 55 Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Resultado Verifica-se então que os dados não trazem evidência a favor da hipótese nula, de modo que rejeita-se H0.

Comparações Múltiplas Quando a hipótese de ausência de efeito de tratamento é rejeitada, os efeitos que levaram à rejeição da hipótese são de interesse. Para comparações duas a duas, a abordagem de Bonferroni pode ser usada para construir intervalos simultâneos de confiança para as diferenças dos efeitos de tratamento tomados dois a dois. Esses intervalos serão mais estreitos que os intervalos simultâneos T2 obtidos para todos os contrastes.

MODELO

No exemplo de transporte de leite, a hipótese nula foi rejeitada. Obtenha os intervalos de confiança de Bonferroni. Observe que como k=2 e p=3, teremos ao todo 3 contrastes a serem analisados, referindo-se às diferenças nas médias de cada uma das três componentes.

Como exercício obtenha os três intervalos e tire Suas conclusões.

Como segunda atividade vamos analisar os dados crabs sobre medidas morfológicas de duas espécies de caranguejos. Será necessário carregar o pacote MASS para obter os dados.