Carregar apresentação
A apresentação está carregando. Por favor, espere
PublicouRicardo Soza Alterado mais de 9 anos atrás
1
Projetos de experimentos com um fator e vários níveis
Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro Alberto Barbetta (INE - UFSC)
2
Porque ANOVA ?
3
Não Podemos Comparar 2 a 2 ?
4
Probabilidade de Ocorrer Erro do Tipo I =
A Probabilidade Prob de ocorrer k erros do tipo I em n comparações é dada por: Probabilidade de ocorrer erros do tipo I: prob(Erro Tipo I)=prob(1)+prob(2)+...+prob(n) No exemplo: prob(Erro Tipo I) =
5
Exemplo 1: Comparação de três tipos de rede.
Considere o problema de comparar 3 tipos de rede de computadores, C1, C2 e C3, em termos do tempo médio de transmissão de pacotes de dados entre duas máquinas. Experimento (projeto completamente aleatorizado com um fator): 8 replicações com cada tipo de rede, aleatorizando a ordem dos 24 ensaios e mantendo fixos os demais fatores controláveis.
6
Exemplo 1: Projeto do experimento.
ensaios de 1 a 8: C1 ensaios de 9 a 16: C2 ensaios de 17 a 24: C3 Seqüência número Uso da dos testes do ensaio rede C2 C2 C3 C1 C3
7
Exemplo 1. Dados do experimento:
Seqüência número Tempo de dos testes do ensaio Rede resposta (y) 1 16 C2 7,8 2 14 C2 8,2 3 24 C3 6,3 4 6 C1 7,2 C2 7,8
8
Exemplo 1: Perguntas a serem respondidas pela análise estatística.
Existe diferença real (significativa) entre os 3 tipos de rede? Qual é a estimativa do tempo de resposta para cada tipo de rede?
9
Dados do experimento Tipo de rede Replicação C1 C2 C3 1 7,2 7,8 6,3 2
9,3 8,2 6,0 3 8,7 7,1 5,3 4 8,9 8,6 5,1 5 7,6 6,2 6 5,2 7 8,8 8 8,0 6,8 Soma 65,7 63,5 48,1 Média 8,21 7,94 6,01
10
Notação: (g = 3 tratamentos)
(1) (2) (3) y11 y21 y31 y12 y22 y32 y1n y2n y3n Notação: (g = 3 tratamentos) Dados Média global: Estatísticas Média: Estatística: função dos elementos da amostra (são estimadores de certos parâmetros de interesse)
11
Parâmetros: valores reais, mas geralmente desconhecidos
tempo esperado (médio) de resposta; i tempo esperado (médio) de resposta sob o tratamento i; i = i - efeito devido ao tratamento i.
12
Parâmetros: valores reais, mas geralmente desconhecidos
Se Y é a variável aleatória que representa a observação do tempo de resposta, tem-se que Y deve ter uma certa densidade de probabilidade f. O parâmetro é o valor esperado desta distribuição: = E{Y}. Analogamente: 2 = Var{Y} Yi = observação sob o tratamento i, então i = E{Yi} , i2 = Var{Yi} e i = E{Yi - Y}
13
tratamento (1) (2) (3) y11 y21 y31 y12 y22 y32 y1n y2n y3n Média global: Estatísticas Média: Estimativas de Parâmetros 1 2 3 O efeito i = i - pode ser estimado pela estatística:
14
y11 y21 y31 y12 y22 y32 ... ... ... y1n y2n y3n tratamento (1) (2) (3)
(1) (2) (3) y11 y21 y31 y12 y22 y32 y1n y2n y3n Média global: Média: i = 1, 2, 3 j = 1, 2, ..., n erro aleatório média global observação efeito do tratamento i = média do fator i
15
Hipóteses H0: 1 = 2 =...= g = 0 ou µ1 = µ2 =...= µg
H1: i ou µi µj para algum i para algum par (i,j) As observações Sob H1: Sob H0:
16
Sob H0: 1 = 2 =...= g = 0
17
Sob H1: i 0 para algum i
18
Suposições da ANOVA As observações são independentes e provêm de distribuições normais com a mesma variância. Observa-se que o teste é razoavelmente robusto a estas suposições.
19
Análise de variância (ANOVA) com um fator
Tratamento Replicação 1 2 ... g y11 y21 yg1 y12 y22 yg2 n y1n y2n ygn Soma y1. y2. yg. Média Soma de quadrados total: Graus de liberdade: gl = N - 1 onde: N = ng
20
Análise de variância (ANOVA) com um fator
Tratamento Replicação 1 2 ... g y11 y21 yg1 y12 y22 yg2 n y1n y2n ygn Soma y1. y2. yg. Média Soma de quadrados dos tratamentos: Graus de liberdade: gl = g - 1
21
Análise de variância (ANOVA) com um fator
Tratamento Replicação 1 2 ... g y11 y21 yg1 y12 y22 yg2 n y1n y2n ygn Soma y1. y2. yg. Média Soma de quadrados do erro: Graus de liberdade: gl = N - g
22
Análise de variância (ANOVA) com um fator
Fórmulas equivalente às anteriores Estatística do teste (possíveis valores da razão f):
23
Graficamente
24
Graficamente
25
Teste F Se H0: 1 = 2 =...= g = 0 for verdadeira, a estatística F tem distribuição F com (g - 1) graus de liberdade no numerador e (N - g) graus de liberdade no denominador. valor p f
26
Regra de decisão rejeita H0 (prova-se estatisticamente H1) p
= nível de significância (probab. tolerável de se rejeitar Ho quando esta for verdadeira) Usual: = 0,05 = 5% rejeita H0 (prova-se estatisticamente H1) aceita H0 (os dados não mostram evidência para afirmar H1) p p >
27
Exemplo 1: Comparação de três tipos de rede.
Considere o problema de comparar 3 tipos de rede de computadores, C1, C2 e C3, em termos do tempo médio de transmissão de pacotes de dados entre duas máquinas. Experimento (projeto completamente aleatorizado com um fator): 8 replicações com cada tipo de rede, aleatorizando a ordem dos 24 ensaios e mantendo fixos os demais fatores controláveis.
28
Dados do experimento Tipo de rede Replicação C1 C2 C3 1 7,2 7,8 6,3 2
9,3 8,2 6,0 3 8,7 7,1 5,3 4 8,9 8,6 5,1 5 7,6 6,2 6 5,2 7 8,8 8 8,0 6,8 Soma 65,7 63,5 48,1 Média 8,21 7,94 6,01
29
Exemplo 1 Análise de variância (ANOVA)
Fonte da variação SQ gl QM f Entre grupos 22,99 2 11,50 21,07 Dentro dos grupos 11,46 21 0,55 Total 34,45 23 f = 21,07 valor p < 0,01 O teste F rejeita H0, ou seja, existe alguma diferença significativa entre os tratamentos
30
Verificação das suposições: análise dos resíduos
(i = 1, 2, ..., g; j = 1, 2, ..., n) Tempo de resposta Resíduos Replicação C1 C2 C3 1 7,2 7,8 6,3 -1,01 -0,14 0,29 2 9,3 8,2 6 1,09 0,26 -0,01 3 8,7 7,1 5,3 0,49 -0,84 -0,71 4 8,9 8,6 5,1 0,69 0,66 -0,91 5 7,6 6,2 -0,61 0,76 0,19 5,2 -0,81 7 8,8 0,59 1,19 8 6,8 -0,21 0,79 Média 8,21 7,94 6,01 0,00
31
Verificação das suposições: análise dos resíduos
32
Verificação das suposições: análise dos resíduos
33
Verificação das suposições: Normalidade
Kolmogorov-Smirnov Jarque-Beta D’Agostino-Pearson Shapiro-Wilk Lilliefors Anderson-Darling Cramer-von Mises
34
Verificação das suposições: Normalidade Kolmogorov-Smirnov
Estatística do Teste gmáx : maior valor calculado de g; n : tamanho da amostra ou número de parcelas. F(zi): função de distribuição normal acumulada; i: número da amostra;
35
Normalidade Kolmogorov-Smirnov
Tabela 2.2. Valores Críticos da Distribuição Dn
36
Verificação das suposições: Kolmogorov-Smirnov
Para n>40
37
Verificação das suposições: Normalidade Shapiro-Wilk
Estatística do Teste 1 – Ordenar em ordem crescente as n observações da amostra 2 – Calcular: 3 – Calcular: Se N é ímpar, despreza-se a observação mediana
38
Normalidade Shapiro-Wilk
Tabela 2.3.Coeficientes N-i+1 para o teste de normalidade W de Shapiro-Wick.
39
Normalidade Shapiro-Wilk
Tabela 2.3.Coeficientes N-i+1 para o teste de normalidade W de Shapiro-Wick.
40
Normalidade Shapiro-Wilk
Tabela 2.3.Coeficientes N-i+1 para o teste de normalidade W de Shapiro-Wick.
41
Normalidade Shapiro-Wilk
42
Normalidade Shapiro-Wilk
4 – Calcular a estatística de teste:.
43
Valores Críticos da Distribuição W da Estatística Shapiro-Wi
44
Normalidade D’Agostino-Pearson
45
Normalidade D’Agostino-Pearson
46
Normalidade D’Agostino-Pearson
47
Teste de Homocedasticidade Teste de Hartley
Estatística do Teste: onde Smax e Smin são, respectivamente, os valores máximo e mínimo de desvio padrão estimados para as n amostras. Rejeitar H0 se Fmax > F(,a,N-1)
48
Teste de Homocedasticidade Teste de Cochran
Estatística do Teste: Rejeitar H0 se C > C(,a,N-1), com:
49
Teste de Homocedasticidade Teste de Bartlett
Estatística do Teste: Rejeitar H0 se onde é o índice de significância do teste, a é o número de amostras sendo testadas e ni é o número de observações da i-ésima amostra.
50
Teste de Homocedasticidade Teste de Levene
Estatística do Teste: Rejeitar H0 se onde é o índice de significância do teste, k é o número de amostras sendo testadas e ni é o número de observações da i-ésima amostra.
51
Estimação das médias Médias amostrais sob cada tratamento:
Tempo de resposta C1 C2 C3 Média 8,21 7,94 6,01
52
Estimação das médias ANOVA: Fonte da variação SQ gl QM f Entre grupos
22,99 2 11,50 21,07 Dentro dos grupos 11,46 21 0,55 Total 34,45 23
53
Estimação das médias Estimativas, através de intervalos de 95% de confiança, para o tempo esperado de transmissão, em três tipos de rede.
54
Teste de Tukey (teste para comparação múltipla)
Utilizado quando se deseja comparar todos os pares de médias de r populações, adotando-se um único nível de confiança. H0 : H1: O teste consiste em calcular um valor (Dcrít), acima do qual, a diferença entre duas médias amostrais (em absoluto) é significativamente diferente de zero. onde representa o valor tabelado (vindo de uma distribuição da amplitude studentizada – “studentized range”) associado ao nível de significância adotado.
55
Distribuição da Amplitude Studentizada
g r
56
Teste de Scheffé (teste para comparação múltipla)
Neste teste a hipótese nula H0: μi = μj é rejeitada se: onde, F(1−α ) é o quantil de probabilidade (1-α) da distribuição :
57
Teste de contraste (teste para comparação múltipla)
Um contraste C é uma combinação linear dos totais yi, que permite a comparação das médias dos tratamentos.
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.