Projetos de experimentos com um fator e vários níveis

Projetos de experimentos com um fator e vários níveis
Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro Alberto Barbetta (INE - UFSC)

Porque ANOVA ?

Não Podemos Comparar 2 a 2 ?

Probabilidade de Ocorrer Erro do Tipo I = 
A Probabilidade Prob de ocorrer k erros do tipo I em n comparações é dada por: Probabilidade de ocorrer erros do tipo I: prob(Erro Tipo I)=prob(1)+prob(2)+...+prob(n) No exemplo: prob(Erro Tipo I) =

Exemplo 1: Comparação de três tipos de rede.
Considere o problema de comparar 3 tipos de rede de computadores, C1, C2 e C3, em termos do tempo médio de transmissão de pacotes de dados entre duas máquinas. Experimento (projeto completamente aleatorizado com um fator): 8 replicações com cada tipo de rede, aleatorizando a ordem dos 24 ensaios e mantendo fixos os demais fatores controláveis.

Exemplo 1: Projeto do experimento.
ensaios de 1 a 8: C1 ensaios de 9 a 16: C2 ensaios de 17 a 24: C3 Seqüência número Uso da dos testes do ensaio rede C2 C2 C3 C1 C3

Exemplo 1. Dados do experimento:
Seqüência número Tempo de dos testes do ensaio Rede resposta (y) 1 16 C2 7,8 2 14 C2 8,2 3 24 C3 6,3 4 6 C1 7,2 C2 7,8

Exemplo 1: Perguntas a serem respondidas pela análise estatística.
Existe diferença real (significativa) entre os 3 tipos de rede? Qual é a estimativa do tempo de resposta para cada tipo de rede?

Dados do experimento Tipo de rede Replicação C1 C2 C3 1 7,2 7,8 6,3 2
9,3 8,2 6,0 3 8,7 7,1 5,3 4 8,9 8,6 5,1 5 7,6 6,2 6 5,2 7 8,8 8 8,0 6,8 Soma 65,7 63,5 48,1 Média 8,21 7,94 6,01

Notação: (g = 3 tratamentos)
(1) (2) (3) y11 y21 y31 y12 y22 y32 y1n y2n y3n Notação: (g = 3 tratamentos) Dados Média global: Estatísticas Média: Estatística: função dos elementos da amostra (são estimadores de certos parâmetros de interesse)

Parâmetros: valores reais, mas geralmente desconhecidos
 tempo esperado (médio) de resposta; i tempo esperado (médio) de resposta sob o tratamento i; i = i -  efeito devido ao tratamento i.

Parâmetros: valores reais, mas geralmente desconhecidos
Se Y é a variável aleatória que representa a observação do tempo de resposta, tem-se que Y deve ter uma certa densidade de probabilidade f. O parâmetro  é o valor esperado desta distribuição:  = E{Y}. Analogamente: 2 = Var{Y} Yi = observação sob o tratamento i, então i = E{Yi} , i2 = Var{Yi} e i = E{Yi - Y}

tratamento (1) (2) (3) y11 y21 y31 y12 y22 y32 y1n y2n y3n Média global: Estatísticas Média: Estimativas de Parâmetros 1 2 3  O efeito i = i -  pode ser estimado pela estatística:

y11 y21 y31 y12 y22 y32 ... ... ... y1n y2n y3n tratamento (1) (2) (3)
(1) (2) (3) y11 y21 y31 y12 y22 y32 y1n y2n y3n Média global: Média: i = 1, 2, 3 j = 1, 2, ..., n erro aleatório média global observação efeito do tratamento i = média do fator i

Hipóteses H0: 1 = 2 =...= g = 0 ou µ1 = µ2 =...= µg
H1: i  ou µi  µj para algum i para algum par (i,j) As observações Sob H1: Sob H0:

Sob H0: 1 = 2 =...= g = 0

Sob H1: i  0 para algum i

Suposições da ANOVA As observações são independentes e provêm de distribuições normais com a mesma variância. Observa-se que o teste é razoavelmente robusto a estas suposições.

Análise de variância (ANOVA) com um fator
Tratamento Replicação 1 2 ... g y11 y21 yg1 y12 y22 yg2 n y1n y2n ygn Soma y1. y2. yg. Média Soma de quadrados total: Graus de liberdade: gl = N - 1 onde: N = ng

Tratamento Replicação 1 2 ... g y11 y21 yg1 y12 y22 yg2 n y1n y2n ygn Soma y1. y2. yg. Média Soma de quadrados dos tratamentos: Graus de liberdade: gl = g - 1

Tratamento Replicação 1 2 ... g y11 y21 yg1 y12 y22 yg2 n y1n y2n ygn Soma y1. y2. yg. Média Soma de quadrados do erro: Graus de liberdade: gl = N - g

Fórmulas equivalente às anteriores Estatística do teste (possíveis valores da razão f):

Graficamente

Teste F Se H0: 1 = 2 =...= g = 0 for verdadeira, a estatística F tem distribuição F com (g - 1) graus de liberdade no numerador e (N - g) graus de liberdade no denominador. valor p f

Regra de decisão rejeita H0 (prova-se estatisticamente H1) p  
 = nível de significância (probab. tolerável de se rejeitar Ho quando esta for verdadeira) Usual:  = 0,05 = 5% rejeita H0 (prova-se estatisticamente H1) aceita H0 (os dados não mostram evidência para afirmar H1) p   p > 

Exemplo 1: Comparação de três tipos de rede.
Considere o problema de comparar 3 tipos de rede de computadores, C1, C2 e C3, em termos do tempo médio de transmissão de pacotes de dados entre duas máquinas. Experimento (projeto completamente aleatorizado com um fator): 8 replicações com cada tipo de rede, aleatorizando a ordem dos 24 ensaios e mantendo fixos os demais fatores controláveis.

Dados do experimento Tipo de rede Replicação C1 C2 C3 1 7,2 7,8 6,3 2
9,3 8,2 6,0 3 8,7 7,1 5,3 4 8,9 8,6 5,1 5 7,6 6,2 6 5,2 7 8,8 8 8,0 6,8 Soma 65,7 63,5 48,1 Média 8,21 7,94 6,01

Exemplo 1 Análise de variância (ANOVA)
Fonte da variação SQ gl QM f Entre grupos 22,99 2 11,50 21,07 Dentro dos grupos 11,46 21 0,55 Total 34,45 23 f = 21,07  valor p < 0,01 O teste F rejeita H0, ou seja, existe alguma diferença significativa entre os tratamentos

Verificação das suposições: análise dos resíduos
(i = 1, 2, ..., g; j = 1, 2, ..., n) Tempo de resposta Resíduos Replicação C1 C2 C3 1 7,2 7,8 6,3 -1,01 -0,14 0,29 2 9,3 8,2 6 1,09 0,26 -0,01 3 8,7 7,1 5,3 0,49 -0,84 -0,71 4 8,9 8,6 5,1 0,69 0,66 -0,91 5 7,6 6,2 -0,61 0,76 0,19 5,2 -0,81 7 8,8 0,59 1,19 8 6,8 -0,21 0,79 Média 8,21 7,94 6,01 0,00

Verificação das suposições: análise dos resíduos

Verificação das suposições: Normalidade
Kolmogorov-Smirnov Jarque-Beta D’Agostino-Pearson Shapiro-Wilk Lilliefors Anderson-Darling Cramer-von Mises

Verificação das suposições: Normalidade Kolmogorov-Smirnov
Estatística do Teste gmáx : maior valor calculado de g; n : tamanho da amostra ou número de parcelas. F(zi): função de distribuição normal acumulada; i: número da amostra;

Normalidade Kolmogorov-Smirnov
Tabela 2.2. Valores Críticos da Distribuição Dn

Verificação das suposições: Kolmogorov-Smirnov
Para n>40

Verificação das suposições: Normalidade Shapiro-Wilk
Estatística do Teste 1 – Ordenar em ordem crescente as n observações da amostra 2 – Calcular: 3 – Calcular: Se N é ímpar, despreza-se a observação mediana

Normalidade Shapiro-Wilk
Tabela 2.3.Coeficientes N-i+1 para o teste de normalidade W de Shapiro-Wick.

4 – Calcular a estatística de teste:.

Valores Críticos da Distribuição W da Estatística Shapiro-Wi

Normalidade D’Agostino-Pearson

Teste de Homocedasticidade Teste de Hartley
Estatística do Teste: onde Smax e Smin são, respectivamente, os valores máximo e mínimo de desvio padrão estimados para as n amostras. Rejeitar H0 se Fmax > F(,a,N-1)

Teste de Homocedasticidade Teste de Cochran
Estatística do Teste: Rejeitar H0 se C > C(,a,N-1), com:

Teste de Homocedasticidade Teste de Bartlett
Estatística do Teste: Rejeitar H0 se onde  é o índice de significância do teste, a é o número de amostras sendo testadas e ni é o número de observações da i-ésima amostra.

Teste de Homocedasticidade Teste de Levene
Estatística do Teste: Rejeitar H0 se onde  é o índice de significância do teste, k é o número de amostras sendo testadas e ni é o número de observações da i-ésima amostra.

Estimação das médias Médias amostrais sob cada tratamento:
Tempo de resposta C1 C2 C3 Média 8,21 7,94 6,01

Estimação das médias ANOVA: Fonte da variação SQ gl QM f Entre grupos
22,99 2 11,50 21,07 Dentro dos grupos 11,46 21 0,55 Total 34,45 23

Estimação das médias Estimativas, através de intervalos de 95% de confiança, para o tempo esperado de transmissão, em três tipos de rede.

Teste de Tukey (teste para comparação múltipla)
Utilizado quando se deseja comparar todos os pares de médias de r populações, adotando-se um único nível de confiança. H0 : H1: O teste consiste em calcular um valor (Dcrít), acima do qual, a diferença entre duas médias amostrais (em absoluto) é significativamente diferente de zero. onde representa o valor tabelado (vindo de uma distribuição da amplitude studentizada – “studentized range”) associado ao nível de significância adotado.

Distribuição da Amplitude Studentizada
g r

Teste de Scheffé (teste para comparação múltipla)
Neste teste a hipótese nula H0: μi = μj é rejeitada se: onde, F(1−α ) é o quantil de probabilidade (1-α) da distribuição :

Teste de contraste (teste para comparação múltipla)
Um contraste C é uma combinação linear dos totais yi, que permite a comparação das médias dos tratamentos.

Projetos de experimentos com um fator e vários níveis

Apresentações semelhantes

Apresentação em tema: "Projetos de experimentos com um fator e vários níveis"— Transcrição da apresentação:

Apresentações semelhantes

Sobre projeto

Feedback

Login

Autorizar-se através da rede social:

Projetos de experimentos com um fator e vários níveis

Apresentações semelhantes

Apresentação em tema: "Projetos de experimentos com um fator e vários níveis"— Transcrição da apresentação:

Apresentações semelhantes

Sobre projeto

Feedback