A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro.

Apresentações semelhantes


Apresentação em tema: "Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro."— Transcrição da apresentação:

1 Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro Alberto Barbetta (INE - UFSC)

2 Porque ANOVA ?

3 Não Podemos Comparar 2 a 2 ?

4 Probabilidade de Ocorrer Erro do Tipo I =  A Probabilidade Prob de ocorrer k erros do tipo I em n comparações é dada por: Probabilidade de ocorrer erros do tipo I: prob(Erro Tipo I)=prob(1)+prob(2)+...+prob(n) No exemplo: prob(Erro Tipo I) =

5 Exemplo 1: Comparação de três tipos de rede. Considere o problema de comparar 3 tipos de rede de computadores, C1, C2 e C3, em termos do tempo médio de transmissão de pacotes de dados entre duas máquinas. Experimento (projeto completamente aleatorizado com um fator): 8 replicações com cada tipo de rede, aleatorizando a ordem dos 24 ensaios e mantendo fixos os demais fatores controláveis.

6 Exemplo 1: Projeto do experimento. SeqüêncianúmeroUso da dos testesdo ensaiorede 116C2 214C2 324C3 4 6C C3 ensaios de 1 a 8: C1 ensaios de 9 a 16: C2 ensaios de 17 a 24: C3

7 Exemplo 1. Dados do experimento: SeqüêncianúmeroTempo de dos testesdo ensaioRederesposta (y) 116C27,8 214C28,2 324C36,3 4 6C17, C27,8

8 Exemplo 1: Perguntas a serem respondidas pela análise estatística. Existe diferença real (significativa) entre os 3 tipos de rede? Qual é a estimativa do tempo de resposta para cada tipo de rede?

9 Dados do experimento Tipo de rede ReplicaçãoC1C2C3 17,27,86,3 29,38,26,0 38,77,15,3 48,98,65,1 57,68,76,2 67,28,25,2 78,87,17,2 88,07,86,8 Soma65,763,548,1 Média8,217,946,01

10 Notação: ( g = 3 tratamentos) tratamento (1)(2)(3) y 11 y 21 y 31 y 12 y 22 y y 1n y 2n y 3n Média: Média global: Estatísticas Dados Estatística: função dos elementos da amostra (são estimadores de certos parâmetros de interesse)

11 Parâmetros: valores reais, mas geralmente desconhecidos  tempo esperado (médio) de resposta;  i tempo esperado (médio) de resposta sob o tratamento i;  i =  i -  efeito devido ao tratamento i.

12 Parâmetros: valores reais, mas geralmente desconhecidos Se Y é a variável aleatória que representa a observação do tempo de resposta, tem-se que Y deve ter uma certa densidade de probabilidade f. O parâmetro  é o valor esperado desta distribuição:  = E{Y}. Analogamente:  2 = Var{Y} Y i = observação sob o tratamento i, então  i = E{Y i },  i 2 = Var{Y i } e  i = E{Y i - Y}

13 tratamento (1)(2)(3) y 11 y 21 y 31 y 12 y 22 y y 1n y 2n y 3n Média: Média global: Estatísticas Parâmetros  1  2  3  O efeito  i =  i -  pode ser estimado pela estatística: Estimativas de

14 tratamento (1)(2)(3) y 11 y 21 y 31 y 12 y 22 y y 1n y 2n y 3n Média: Média global: i = 1, 2, 3 j = 1, 2,..., n observação efeito do tratamento i média global erro aleatório = média do fator i

15 Hipóteses H 0 :  1 =  2 =...=  g = 0 ou µ 1 = µ 2 =...= µ g H 1 :  i  0 ou µ i  µ j para algum i para algum par (i,j) As observações Sob H 1 : Sob H 0 :

16 Sob H 0 :  1 =  2 =...=  g = 0

17 Sob H 1 :  i  0 para algum i

18 Suposições da ANOVA As observações são independentes e provêm de distribuições normais com a mesma variância. Observa-se que o teste é razoavelmente robusto a estas suposições.

19 Análise de variância (ANOVA) com um fator Tratamento Replicação12...g 1y 11 y 21...yg1yg1 2y 12 y 22...yg2yg2 ny1ny1n y2ny2n y gn Somay 1. y 2....yg.yg. Média... gl = N - 1 onde: N = ng Soma de quadrados total:Graus de liberdade:

20 Análise de variância (ANOVA) com um fator Tratamento Replicação12...g 1y 11 y 21...yg1yg1 2y 12 y 22...yg2yg2 ny1ny1n y2ny2n y gn Somay 1. y 2....yg.yg. Média... gl = g - 1 Soma de quadrados dos tratamentos: Graus de liberdade:

21 Análise de variância (ANOVA) com um fator Tratamento Replicação12...g 1y 11 y 21...yg1yg1 2y 12 y 22...yg2yg2 ny1ny1n y2ny2n y gn Somay 1. y 2....yg.yg. Média... gl = N - g Soma de quadrados do erro:Graus de liberdade:

22 Análise de variância (ANOVA) com um fator Fórmulas equivalente às anteriores Estatística do teste (possíveis valores da razão f):

23 Graficamente

24

25 Teste F Se H 0 :  1 =  2 =...=  g = 0 for verdadeira, a estatística F tem distribuição F com (g - 1) graus de liberdade no numerador e (N - g) graus de liberdade no denominador. f valor p

26 Regra de decisão p   p >  rejeita H 0 (prova-se estatisticamente H 1 ) aceita H 0 (os dados não mostram evidência para afirmar H 1 )  = nível de significância (probab. tolerável de se rejeitar H o quando esta for verdadeira) Usual:  = 0,05 = 5%

27 Exemplo 1: Comparação de três tipos de rede. Considere o problema de comparar 3 tipos de rede de computadores, C1, C2 e C3, em termos do tempo médio de transmissão de pacotes de dados entre duas máquinas. Experimento (projeto completamente aleatorizado com um fator): 8 replicações com cada tipo de rede, aleatorizando a ordem dos 24 ensaios e mantendo fixos os demais fatores controláveis.

28 Dados do experimento Tipo de rede ReplicaçãoC1C2C3 17,27,86,3 29,38,26,0 38,77,15,3 48,98,65,1 57,68,76,2 67,28,25,2 78,87,17,2 88,07,86,8 Soma65,763,548,1 Média8,217,946,01

29 Exemplo 1 Análise de variância (ANOVA) O teste F rejeita H 0, ou seja, existe alguma diferença significativa entre os tratamentos Fonte da variaçãoSQglQMf Entre grupos 22,99211,5021,07 Dentro dos grupos 11,46210,55 Total 34,4523 f = 21,07  valor p < 0,01

30 Verificação das suposições: análise dos resíduos (i = 1, 2,..., g; j = 1, 2,..., n) Resíduos: Tempo de respostaResíduos ReplicaçãoC1C2C3C1C2C3 17,27,86,3-1,01-0,140,29 29,38,261,090,26-0,01 38,77,15,30,49-0,84-0,71 48,98,65,10,690,66-0,91 57,68,76,2-0,610,760,19 67,28,25,2-1,010,26-0,81 78,87,17,20,59-0,841,19 887,86,8-0,21-0,140,79 Média8,217,946,010,00

31 Verificação das suposições: análise dos resíduos

32

33 Verificação das suposições: Normalidade Kolmogorov-Smirnov Jarque-Beta D’Agostino-Pearson Shapiro-Wilk Lilliefors Anderson-Darling Cramer-von Mises

34 Verificação das suposições: Normalidade Kolmogorov-Smirnov Estatística do Teste g máx : maior valor calculado de g; n : tamanho da amostra ou número de parcelas. F(z i ): função de distribuição normal acumulada; i: número da amostra;

35 Normalidade Kolmogorov-Smirnov Tabela 2.2. Valores Críticos da Distribuição Dn

36 Verificação das suposições: Kolmogorov-Smirnov Para n>40

37 Verificação das suposições: Normalidade Shapiro-Wilk Estatística do Teste 1 – Ordenar em ordem crescente as n observações da amostra 2 – Calcular: 3 – Calcular: Se N é ímpar, despreza-se a observação mediana

38 Normalidade Shapiro-Wilk Tabela 2.3.Coeficientes  N-i+1 para o teste de normalidade W de Shapiro-Wick.

39 Normalidade Shapiro-Wilk Tabela 2.3.Coeficientes  N-i+1 para o teste de normalidade W de Shapiro-Wick.

40 Normalidade Shapiro-Wilk Tabela 2.3.Coeficientes  N-i+1 para o teste de normalidade W de Shapiro-Wick.

41 Normalidade Shapiro-Wilk

42 4 – Calcular a estatística de teste:.

43 Valores Críticos da Distribuição W da Estatística Shapiro-Wi

44 Normalidade D’Agostino-Pearson

45

46

47 Teste de Homocedasticidade Teste de Hartley Estatística do Teste: onde S max e S min são, respectivamente, os valores máximo e mínimo de desvio padrão estimados para as n amostras. Rejeitar H 0 se F max > F( ,a,N-1)

48 Teste de Homocedasticidade Teste de Cochran Estatística do Teste: Rejeitar H0 se C > C( ,a,N-1), com:

49 Teste de Homocedasticidade Teste de Bartlett Estatística do Teste: onde  é o índice de significância do teste, a é o número de amostras sendo testadas e ni é o número de observações da i-ésima amostra. Rejeitar H0 se

50 Teste de Homocedasticidade Teste de Levene Estatística do Teste: onde  é o índice de significância do teste, k é o número de amostras sendo testadas e ni é o número de observações da i-ésima amostra. Rejeitar H0 se

51 Estimação das médias Tempo de resposta C1C2C3 Média8,217,946,01 Médias amostrais sob cada tratamento:

52 Estimação das médias Fonte da variaçãoSQglQMf Entre grupos 22,99211,5021,07 Dentro dos grupos 11,46210,55 Total 34,4523 ANOVA:

53 Estimação das médias Estimativas, através de intervalos de 95% de confiança, para o tempo esperado de transmissão, em três tipos de rede.

54 O teste consiste em calcular um valor ( D crít ), acima do qual, a diferença entre duas médias amostrais (em absoluto) é significativamente diferente de zero. Teste de Tukey (teste para comparação múltipla) Utilizado quando se deseja comparar todos os pares de médias de r populações, adotando-se um único nível de confiança. H 0 : H 1 : onde representa o valor tabelado (vindo de uma distribuição da amplitude studentizada – “studentized range”) associado ao nível de significância adotado.

55 Distribuição da Amplitude Studentizada g r

56 onde, F(1−α ) é o quantil de probabilidade (1-α) da distribuição : Teste de Scheffé (teste para comparação múltipla) Neste teste a hipótese nula H0: μi = μj é rejeitada se:

57 Teste de contraste (teste para comparação múltipla) Um contraste C é uma combinação linear dos totais yi, que permite a comparação das médias dos tratamentos.


Carregar ppt "Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro."

Apresentações semelhantes


Anúncios Google