A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

ANOVA: Análise de Variância Comparação entre tratamentos Prof. Hani Camille YehiaHani Camille Yehia Alunos: Augusto Filho Cléia do N. Cavalcante Programa.

Apresentações semelhantes


Apresentação em tema: "ANOVA: Análise de Variância Comparação entre tratamentos Prof. Hani Camille YehiaHani Camille Yehia Alunos: Augusto Filho Cléia do N. Cavalcante Programa."— Transcrição da apresentação:

1 ANOVA: Análise de Variância Comparação entre tratamentos Prof. Hani Camille YehiaHani Camille Yehia Alunos: Augusto Filho Cléia do N. Cavalcante Programa de Pós-Graduação em Engenharia Elétrica Disciplina: Introdução ao Processo Estocástico

2 Roteiro 1.Introduçao 2.Modelo de ANOVA 3.Verificaçao da suposiçoes do Modelo 4.Estimaçao dos parametros do Modelo 5.Métodos de Comparaçao Múltipla 6.Exemplo

3 Comparação entre tratamentos É uma técnica de teste de hipóteses usada para comparar as médias de três ou mais populações. ANOVA Sir Ronald A. Fisher ( ) A técnica de análise de variância foi desenvolvida principalmente pelo estatístico inglês Ronald A. Fisher, a partir de 1918.

4 PREVISÍVEL: é expressada por uma função matemática com parâmetros desconhecidos. ALEATÓRIO: assumimos uma estrutura de probabilidade; um modelo de probabilidade conhecido. OBSERVAÇÃO = PREVISÍVEL + ALEATÓRIO Uma das preocupações estatísticas ao analisar dados, é a de criar modelos que explicitem estruturas do fenômeno em observação. A identificação dessas estruturas permite conhecer melhor o fenômeno, bem como fazer afirmações sobre possíveis comportamento do mesmo.

5 A Análise de Variância Suponha que tenhamos k populações envolvidas, sendo extraída de cada uma delas amostras aleatória de tamanho n. A resposta para cada um dos tratamentos é uma variável aleatória. TratamentoObservaçõesSomaMédias 1y 11 y 12...y1ny1n y 1. 2y 21 y 22...y2ny2n y 2....… …... kyk1yk1 yk2yk2 y kn Y k. y..

6 Modelo ANOVA Y ij ; é valor da variável resposta na j-ésima observação do i-ésimo tratamento.  : é a a média geral de todos os tratamentos;  i : é o efeito do i-ésimo tratamento; e ij : é o erro aleatório. i = 1, 2, 3,...,k j = 1, 2,..., n  As amostra são aleatórias e independentes;  As populações têm distribuições normais;  As populações têm a mesma variância. Pressuposições Básicas:

7 Suposições adotadas para o comportamento das populações

8 Hipóteses Testar se as medias são iguais ou não: H 0 =  1 =  2 =... =  k = 0 H 1 =  i  0, para pelo menos um i As observações Sob H 1 :Sob H 0 :

9 Hipóteses e modelo subjacente Sob H 0 :  1 =  2 =...=  k = 0

10 Hipóteses e modelo subjacente Sob H 1 :  i  0 para algum i

11 Para testar as hipóteses anteriores, baseia-se em uma análise da variabilidade total dos dados das k amostras, dado pela soma de quadrados total. Decomposição da soma de quadrados total SQ TOTAL = SQ TRAT + SQ ERRO

12 gl = N - 1 onde: N = nk Soma de quadrados total: Graus de liberdade: Decomposição da soma de quadrados total Soma de quadrados dos tratamentos: Graus de liberdade: gl = k - 1 Graus de liberdade: gl = k(n-1) Soma de quadrados do erro: SQ ERRO = SQ Total - SQ TRAT

13 SQ TOTAL = SQ Trat + SQ ERRO Graus de liberdade: SQ T tem kn-1 graus de liberdade; SQ Tratamentos tem K-1 g.l. SQ erro tem k(n-1) g.l. Quadrados médios: Estatística de Teste:

14 Tabela de Análise de Variância – (ANOVA) Fonte de Variação Soma de Quadrados gl Quadrados Médios F Tratamentosk-1 ErroK(n-1) Total Kn -1 SQ ERRO = SQ Total - SQ TRAT

15  Rejeito Ho se: F > F  (k – 1; k(n - 1)  Não rejeita Ho se: F  F  (k – 1; k(n - 1) Valor-p Regra de decisão: Abordagem Clássica

16 Regra de decisão: Abordagem Valor-p  Valor-p    Valor-p >   rejeita H 0 (prova-se estatisticamente H 1 )  Não rejeita H 0 (os dados não mostram evidência para afirmar H 1 )  = nível de significância (probab. tolerável de se rejeitar H o quando esta for verdadeira) Usual:  = 5%

17 Estimação Pontual Média Geral: Média do Tratamento: Diferença entre a Média do Tratamento: Variância:

18 Estimação Intervalar

19 Métodos de Comparações Múltiplas Métodos de Duncan 1. Ordenar de forma crescente as k médias amostrais dos tratamentos. 2 Estimar o desvio padrão de cada média. 3. Obter da tabela de Duncan os valores de: onde: = nível de significância f = nº de graus de liberdade de SQerro p = nº de médias envolvidas na comparação Procedimento

20 Métodos de Duncan 4. Calcular as amplitudes mínimas: 5. Testar as diferenças observadas entre as médias, fazendo as seguintes comparações: 6. Regra de Decisão: Se a diferença observada entre elas for > que R p, concluir que as médias médias que constituem um par são significativamente diferentes.

21 Verificação da Adequação do Modelo  Um resíduo é definido como:  Resíduo: A diferença entre uma observação e a média do tratamento correspondente. As suposições associadas ao modelo, é feita através da analise dos resíduos: 1.Os erros tem média zero e a mesma variância  2 ; 2.Os erros são independentes, ou seja, um valor de um erro não depende de qualquer outro erro; 3.Os erros têm distribuição normal. Logo, os erros são iid N(0,  2 ).

22 Verificação da Adequação do Modelo •Suposição de Independência Gráfico de Resíduos vs Ordem •Suposição de Igualdade de Variância Gráfico de Resíduos vs Médias dos Tratamentos • Suposição de Normalidade Gráfico de Probabilidade Normal

23 Exemplo Um trabalho no periódico Journal of the Association of Asphalt Paving Technologists (Vol. 59, 1990) descreve um experimento com o ojbetivo de determinar o efeito de bolhas de ar sobre a percentagem da resistência residual do asfalto. Para finalidades do experimento, bolhas de ar são controladas em três níveis: baixo (2-4%), médio (4-6%) e alto (6-8%). Os dados são mostrados na seguinte tabela: Bolhas de ArResistência Residual (%) Baixa Média Alta Os diferentes níveis de bolhas de ar afetam significativamente a resistência média ?

24 Boxplot

25 1 – Passo: Formulação das Hipóteses 2 – Passo: Fixar o nível de significância do teste e encontrar o valor de F_tab com 2 g.l no numerador e 21 g.l no denominador. Logo o valor tabela foi encontrado como

26 Tabela F Ftab

27 3 – Passo: Definir a região crítica e a região de não rejeição:

28 4 – Passo: O cálculo da Estatística de Teste: Para encontrarmos o F calculado, será criada uma tabela de análise de variância.

29 A soma quadrática entre tratamentos é: A soma quadrática do erro é obtida pela subração como:

30 5 – Passo: Conclusão Podemos também encontrar um valor P para essa estatística de teste. Ao nível de 1% de significância existem evidências amostrais que nos levam a rejeição da hipótese nula, ou seja, os diferentes níveis de bolhas de ar afetam significativamente a resistência média retida. Já que p=0,001 e menor que 0,01, temos evidencias que nos levam a rejeição de Ho

31 Tabela da ANOVA O gráfico ao lado mostra a região crítica ao nível de 1% de significância, e a região de não rejeição ao nível de 99% de confiança. É possível vermos o p-valor calculado manualmente. O MINITAB, obtém o mesmo resultado.

32 Estimação Pontual Com o objetivo de obter mais informações sobre a diferença existente nos efeitos da bolha de ar sobre a percentagem da resistência residual do asfalto, calculou-se as seguintes estimativas para os parâmetros de interesse:

33 Diferenças entre as Resistências médias residuais por níveis: Intervalos de Confiança para a diferença entre médias Se o intervalo contiver o valor zero, podemos concluir com 100(1-alpha)% de confiança que não há diferença estatisticamente significativa entre as médias consideradas.

34 Baixo e Médio O intervalo contém o valor zero, o que nos leva a concluir com 99% de confiança que a média da resistência Residual Baixa não difere estatísticamente da resistência Residual Média. Baixo e Alta Como o intervalo não contém o zero, rejeita-se a hipótese nula, ou seja, podemos concluir com 99% de significância que a média da resistência residual baixa é maior que a média da resistência residual alta.

35 Média e Alta Como o intervalo contém o zero, o que nos permite concluir com 99% de confiança que a resistência residual média não difere estatisticamente da resistência residual alta.

36 Método de Comparações Múltiplas Método de Duncan 1 – Passo: Médias em Ordem Crescente 2 – Passo: Calcular o desvio padrão

37 3 – Passo: Ver valor tabelado de Duncan 4 – Passo: Calcular as amplitudes significativas mínimas (Rp)

38 5 – Passo: Testar as diferenças observadas entre as médias

39 6 – Passo: Conclusão A partir da utilização do Método de Duncan, foi possível concluir com 99% de confiança que a média de Resistëncia Residual para os níveis MÉDIA e ALTO são equivalentes e INFERIORES a dureza média da resistência residual para o nível BAIXO.

40 Suposições do Modelo

41 Referência: Analysis of Variance Tables Based on Experimental Structure C. J. Brien, Biometrics, Vol. 39, No. 1 (Mar., 1983), pp FISHER, R. A. The logic of inductive inference. J. R. Stat. Soc., v.98, p.34-54, MONTGOMERY, D.C Design and analysis of experiments. 2nd. John Wiley & Sons, New York, USA. SNEDECOR, C.W. and W.G. COCHRAN, Statistical Methods. 7ed. Iowa State University Press, Amer. Iowa. USA. FISHER, R.A. Statistical Methods for Research Workers. 11ª ed. Oliver & Boyd, Edinburgo Gamerman, D. & Migon, H. (1993). Inferência estatística: uma abordagem integrada, Textos de métodos matemáticos, UFRJ. James F. Reed III: Analysis of Variance (ANOVA) Models in Emergency Medicine. The Internet Journal of Emergency and Intensive Care Medicine Volume 7 Number 2.


Carregar ppt "ANOVA: Análise de Variância Comparação entre tratamentos Prof. Hani Camille YehiaHani Camille Yehia Alunos: Augusto Filho Cléia do N. Cavalcante Programa."

Apresentações semelhantes


Anúncios Google