Projetos de experimentos com um fator e vários níveis

Slides:



Advertisements
Apresentações semelhantes
Análise Estatística Testes de Hipóteses.
Advertisements

DISTRIBUIÇÕES AMOSTRAIS
ANOVA 1 fator Prof. Ivan Balducci FOSJC / Unesp.
Estimação de parâmetros
Estatística amintas paiva afonso.
Analise de Regressão Parte 2.
Estatística amintas paiva afonso.
CAPÍTULO 7 TESTE DE HIPÓTESE
Intervalos de Confiança
ESTATÍSTICA INFERÊNCIA ESTATÍSTICA
2.5 INFERÊNCIAS SOBRE A DIFERENÇA NAS MÉDIAS, COMPARAÇÕES EMPARELHADAS
CAPÍTULO 7 TESTE DE HIPÓTESE
ESTIMAÇÃO.
Curso de ADMINISTRAÇÃO
EE240/2009 Design of Experiments.
Análise de regressão linear simples: abordagem matricial
Prof. Marllus Gustavo Ferreira Passos das Neves
Estatística 8 - Distribuições Amostrais
Capítulo 8 Inferências com Base em Duas Amostras
MB751 – Modelos de previsão
Estatística: Aplicação ao Sensoriamento Remoto ANO 2010
Distribuição F Considere duas populações com distribuição de Gauss com médias 1, 2 e variâncias 12 e 22 . Retire uma amostra aleatória de tamanho.
Erros no Teste de Hipóteses
Estatística Aplicada (Aula 4)
Estatística Aplicada (Aula 4)
Intervalo de Confiança para a média da população
ESTATÍSTICA.
Renda até 2 SM.
ANOVA Prof. Herondino.
ESTATÍSTICA.
PESQUISA SOBRE PRAZO MÉDIO DA ASSISTÊNCIA NA SAÚDE SUPLEMENTAR
Análise de Variância (ANOVA)
Técnicas Experimentais Aplicadas em Ciência do Solo
ME623A Planejamento e Pesquisa
5. Experimentos Fatoriais
ME623 Planejamento e Pesquisa
ME623A Planejamento e Pesquisa
ME623A Planejamento e Pesquisa
ME623 Planejamento e Pesquisa
Inferências Relativas à Média
Teste de Hipóteses de uma amostra Prof. Helcio Rocha
Exponential Random Graph Models
Estatística e Probabilidade
Apêndice.
ANOVA: Análise de Variância APLICAÇÃO.
Estatística Para um dado conjunto de dados, podemos calcular as seguintes grandezas: 1) Medidas de posição 2) Medidas de dispersão 3) Parâmetros de simetria.
Comparação de Sistemas Usando Dados de Amostras
Modelagem Estatística
O que é Estatística, afinal de contas?
ESTATÍSTICA.
Modelagem Estatística
Regressão Pontos mais importantes: -objectivo -regressão linear
Olhe fixamente para a Bruxa Nariguda
Inferência Estatística
VARIÂNCIA NÃO EXPLICADA (WITHIN) ou INTRÍNSECA (FLUTUAÇÕES)
Professor Antonio Carlos Coelho
Noções de Inferência Estatística
Aula 11 - Teste de hipóteses, teste de uma proporção
COMPARAÇÃO DE DUAS POPULAÇÕES
Estatística e Probabilidade
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Análise de Variância (ANOVA) Camilo Daleles Rennó
UFSC.PósMCI.FME.Inferências Envolvendo Variâncias. (8.1) 6 Inferências Envolvendo Variâncias.
Professor Antonio Carlos Coelho
Aula 12 - Teste de associação1 DATAAulaCONTEÚDO PROGRAMÁTICO 10/03Segunda1Níveis de mensuração, variáveis, organização de dados, apresentação tabular 12/03Quarta2Apresentação.
análise dos estimadores
Introdução a planejamento e otimização de experimentos
ME623A Planejamento e Pesquisa
GESTÃO E GARANTIA DA QUALIDADE
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
Como construir modelos empíricos. Nos modelos estudados, cada fator foi fixado em dois níveis Por esta razão temos que nos contentar com uma visão limitada.
Transcrição da apresentação:

Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro Alberto Barbetta (INE - UFSC) www.inf.ufsc.br/~barbetta barbetta@inf.ufsc.br

Porque ANOVA ?

Não Podemos Comparar 2 a 2 ?

Probabilidade de Ocorrer Erro do Tipo I =  A Probabilidade Prob de ocorrer k erros do tipo I em n comparações é dada por: Probabilidade de ocorrer erros do tipo I: prob(Erro Tipo I)=prob(1)+prob(2)+...+prob(n) No exemplo: prob(Erro Tipo I) =

Exemplo 1: Comparação de três tipos de rede. Considere o problema de comparar 3 tipos de rede de computadores, C1, C2 e C3, em termos do tempo médio de transmissão de pacotes de dados entre duas máquinas. Experimento (projeto completamente aleatorizado com um fator): 8 replicações com cada tipo de rede, aleatorizando a ordem dos 24 ensaios e mantendo fixos os demais fatores controláveis.

Exemplo 1: Projeto do experimento. ensaios de 1 a 8: C1 ensaios de 9 a 16: C2 ensaios de 17 a 24: C3 Seqüência número Uso da dos testes do ensaio rede 1 16 C2 2 14 C2 3 24 C3 4 6 C1 ... ... ... 24 11 C3

Exemplo 1. Dados do experimento: Seqüência número Tempo de dos testes do ensaio Rede resposta (y) 1 16 C2 7,8 2 14 C2 8,2 3 24 C3 6,3 4 6 C1 7,2 ... ... ... ... 24 11 C2 7,8

Exemplo 1: Perguntas a serem respondidas pela análise estatística. Existe diferença real (significativa) entre os 3 tipos de rede? Qual é a estimativa do tempo de resposta para cada tipo de rede?

Dados do experimento Tipo de rede Replicação C1 C2 C3 1 7,2 7,8 6,3 2 9,3 8,2 6,0 3 8,7 7,1 5,3 4 8,9 8,6 5,1 5 7,6 6,2 6 5,2 7 8,8 8 8,0 6,8 Soma 65,7 63,5 48,1 Média 8,21 7,94 6,01

Notação: (g = 3 tratamentos) (1) (2) (3) y11 y21 y31 y12 y22 y32 ... ... ... y1n y2n y3n Notação: (g = 3 tratamentos) Dados Média global: Estatísticas Média: Estatística: função dos elementos da amostra (são estimadores de certos parâmetros de interesse)

Parâmetros: valores reais, mas geralmente desconhecidos  tempo esperado (médio) de resposta; i tempo esperado (médio) de resposta sob o tratamento i; i = i -  efeito devido ao tratamento i.

Parâmetros: valores reais, mas geralmente desconhecidos Se Y é a variável aleatória que representa a observação do tempo de resposta, tem-se que Y deve ter uma certa densidade de probabilidade f. O parâmetro  é o valor esperado desta distribuição:  = E{Y}. Analogamente: 2 = Var{Y} Yi = observação sob o tratamento i, então i = E{Yi} , i2 = Var{Yi} e i = E{Yi - Y}

tratamento (1) (2) (3) y11 y21 y31 y12 y22 y32 ... ... ... y1n y2n y3n Média global: Estatísticas Média: Estimativas de Parâmetros 1 2 3  O efeito i = i -  pode ser estimado pela estatística:

y11 y21 y31 y12 y22 y32 ... ... ... y1n y2n y3n tratamento (1) (2) (3) (1) (2) (3) y11 y21 y31 y12 y22 y32 ... ... ... y1n y2n y3n Média global: Média: i = 1, 2, 3 j = 1, 2, ..., n erro aleatório média global observação efeito do tratamento i = média do fator i

Hipóteses H0: 1 = 2 =...= g = 0 ou µ1 = µ2 =...= µg H1: i  0 ou µi  µj para algum i para algum par (i,j) As observações Sob H1: Sob H0:

Sob H0: 1 = 2 =...= g = 0

Sob H1: i  0 para algum i

Suposições da ANOVA As observações são independentes e provêm de distribuições normais com a mesma variância. Observa-se que o teste é razoavelmente robusto a estas suposições.

Análise de variância (ANOVA) com um fator Tratamento Replicação 1 2 ... g y11 y21 yg1 y12 y22 yg2 n y1n y2n ygn Soma y1. y2. yg. Média Soma de quadrados total: Graus de liberdade: gl = N - 1 onde: N = ng

Análise de variância (ANOVA) com um fator Tratamento Replicação 1 2 ... g y11 y21 yg1 y12 y22 yg2 n y1n y2n ygn Soma y1. y2. yg. Média Soma de quadrados dos tratamentos: Graus de liberdade: gl = g - 1

Análise de variância (ANOVA) com um fator Tratamento Replicação 1 2 ... g y11 y21 yg1 y12 y22 yg2 n y1n y2n ygn Soma y1. y2. yg. Média Soma de quadrados do erro: Graus de liberdade: gl = N - g

Análise de variância (ANOVA) com um fator Fórmulas equivalente às anteriores Estatística do teste (possíveis valores da razão f):

Graficamente

Graficamente

Teste F Se H0: 1 = 2 =...= g = 0 for verdadeira, a estatística F tem distribuição F com (g - 1) graus de liberdade no numerador e (N - g) graus de liberdade no denominador. valor p f

Regra de decisão rejeita H0 (prova-se estatisticamente H1) p    = nível de significância (probab. tolerável de se rejeitar Ho quando esta for verdadeira) Usual:  = 0,05 = 5% rejeita H0 (prova-se estatisticamente H1) aceita H0 (os dados não mostram evidência para afirmar H1) p   p > 

Exemplo 1: Comparação de três tipos de rede. Considere o problema de comparar 3 tipos de rede de computadores, C1, C2 e C3, em termos do tempo médio de transmissão de pacotes de dados entre duas máquinas. Experimento (projeto completamente aleatorizado com um fator): 8 replicações com cada tipo de rede, aleatorizando a ordem dos 24 ensaios e mantendo fixos os demais fatores controláveis.

Dados do experimento Tipo de rede Replicação C1 C2 C3 1 7,2 7,8 6,3 2 9,3 8,2 6,0 3 8,7 7,1 5,3 4 8,9 8,6 5,1 5 7,6 6,2 6 5,2 7 8,8 8 8,0 6,8 Soma 65,7 63,5 48,1 Média 8,21 7,94 6,01

Exemplo 1 Análise de variância (ANOVA) Fonte da variação SQ gl QM f Entre grupos 22,99 2 11,50 21,07 Dentro dos grupos 11,46 21 0,55 Total 34,45 23 f = 21,07  valor p < 0,01 O teste F rejeita H0, ou seja, existe alguma diferença significativa entre os tratamentos

Verificação das suposições: análise dos resíduos (i = 1, 2, ..., g; j = 1, 2, ..., n)   Tempo de resposta Resíduos Replicação C1 C2 C3 1 7,2 7,8 6,3 -1,01 -0,14 0,29 2 9,3 8,2 6 1,09 0,26 -0,01 3 8,7 7,1 5,3 0,49 -0,84 -0,71 4 8,9 8,6 5,1 0,69 0,66 -0,91 5 7,6 6,2 -0,61 0,76 0,19 5,2 -0,81 7 8,8 0,59 1,19 8 6,8 -0,21 0,79 Média 8,21 7,94 6,01 0,00

Verificação das suposições: análise dos resíduos

Verificação das suposições: análise dos resíduos

Verificação das suposições: Normalidade Kolmogorov-Smirnov Jarque-Beta D’Agostino-Pearson Shapiro-Wilk Lilliefors Anderson-Darling Cramer-von Mises

Verificação das suposições: Normalidade Kolmogorov-Smirnov Estatística do Teste gmáx : maior valor calculado de g; n : tamanho da amostra ou número de parcelas. F(zi): função de distribuição normal acumulada; i: número da amostra;

Normalidade Kolmogorov-Smirnov Tabela 2.2. Valores Críticos da Distribuição Dn

Verificação das suposições: Kolmogorov-Smirnov Para n>40

Verificação das suposições: Normalidade Shapiro-Wilk Estatística do Teste 1 – Ordenar em ordem crescente as n observações da amostra 2 – Calcular: 3 – Calcular: Se N é ímpar, despreza-se a observação mediana

Normalidade Shapiro-Wilk Tabela 2.3.Coeficientes N-i+1 para o teste de normalidade W de Shapiro-Wick.

Normalidade Shapiro-Wilk Tabela 2.3.Coeficientes N-i+1 para o teste de normalidade W de Shapiro-Wick.

Normalidade Shapiro-Wilk Tabela 2.3.Coeficientes N-i+1 para o teste de normalidade W de Shapiro-Wick.

Normalidade Shapiro-Wilk

Normalidade Shapiro-Wilk 4 – Calcular a estatística de teste:.

Valores Críticos da Distribuição W da Estatística Shapiro-Wi

Normalidade D’Agostino-Pearson

Normalidade D’Agostino-Pearson

Normalidade D’Agostino-Pearson

Teste de Homocedasticidade Teste de Hartley Estatística do Teste: onde Smax e Smin são, respectivamente, os valores máximo e mínimo de desvio padrão estimados para as n amostras. Rejeitar H0 se Fmax > F(,a,N-1)

Teste de Homocedasticidade Teste de Cochran Estatística do Teste: Rejeitar H0 se C > C(,a,N-1), com:

Teste de Homocedasticidade Teste de Bartlett Estatística do Teste: Rejeitar H0 se onde  é o índice de significância do teste, a é o número de amostras sendo testadas e ni é o número de observações da i-ésima amostra.

Teste de Homocedasticidade Teste de Levene Estatística do Teste: Rejeitar H0 se onde  é o índice de significância do teste, k é o número de amostras sendo testadas e ni é o número de observações da i-ésima amostra.

Estimação das médias Médias amostrais sob cada tratamento:   Tempo de resposta C1 C2 C3 Média 8,21 7,94 6,01

Estimação das médias ANOVA: Fonte da variação SQ gl QM f Entre grupos 22,99 2 11,50 21,07 Dentro dos grupos 11,46 21 0,55 Total 34,45 23

Estimação das médias Estimativas, através de intervalos de 95% de confiança, para o tempo esperado de transmissão, em três tipos de rede.

Teste de Tukey (teste para comparação múltipla) Utilizado quando se deseja comparar todos os pares de médias de r populações, adotando-se um único nível de confiança. H0 : H1: O teste consiste em calcular um valor (Dcrít), acima do qual, a diferença entre duas médias amostrais (em absoluto) é significativamente diferente de zero. onde representa o valor tabelado (vindo de uma distribuição da amplitude studentizada – “studentized range”) associado ao nível de significância adotado.

Distribuição da Amplitude Studentizada g r

Teste de Scheffé (teste para comparação múltipla) Neste teste a hipótese nula H0: μi = μj é rejeitada se: onde, F(1−α ) é o quantil de probabilidade (1-α) da distribuição :

Teste de contraste (teste para comparação múltipla) Um contraste C é uma combinação linear dos totais yi, que permite a comparação das médias dos tratamentos.