A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

1 1- Experimentos com Um Único Fator: A Análise de Variância (ANOVA) 1.1 Um exemplo. Uma bioquímica (Tecnologia de Alimentos) está interessada em estudar.

Apresentações semelhantes


Apresentação em tema: "1 1- Experimentos com Um Único Fator: A Análise de Variância (ANOVA) 1.1 Um exemplo. Uma bioquímica (Tecnologia de Alimentos) está interessada em estudar."— Transcrição da apresentação:

1 1 1- Experimentos com Um Único Fator: A Análise de Variância (ANOVA) 1.1 Um exemplo. Uma bioquímica (Tecnologia de Alimentos) está interessada em estudar a extração de pigmentos naturais, com aplicação como corante em alimentos. Numa primeira etapa tem-se a necessidade de escolher o melhor solvente extrator. A escolha do(s) melhor(es) solventes foi realizada através da medida da absorbância de um pigmento natural do fruto de baguaçú. Fator = solventes; a=5 níveis; n=5 repetições. Fator é uma variável independente em estudo, por exemplo, solventes, aditivos. Estes fatores geralmente envolvem diversos níveis. A ANOVA é utilizada para verificar se existem diferenças significativas entre os níveis dos fatores (tratamentos). Aqui assume-se que o delineamento é completamente casualizado. Estes experimentos só podem ser realizados quando as unidades experimentais são homogêneas. Por exemplo, 12 leitões da mesma raça, mesmo sexo, mesma idade e com pesos iniciais próximos.

2 2 Casualização: a partir de 1 kg de polpa, foram sendo retiradas amostras de 10gr, onde foram aplicados os tratamentos, numa ordem aleatória. Unidade experimental: 10 gramas de polpa do fruto de baguaçú. As observações obtidas de absorbância são mostradas na tabela 1.1 Tabela 1.1 Dados de absorbância de cada um dos solventes

3 3 Desenho esquemático para absorbância de cada solvente Existe uma forte suspeita de que o tipo de solvente esteja afetando a absorbância. Distribuições assimétricas. Valor discrepante.

4 4 1-2 A Análise de Variância Objetivo: testar se existe diferenças nas médias de absorbância para os a=5 tipos (níveis) de solventes.

5 5 Modelo estatístico (one-way): i=1,2,...,a j=1,2,...,n y ij = é a ij-ésima observação; é uma constante para todas as observações (média geral); i é o efeito do i-ésimo tratamento; ij é o erro aleatório(erros de medida, fatores não controláveis, diferenças entre as unidades experimentais, etc.). Pressuposições: 1) os erros aleatórios são independentes; 2) os erros aleatórios são normalmente distribuídos; 3) os erros aleatórios tem média 0 (zero) e variância 2 ; 4) a variância, 2, deve ser constante para todos os níveis do fator. 5) as observações são adequadamente descritas pelo modelo Ou, então:

6 6 Duas situações: 1) modelo de efeito fixo (níveis selecionados pelo pesquisador); 2) modelo de efeito aleatório (amostra aleatória). Neste caso, vamos estimar e testar hipóteses sobre a variabilidade de i 1-3 Análise de Variância do Modelo de Efeito Fixo Hipóteses: H 0 : 1 = 2 =...= a H 1 : i j para pelo menos um par (i,j) 1-3.1 Decomposição da soma de quadrados total Corrigida para a média SSTotal = SSTratamentos + SSErro

7 7777 Considere a SQErro A parte dentro dos colchetes dividida por (n-1) é a variância do tratamento i. A variância combinada dos a tratamentos é:

8 8888 A parte dentro dos colchetes dividido por a-1 é a variância entre tratamentos. Considere a SQTrat

9 9 Graus de liberdade: SSTotal tem an-1 graus de liberdade; SSTratamentos tem a-1 g.l. e SSerro tem a(n-1) g.l. Esperanças dos quadrados médios: Teste de hipótese: Quadrados médios:

10 10 1-3.2 Análise Estatística F 0 = QMTratamentos / QMErro Critério para rejeição de H 0 : F 0 > F,a-1,N-a. Pode-se usar o valor p (em inglês: p- value: É a probabilidade de rejeitar a hipótese nula devido a variações aleatórias. Exemplo: para = 5%, assim, se o valor p for menor do que 0,05 rejeitar H 0, caso contrário, não rejeitar H 0. Fórmulas operacionais para o cálculo das somas de quadrados:

11 11 N = an Valor p

12 12 Exemplo 1-1. O experimento de absorbância F.05;4;20 =2,87 F,01;4;20 =4,43 Rejeita-se H 0, e concluímos que as médias de tratamentos diferem entre si; os solventes afetam signifi- cativamente as médias de absorbância. Coeficiente de variação (CV)= 7,95%

13 13 1-3.3 Estimação dos parâmetros do modelo Estimativas da média geral e dos efeitos dos tratamentos: Um intervalo de confiança para i é dado por: Estimativa pontual de i : dado i = + i, temos:

14 14 Intervalo de confiança para a diferença entre qualquer duas médias i - j : Exemplo 1-3. Dados de absorbância

15 15 Critério de rejeição de H 0 : i. - j.. = 0. Se o intervalo de confiança contém o valor da hipótese nula não se rejeita a hipótese de nulidade, caso contrário rejeita-se a hipótese. 1-3.4 Dados desbalanceados. O número de observações dentro de cada tratamento é diferente. Nesse caso, as SQTotal e SQTratamentos são dadas por:

16 16 1-4 Diagnóstico do Modelo Verificar se as pressuposições básicas do modelo são válidas. Isso é realizado através de uma análise de resíduos. Define-se o resíduo da ij-ésima observação como: 1-4.1 A suposição de normalidade Vamos usar o gráfico normal de probabilidades: sob normalidade dos erros, estes devem seguir uma reta de 45 o.

17 17 Alguns valores negativos dos resíduos(mais extremos) deveriam ser maiores; alguns valores positivos dos resíduos deveriam ser menores, com exceção do último valor que deveria ser maior. Contudo este gráfico não é grosseiramente não normal. Existe um resíduo que é muito maior que os demais, este valor é denominado outlier. É um problema sério. Deve-se fazer uma investigação sobre esse valor (erro de cálculo, digitação, algum fato experimental). Só eliminar um outlier se tiver uma justificativa não estatística, caso contrário, fazer duas análises: uma com e outra sem o outlier. Usar métodos não paramétricos. Transformação. Outlier: d ij =e ij /RQ(QM Erro ). Se algum resíduo padronizado for maior do que |3| ele é um outlier. Obs. RQ = raíz quadrada.

18 18 1-4.2 Gráfico de resíduos no tempo Para verificar se existe correlação entre os resíduos. Uma tendência de ter resíduos positivos e negativos indica uma correlação positiva. Isto implica que a suposição de independência dos erros foi violada. Isto é um problema sério, e até difícil de resolver. Se possível evitar este problema. A casualização adequada pode garantir a independência.

19 19 1-4.3 Gráfico dos resíduos versos valores preditos A distribuição dos pontos é aleatória. Útil para verificar se as variâncias são heterogêneas (forma de megafone). Devido a presença de um outlier as variâncias não são homogêneas. Na presença de heterogeneidade de variâncias é usual aplicar uma transformação nos dados. Pode-se usar os testes não-paramétricos. A heterogeneidade de variância também ocorre nos casos de distribuições assimétricas, pois a variância tende a ser função da média.

20 20 Algumas transformações para homogeneizar as variâncias são dadas a seguir. As conclusões são realizadas para os dados transformados. Poisson: y * = y ou y * = 1+y; dados de contagens, variância é função da média. Log normal: y * =log y; somente valores positivos, variável contínua com assimetria. Binomial: y * =arco seno y. dados na forma de proporções. Teste de Bartlett para igualdade de variâncias O teste estatístico é dado por: Onde:

21 21 é a variância amostral do i-ésimo tratamento. Rejeita-se H 0 quando Exemplo 1-4 Conclui-se que as 5 variâncias são iguais. Mesma conclusão com o uso do valor p (= 0,0691).

22 22 Teste de Levene 1) Calcular os resíduos da análise de variância; 2) Fazer uma análise de variância dos valores absolutos desses resíduos; 3) Se as variâncias são homogêneas, o resultado do teste F será não significativo. Exemplo: dados de absorbância. Aceita-se a hipótese de que as variâncias são homogêneas

23 23 1-4.4 Escolha da transformação para estabilizar a variância Escolha empírica da transformação Em muitos experimentos onde há repetições, podemos estimar o parâmetro através da equação de regressão: Como e são desconhecidos, usamos as suas estimativas s e y(barra), esta é a média da amostra.

24 24 Exemplo 1-5 (Arquivo: plasma.sas) Um pesquisador está interessado em estudar a influência das idades de crianças doentes no nível de plasma, foram testadas 5 idades distintas, ou sejam, ID1= 0 ano, ID2=1 ano, ID3=2 anos, ID4=3 anos e ID5=4 anos. Os resultados de nível de plasma foram:

25 25 O teste F da ANAVA indica que as 5 médias de níveis de plasma diferem significativamente entre si. O gráfico dos resíduos indica heterogeneidade de variâncias.

26 26 Para estudar a possibilidade de uma transformação nos dados, plotamos log do desvio padrão versus log da média. A equação de uma regressão linear simples para os dados é dada por:

27 27 Como o coeficiente angular é próximo de 1,5 e, de acordo com a tabela, podemos usar a transformação INVERSO DA RAÍZ QUADRADA.

28 28 Normalidade: de acordo com o gráfico abaixo podemos considerar que os dados seguem uma distribuição normal.

29 29 Transformação: logarítmica (base 10).

30 30 1-4.5 Gráfico dos resíduos versus outras variáveis Se a distribuição dos pontos no gráfico mostrar algum padrão (tendência, isto é, se os pontos não estão distribuídos aleatoriamente no gráfico) a variável afeta a resposta, assim, esta variável deve ser melhor controlada ou incluída na análise. Por exemplo, as análises foram feitas com dois espectrofotômetros.

31 31 Dois espectrofotômetros

32 32 1-5.1 Comparações entre médias de tratamentos (Fatores qualitativos) Quando o teste F da análise de variância for significativo, indica que existe diferenças entre as médias reais de tratamentos. Entre quais médias ou grupos? 1-5.2 Contrastes Desejamos verificar se a médias dos solventes E50, EAW e E70 não diferem da média dos solventes MAW e MM. Esta hipótese é escrita como: Temos o contraste: A soma de quadrados é dada por: Com 1 grau de liberdade (sempre). 1-5 Interpretando os resultados

33 33 Se o delineamento é desbalanceado então: TESTE: SQ c /QMErro. Vamos obter uma estatística F com 1 e N-a graus de liberdade. 1-5.3 Contrastes Ortogonais Dois contrastes com coeficientes c i e d i são ortogonais se: Exemplo: vamos considerar um experimento com 3 tratamentos (a=3), sendo um deles o controle. ortogonais

34 34 Os contrastes devem ser escolhidos antes de realizar o experimento. Para a tratamentos podemos ter a-1 contrastes ortogonais; podemos ter vários conjuntos de a-1 contrastes ortogonais. Exemplo: dados de absorbância. Temos 5 médias de tratamentos e, portanto, 4 g.l. 4 contrastes ortogonais. Contrastes C 1 =2y 1. +2y 2. -3y 3. +2y 4. -3y 5. C 2 = y 1. + y 2. -2y 4. C 3 = y 1. - y 2. C 4 = y 3. -y 5. Hipóteses: C 1 =7,7286; C 2 =-0,8316; C 3 =-0,1376; C 4 =1,2644 SQC 1 =0,3982; SQC 2 =0,0231; SQC 3 =0,0019; SQC 4 =0,1599

35 35

36 36 1-5.4 Método de Scheffé para comparação de contrastes 1 - Não sabe a priori quais contrastes comparar 2 - Deseja comparar mais do que a-1 contrastes Considere m contrastes de médias: A estimativa do contraste é dado por: O erro padrão do contraste é dado por:

37 37 Critério do teste: o valor com o qual C u deve ser comparado é dado por: Se |C u | S,u, então rejeita-se a hipótese de que o contraste u é igual a zero. Exemplo 1-1. Dados de absorbância. Considere os 2 contrastes de interesse As estimativas desses contrastes são:

38 38 Erros padrões dos contrastes: Os valores críticos ( = 0,01) são dados por: Como |C 1 | S 0,01;1 conclui-se que o contraste C 1 é diferente de zero, isto é, os tratamentos E50, EAW e E70 em média diferem dos tratamentos MAW e M1M. Como |C 2 | S 0,01;2 conclui-se que o contraste C 2 é igual a zero, portanto, os tratamentos E50 e EAW, em média, não diferem do tratamento E70.

39 39 1-5.5 Comparações entre Pares de Médias Hipótese: Número de comparações: a(a-1)/2. Método da Diferença Mínima Significativa (LSD) Devem ser realizadas após o teste F da análise de variância rejeitar a hipótese nula A estatística a ser utilizada é dada por: Para um teste bilateral, o par de médias, i e j, é significativamente diferente se: LSD

40 40 Critério do teste: se concluímos que o par de médias i e j, difere significativamente. Exemplo: dados de absorbância. Para =0,05, o valor da LSD é: * diferença significativa para =5%.

41 41 Teste de Tukey Duas médias são diferentes significativamente se a diferença das médias amostrais (em valor absoluto) for superior a DMS (Diferença Mínima Significativa): Onde q é um apropriado nível de confiança superior da amplitude studentizada para k médias (tratamentos) e f graus de liberdade associados a estimativa s 2 de 2 (QMErro). Exemplo: dados de absorbância. O valor da Diferença Mínima Significativa é: Conclusão: pelo teste de Tukey, ao nível de significância de 5%, as médias dos tratamentos E50 e EAW, assim como as médias dos tratamentos EAW e E70 não apresentam diferenças significantes. As médias dos tratamentos E50 e E70 apresentam diferença significante.

42 42 E70 = 0,6363 A EAW = 0,5669 A B E50 = 0,5393 B MAW = 0,4496 C M1M = 0,1968 D Médias seguidas de mesma letra, em uma mesma coluna, não apresentam diferenças significantes, ao nível de significância de 5%, pelo teste de Tukey.

43 43 Teste de Dunnett: comparação com um controle Interesse é comparar cada uma das a-1 médias com a média do tratamento controle, assim temos a-1 comparações. Deseja-se testar a hipótese: Onde a é a média do tratamento controle. A hipótese de nulidade é rejeitada, ao nível de significância, se Exemplo: dados de absorbância. Considere o tratamento M1M como sendo o controle. Neste exemplo, a=5, a-1=4 e f=20 e n i =n a =5. Para =5%, da tabela (valores críticos do teste de Dunnett) obtemos d 0,05(4;20) =2,65. Assim, o valor crítico é dado por:

44 44 Conclusão: todas as médias diferem significativamente da média do tratamento controle. Qual teste usar? O LSD é eficiente para detectar diferenças verdadeiras nas médias se ele for aplicado apenas depois do teste F da ANOVA se significativo a 5%. Idem para o Duncan. Estes métodos não contém o erro tipo I (erro geral ou experimentwise error). Como o Tukey controla este erro ele é o preferido pelos estatísticos. O SNK é mais conservador do que o Duncan.

45 45 1-5.6 Modelo de Regressão Fator quantitativo: interesse em encontrar uma equação de regressão que leva em conta toda a faixa de valores análise de regressão 75 kg/ha 9,55 8,95 10,24 8,66 37,40 9,35 100 kg/ha 9,14 10,17 9,75 9,50 38,56 9,64 Exemplo: produção de milho em kg/parcela. Desvio Padrão 2,05 1,40 0,95 0,69 0,40

46 46 Os traços no gráfico representam os valores médios para cada uma das doses. Pelo gráfico de dispersão, verifica-se claramente que a relação não é linear. Podemos ajustar um polinômio de 2 0 grau para representar este relacionamento, isto é, Onde 0, 1 e 2 são parâmetros desconhecidos e que devem ser estimados e é o erro aleatório. Para o exemplo a equação ajustada é dada por:. R 2 =66,9% 66,9 % da variabilidade dos dados é explicada pelo modelo quadrático.

47 47 Estimação: X=90 Ŷ=9,58 8,6 E(Y) 10,5 - Estimar a produção média de milho para doses dentro da região de experimentação; -Otimização. Otimização:

48 48 1-6 Modelo de Efeito Aleatório Se o pesquisador seleciona aleatoriamente a níveis de um fator de uma população de níveis desse fator, então o fator é dito aleatório. A inferência é feita para toda a população de níveis. Exemplo: uma pesquisadora estudou o conteúdo de sódio em cervejas selecionando aleatoriamente 6 marcas de um grande número de marcas dos EUA e do Canadá. Ela, então, escolheu 8 garrafas de cada marca aleatoriamente de supermercados e mediu a quantidade de sódio (em miligramas) de cada garrafa.

49 49 O modelo estatístico: i é o efeito do i-ésimo tratamento e assume-se que seja NID(0, 2 ) ij é o erro aleatório e assume-se que sejam NID(0, 2 ) i e ij são independentes Testar hipóteses sobre os efeitos dos tratamentos não faz sentido, assim, vamos testar as hipóteses sobre a variância dos tratamentos.

50 50 Se 2 =0, então todos os tratamentos são idênticos; mas se 2 >0 a variabilidade entre tratamentos é significativa. Quando temos um modelo de efeitos aleatórios o interesse está em estimarmos os componentes de variâncias: 2 e 2. Prova-se que: Portanto,

51 51 Exemplo: Dados de sódio. Os resultados da análise de variância são mostrados na tabela abaixo - Arquivo: conteudodesoddiocervejas.sas Os componentes de variância são estimados por: Um uso importante: isolar diferentes fontes de variabilidade que afetam um produto ou um sistema. Identificar fatores com maior variabilidade (Exemplo: Lotes, amostras e réplicas). Conclusão: rejeita-se H 0 :

52 52 2- Mais Sobre Experimentos com Um Fator 2-1 Escolha do Tamanho da Amostra 2-1.1 Curvas Características de Operação Curva característica de operação: é um gráfico em que no eixo das ordenadas temos a probabilidade de erro tipo II (aceitar a hipótese de nulidade quando na verdade deveríamos ter rejeitado) e no eixo das abcissas temos a precisão desejada pelo pesquisador. Probabilidade de erro tipo II para o modelo de efeito fixo e igual tamanho de amostra por tratamento. As CCO dadas no ábaco V (Apêndice), são usadas para avaliar o valor de. Essas CCO são um gráfico de (ordenadas) versus (abcissas), onde:

53 53 O cálculo de apresenta algumas dificuldades práticas: 2) necessita-se de uma estimativa de 2 (experiência, um experimento piloto, bibliografia) Exemplo: dados de absorbância. Suponha que a pesquisadora deseja rejeitar a hipótese nula com pelo menos 90% de probabilidade(1- =90%) se as 5 médias dos trat/os são: Ela deseja usar =0,05, e neste caso a média geral vale 0,52. Assim, De um ensaio preliminar encontramos 2 =0,06.

54 54 Temos: Assim, a pesquisadora deve utilizar n=5 repetições para realizar o teste com o poder desejado. Alternativa: é selecionar um tamanho de amostra tal que, se a diferença entre qualquer duas médias exceder um valor especificado, a hipótese de nulidade deve ser rejeitada. Seja D este valor (precisão), então: Exemplo: dados de absorbância: suponha que a pesquisadora deseja rejeitar a hipótese de nulidade com probabilidade igual a 0,90 (Poder do teste (1- )) se a diferença entre qualquer duas médias for igual a 0,30. Considere uma estimativa para 2 =0,015, portanto, = 0,1225.

55 55 Conclui-se que n=7 repetições devem ser usadas para ter a precisão e confiança desejadas. Modelo de efeitos aleatórios: a probabilidade de erro tipo II para esse caso é: As CCO (Ábaco VI, Apêndice) são gráficos onde na ordenada temos a probabilidade de erro tipo II e na a abcissa temos, onde é dado por:

56 56 2 : quanto da variabilidade na população dos tratamentos deseja-se detectar; 2 : pode ser obtido através de algum experimento ou experiência anterior, bibliografia. Exemplo: conteúdo de sódio. O pesquisador deseja rejeitar a hipótese de nulidade com 99% de probabilidade se 2 =10. De um experimento anterior sabe-se que 2 =1,0. Método do Intervalo de Confiança Assume-se que o pesquisador deseja expressar os resultados em termos de intervalos de confiança dos efeitos dos tratamentos. Especifica à priori a amplitude dos mesmos.

57 57 A semi-amplitude do intervalo de confiança (precisão que o pesquisador deseja, isto é, a diferença entre a média obtida no experimento e a média verdadeira) ) é dada por: Exemplo: dados de absorbância: o pesquisador deseja construir com confiança de 95%, um intervalo com semi-amplitude de 0,15. Considere 2 =0,015. Para n=5 repetições, a semi-amplitude do intervalo de confiança é dada por: O qual apresenta uma precisão menor do que a desejada, portanto, vamos aumentar o tamanho da amostra. Para n=6 repetições, temos: Para n=6 repetições encontramos a precisão desejada.

58 58 2-2 Encontrando efeitos de dispersão O interesse é descobrir se os diferentes níveis do fator afetam a variabilidade efeitos de dispersão. Neste caso, a variável resposta a ser utilizada será a variância, desvio padrão ou outra medida de variabilidade. Exemplo. Na fabricação de pão utiliza-se farinha de trigo e de um número menor de outros ingredientes permitidos (fatores em estudo). O objetivo de um programa de qualidade foi a de identificar uma combinação desses ingredientes os quais produzem um alto volume específico de pão e que seja tolerante a flutuações no processo de fabricação. Para esse fim, foi realizado um experimento com 4 formulações (1, 2, 3 e 4), sendo a última uma formulação padrão. Os dados médios de volume específico e desvio padrão estão na tabela a seguir.

59 59 O teste F da ANOVA para os valores médios de volume específico de pão não foi significativo(F=0,2667 e valor do nível descritivo igual a 0,8482), indicando que não existe diferenças entre as 4 formulações. Para investigar possíveis efeitos de dispersão, usualmente utiliza-se LN(s), como sendo a variável resposta (a transformação logarítmica estabiliza a variância). Os resultados da ANOVA estão na tabela a seguir. Observa-se que as formulações afetam o desvio padrão do volume específico do pão, isto é, as formulações tem um efeito de dispersão.

60 60 LSD test; variable LNDESPAD (volumpao.sta) Probabilities for Post Hoc Tests MAIN EFFECT: VAR1 {1} {2} {3} {4} 3,8719432,1055923,4629633,582091 1 {1},001857,375988,526936 2 {2},001857,010057,006118 3 {3},375988,010057,793393 4 {4},526936,0,006118,793393 Dos resultados do teste LSD, conclui-se que a formulação 2 produz menos dispersão do que as demais; As formulações 1, 3 e 4, são estatisticamente equivalentes. 2-3 Ajustando curvas de respostas Quando os níveis do fator são quantitativos, podemos realizar uma regressão polinomial. Duas etapas: 1) desdobramento dos graus de liberdade de tratamentos (a-1),em regressão linear, quadrática, cúbica, 4 grau, e assim por diante. Geralmente ajusta-se uma regressão quadrática. 2) obter a equação de regressão.

61 61 Exemplo: produção de milho, em kg/unidade experimental. Efeito: 44,32-22,5211,21-25,33 Soma de quadrados: 49,119,063,142,29

62 62 O novo quadro da ANOVA fica: Observamos que o efeito quadrático foi significativo, o efeito cúbico e 4. grau não foram significativos, portanto, vamos ajustar um polinômio de segunda ordem aos dados, dado por: Onde P u (x) é um polinômio de u-ésima ordem.. Os 3 primeiros polinômios ortogonais são:

63 63 Onde d é a distância entre dois níveis de x, a é o total de níveis, e i são constantes obtidas em tabelas. As estimativas de mínimos quadrados dos parâmetros no modelo polinomial ortogonal são:

64 64 Para os dados de adubação em milho, as estimativas dos parâmetros do modelo são:

65 65 A equação de regressão é dada por: 2-4 Métodos não paramétricos na análise de variância 2-4.1 O Teste de Kruskal-Wallis Quando as pressuposições básicas da ANOVA não forem atendidas, por exemplo, a variável em estudo não apresenta distribuição normal (notas em escala), heterogeneidade de variâncias, outliers. É usado para testar a hipótese de que a tratamentos são idênticos contra a hipótese alternativa de que pelo menos dois deles diferem entre si. (R 2 = 66,9%)

66 66 Pressuposições: 1) as observações são todas independentes. 2) as a populações são aproximadamente da mesma forma e contínuas (pode ser abrandada, desde que consigamos ordenar os dados, exemplo, escala ordinal). Hipóteses: Método: procedemos a classificação conjunta (em ordem crescente) das N observações, dando ordem 1 à menor e ordem N à maior delas, e substituímos às observações pelos seus postos (ranks). No caso de empates (observações com o mesmo valor), designa-se o posto médio para as observações empatadas. Seja R i a somas dos ranks do i-ésimo tratamento. O teste estatístico é dado por: n i é o número de observações do i-ésimo tratamento e N é o número total de observações.

67 67 Sem empates: E o teste estatístico simplifica-se: Critério do teste: para n i 5, H tem distribuição aproximada de 2 a-1 sob H 0.. Assim, se rejeita-se H 0. Exemplo: dados de absorbância. Olhar o valor p

68 68 O valor p para H=22,3987 com 4 g.l. é 0,0002, portanto, rejeita-se H 0. * Teste de comparação de médias não paramétrico.

69 2-5 Medidas Repetidas É preciso levar em consideração duas fontes de variabilidade: entre unidades e dentro de unidades (between subjects and within subjects). SUBJECTS=JULGADORES.. Cada degustador usa os a tratamentos delineamento com medidas repetidas. A tabela geral dos dados para este delineamento é dada como:

70 70 O modelo estatístico: Onde i é o efeito do i-ésimo tratamento e j é o efeito da j-ésima unidade. Assume- se que: tratamentos de efeito fixo e subjects de efeito aleatório (Modelo Misto). Partição da soma de quadrados total: S.Q. Total = S.Q Entre julgadores + S.Q.Dentro julgadores

71 71 Graus de liberdade: na-1 = (n-1) + n(a-1) S.Q. Dentro de julgadores = S.Q.Tratamentos + S.Q. Erro Graus de liberdade: n(a-1) = (a-1) + (a-1)(n-1) Hipóteses: Critério do teste: Rejeita-se H 0 se:

72 72 Exemplo: hamburger de pescado, variável sabor. Teste para julgadores: Portanto, rejeita-se H 0, isto é, o comportamento dos julgadores não é o mesmo, não são equivalentes.

73 73 Intervalos de confiança: 2-6 Análise de Covariância É utilizada para melhorar a precisão (fazer um ajuste) na comparação entre os tratamentos do experimento. Suponha um experimento que junto com uma variável resposta Y (população de staphilococus), tenha uma variável X (população inicial de staphilococus), e que Y e X estejam relacionadas linearmente. Além disso, suponha que X não pode ser controlada pelo pesquisador, mas pode ser observada junto com Y. A variável X é chamada covariável. A ANCOVA é um ajuste da variável resposta para os efeitos de uma variável perturbadora (nuisance variable). Se este ajuste não for feito, a covariável pode inflacionar o quadrado médio do erro e fazer com que diferenças reais entre os tratamentos sejam difíceis de serem detectadas. A covariável, X, não deve ser afetada pelos tratamentos. Por exemplo, experimento com tratamento de sementes, Y = produção da cultura e X = stand inicial (plantas que germinaram). Observação: A blocagem pode ser usada para eliminar o efeito de variáveis perturbadoras que podem ser controladas pelo pesquisador.

74 74 Exemplo: dados de população de Staphilococus aureus, em frango, mantidos sob refrigeração doméstica (-18 graus). O objetivo do experimento é comparar meios de cultura, quais sejam: Baird Paker, Baird Paker Modificado, Vermelho Neutro e Vermelho Neutro Modificado com relação à variável sobrevivência de Staphilococus aos 7 dias de armazenamento. Os dados são mostradas na tabela a seguir. Vamos considerar que são os mesmos frangos medidos no tempo 0 e tempo 7 dias.

75 75 Médias: Resultados da ANOVA.

76 76

77 77 A figura mostra um tendência linear entre y = pop7 e x = pop0, isto é, a população aos 7 dias é afetada pela população inicial (0 dia).

78 78 2-6.1 Descrição do procedimento Modelo estatístico (1): para i=1,2,...,a e j=1,2,...,n. Y ij é a j-ésima observação da v. resposta tomada no i-ésimo tratamento; x ij é a medida feita na covariável correspondente a y ij ; é a média dos valores de x ij, é a média geral; i é o efeito do i-ésimo trat/o; é o coeficiente angular da regressão linear entre X e Y e ij é o erro aleatório.

79 79 Suposição:

80 80 Para descrever a análise utiliza-se a notação:

81 81 Somas de quadrados: Graus de liberdade: Regressão: 1 Tratamentos(ajustado): a-1 Erro: a(n-1)-1 Total: na-1 Teste da hipótese: Rejeita-se H 0 se: Use o valor p ou

82 82 Deve-se ajustar as médias: médias de mínimos quadrados Erro padrão de qualquer média ajustada de tratamento: Hipótese: Rejeita-se H 0 se: Use o valor p

83 83 Exemplo: dados de população de Staphilococus. (Arquivo: staplilocousanalisedecovariancia) Não podemos rejeitar a hipótese H 0 : i =0, isto é, os valores médios dos meios são estatisticamente equivalentes, com valor p de 0,9739. Rejeita-se a hipótese H 0 : =0, com valor p < 0,0001, isto significa que foi importante remover o efeito da população inicial de Staphilococus. Os valores das médias ajustadas com os seus erros padrões são:

84 84 A estimativa do coeficiente de regressão é: Diagnóstico do modelo: os resíduos são dados por: Exemplo: e 11 =3,1710-3,2718-1,2066(3,3507-3,55033) = 0,140074 Os resíduos estão aleatoriamente distribuídos em torno do valor zero. A faixa de distribuição, -0,5 a 0,5, é curta; não tem outliers. Variâncias homogêneas.

85 85 A suposição de normalidade é satisfeita.

86 86 Valores aleatoriamente distribuídos em torno de zero. Conclusão: de acordo com os gráficos, os resultados da análise estatística podem ser utilizados, pois eles não revelam qualquer problema quanto as suposições do modelo.

87 87 2-6.2 Comparações entre Pares de Médias Ajustadas Hipótese: Número de comparações: a(a-1)/2. Método da Diferença Mínima Significativa (LSD) Devem ser realizadas após o teste F da análise de variância rejeitar a hipótese nula Para um teste bilateral, o par de médias, i e j, é significativamente diferente se: LSD Onde t é um valor da distribuição t de Student com N-a-1 graus de liberdade e nível de significância.

88 88 Comparando a média ajustada de BP com a média ajustada de BPM Portanto, as médias não apresentam diferença significante ao nível de significância de 5%.


Carregar ppt "1 1- Experimentos com Um Único Fator: A Análise de Variância (ANOVA) 1.1 Um exemplo. Uma bioquímica (Tecnologia de Alimentos) está interessada em estudar."

Apresentações semelhantes


Anúncios Google