VARIÂNCIA NÃO EXPLICADA (WITHIN) ou INTRÍNSECA (FLUTUAÇÕES)

Slides:



Advertisements
Apresentações semelhantes
Análise Estatística Testes de Hipóteses.
Advertisements

DISTRIBUIÇÃO NORMAL. O histograma por densidade é o seguinte: Exemplo : Observamos o peso, em kg, de 1500 pessoas adultas selecionadas ao acaso em uma.
CAPÍTULO 7 TESTE DE HIPÓTESE
Análise de variância.
Intervalos de Confiança
ESTATÍSTICA INFERÊNCIA ESTATÍSTICA
2.5 INFERÊNCIAS SOBRE A DIFERENÇA NAS MÉDIAS, COMPARAÇÕES EMPARELHADAS
Cássio Luís Fernandes de Oliveira
Cássio Luís Fernandes de Oliveira
CAPÍTULO 7 TESTE DE HIPÓTESE
ESTIMAÇÃO.
Prof. Marllus Gustavo Ferreira Passos das Neves
Estatística 8 - Distribuições Amostrais
MB751 – Modelos de previsão
MEDIDAS DE DISPERSÃO Medidas de tendência central fornecem um resumo parcial das informações de um conjunto de dados. A necessidade de uma medida de variação.
Análise de Medidas Repetidas: Áreas de Uso
APLICAÇÕES COM EXCEL: Distribuição Binomial
Distribuição F Considere duas populações com distribuição de Gauss com médias 1, 2 e variâncias 12 e 22 . Retire uma amostra aleatória de tamanho.
ESTATÍSTICA APLICADA AULA 2 MEDIDAS DE POSIÇÃO X MEDIDAS DE DISPERSÃO.
Estatística Aplicada (Aula 4)
Estatística Aplicada (Aula 4)
ANOVA Prof. Herondino.
Análise de Variância (ANOVA)
Projetos de experimentos com um fator e vários níveis
Aproximação da binomial pela normal
ME623A Planejamento e Pesquisa
ME623A Planejamento e Pesquisa. Não Interação no Modelo de 2 Fatores A presença de interação tem um impacto na interpretação dos dados No entanto, se.
ME623 Planejamento e Pesquisa
ME623A Planejamento e Pesquisa
ME623 Planejamento e Pesquisa
Inferências Relativas à Média
Teste de Hipóteses para a média, caso de grande amostra
DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO DA AMOSTRA OU
DISTRIBUIÇÃO AMOSTRAL DA MÉDIA DA AMOSTRA OU DISTRIBUIÇÃO AMOSTRAL DE
MEDIDAS DE VARIABILIDADE DADOS NÃO-AGRUPADOS
Teste de Hipóteses de uma amostra Prof. Helcio Rocha
Estatística e Probabilidade
Apêndice.
ANOVA: Análise de Variância APLICAÇÃO.
Estatística Para um dado conjunto de dados, podemos calcular as seguintes grandezas: 1) Medidas de posição 2) Medidas de dispersão 3) Parâmetros de simetria.
Distribuição T - Student
Comparação de Sistemas Usando Dados de Amostras
Modelos de distribuição de erros
ESTATÍSTICA.
Teste de Hipóteses para a média, caso da pequena amostra
Amostragem Pontos mais importantes:
Diogo Fernando Bornancin Costa Fábio de H.C.R. dos Santos
RESPOSTA CONTÍNUA: AMOSTRAS INDEPENDENTES: TESTE t
Site: Estatística Prof. Edson Nemer Site:
Distribuição da Proporção Amostral
Olhe fixamente para a Bruxa Nariguda
Inferência Estatística
Aula 5 - Método experimental ou de seleção aleatória
Aula 11 - Teste de hipóteses, teste de uma proporção
COMPARAÇÃO DE DUAS POPULAÇÕES
Universidade Federal Fluminense Faculdade de Medicina Mestrado Profissional em Saúde Materno-Infantil 2011 BIOESTATÍSTICA-aula 6 Prof. Cristina Ortiz Valete.
Estatística e Probabilidade
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Análise de Variância (ANOVA) Camilo Daleles Rennó
UFSC.PósMCI.FME.Inferências Envolvendo Variâncias. (8.1) 6 Inferências Envolvendo Variâncias.
Distribuição da Amostra
Regressão e Previsão Numérica.
análise dos estimadores
Revisão básica Distribuição normal: conhecido o valor de z, podemos dizer qual a probabilidade de encontrar valores entre quaisquer dois números. Por.
ERROS E TRATAMENTO DE DADOS ANALÍTICOS
Introdução a planejamento e otimização de experimentos
Testes de Hipóteses.
COMPARAÇÃO DE MÉDIAS TESTE DE TUKEY.
PPGTI AULA 3 Prof. Dr. Márcio A. Fiori –
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
Como construir modelos empíricos. Nos modelos estudados, cada fator foi fixado em dois níveis Por esta razão temos que nos contentar com uma visão limitada.
Transcrição da apresentação:

VARIÂNCIA NÃO EXPLICADA (WITHIN) ou INTRÍNSECA (FLUTUAÇÕES) ANÁLISE DE VARIÂNCIA I – ANOVA DE UM FATOR Ho: A VARIÂNCIA ENTRE TRATAMENTOS E A VARIÂNCIA INTRÍNSECA ÀS AMOSTRAS NÃO SÃO DIFERENTES VARIÂNCIA EXPLICADA (BETWEEN) ou ENTRE TRATAMENTOS Numerador: VARIÂNCIA NÃO EXPLICADA (WITHIN) ou INTRÍNSECA (FLUTUAÇÕES) Denominador GRAUS DE LIBERDADE DE F:

Distribuição F de frequências: A área hachurada (α = 5%) move-se em direção à unidade, à medida que o grau de liberdade (g.l. ou d.f.) aumenta Wannacott & Wannacott, 1972

Premissas iniciais de ANOVA: As amostras foram escolhidas aleatoriamente. As amostras originam-se de sub-populações que têm distribuição normal e mesma variância. A contribuição para a variância total tem que ser aditiva: admitir a independência entre os desvios dentro dos grupos e os desvios entre grupos para poder admitir que a soma total dos quadrados é o resultado do somatório das somas de quadrados das variâncias em análise.

Exemplo 1: Em um programa de intercalibração entre laboratórios, a instituição gestora enviou para cada um de 3 laboratórios A, B e C, 5 réplicas aleatoriamente distribuídas entre eles. Com ANOVA, podemos comparar as médias de várias amostras (e não só duas a duas, como vínhamos fazendo). Questão para testar: a diferença de resultados é devida à diferença de desempenho entre laboratórios, ou será devida a uma flutuação aleatória, fruto de um conjunto de situações intrínsecas às réplicas, ou outros fatores não explicados?

F tabelado, (α ≤ 0,05) = 3,88 => PODE-SE REJEITAR Ho 49,7 48,5 48,6 0,52 B 56,3 57,6 56,4 0,87 51,1 51,6 0,25   s2 15,5 LAB\AMOSTRA 1 2 3 4 5 xi s2xi 48,4 48,7 47,7 56,1 56,9 55,1 C 52,1 52,2 0,55= s2xi A 49,7 48,5 48,6 0,52 B 56,3 57,6 56,4 0,87 51,1 51,6 0,25   s2 15,5 LAB\AMOSTRA 1 2 3 4 5 xi s2xi 48,4 48,7 47,7 56,1 56,9 55,1 C 52,1 52,2 0,55= s2xi A 49,7 48,5 48,6 0,52 B 56,3 57,6 56,4 0,87 51,1 51,6 0,25   s2 15,5 LAB\AMOSTRA 1 2 3 4 5 xi s2xi 48,4 48,7 47,7 56,1 56,9 55,1 C 52,1 52,2 0,55= s2xi A 49,7 48,5 48,6 0,52 B 56,3 57,6 56,4 0,87 51,1 51,6 0,25   s2 15,5 LAB\AMOSTRA 1 2 3 4 5 xi s2xi 48,4 48,7 47,7 56,1 56,9 55,1 C 52,1 52,2 0,55= s2xi H0: não há diferença de desempenho entre laboratórios F tabelado, (α ≤ 0,05) = 3,88 => PODE-SE REJEITAR Ho Média das variâncias Variância das médias A C B

Exemplo 2: Dentro do mesmo programa de intercalibração entre laboratórios, a instituição gestora enviou 5 réplicas aleatoriamente distribuídas para vários outros laboratórios. Neste exemplo vamos comparar o desempenho dos laboratórios D, E e F. Questão para testar: a diferença de resultados é devida à diferença de desempenho entre laboratórios, ou será devida a uma flutuação aleatória, fruto de um conjunto de situações intrínsecas às réplicas, ou outros fatores não explicados?

A variância não explicada é enorme!!!! H0: não há diferença de desempenho entre laboratórios F tabelado, (α ≤ 0,05) = 3,88 => NÃO SE PODE REJEITAR Ho Por quê??? A variância não explicada é enorme!!!!

Labs D, E e F médias iguais variâncias ??? Labs A, B e C

Tabela F: probabilidade de F para α=5% e α=1% (negrito) Graus de liberdade do numerador Graus de liberdade do denominador. continua

Tabela F: probabilidade de F para α=5% e α=1% (negrito) Continuação: graus de liberdade do numerador entre 14 e 26 Tabela F: probabilidade de F para α=5% e α=1% (negrito) Graus de liberdade do numerador Graus de liberdade do denominador

ANALISE DE VARIANCIA II Lembrando os laboratórios D, E e F da aula anterior, em que cada um apresentou 5 resultados de 15 réplicas, aleatoriamente distribuídas entre eles: não foi possível rejeitar H0 com [g.l.]=2;12 e =0,05 PORQUE A VARIÂNCIA NÃO EXPLICADA ERA MUITO GRANDE Suponha que os 5 resultados anteriores, de cada labora-tório, foram obtidos, cada um, usando-se 5 marcas de re-agentes aleatoriamente distribuídos entre os laboratórios. IMPORTANTE: Não há preferência de certo laboratório por certo reagente. Todos os reagentes são usados por todos os laboratórios.

Os resultados dos laboratórios D, E e F podem ser agora reagrupados segundo o reagente usado. QUEM SABE, AQUELA GRANDE VARIÂNCIA NÃO EXPLICADA, NO TESTE ENTRE LABORATÓRIOS, PODE SER DEVIDA, EM PARTE, A UMA VARIÂNCIA INTRÍNSECA AOS REAGENTES?

VARIÂNCIAS EXPLICADAS: ENTRE LABORATÓRIOS: C . = 5 . 15,5 = 77,5 com [g.l.]=(L-1) ENTRE REAGENTES: L . = 3 . 31,8 = 95,4com [g.l.]=(C-1) 31,8 < 35,8 (variância não explicada antes), mas sobra ainda um RESÍDUO

Isto é D+ Temos a Variância Explicada no desempenho do Laboratórios Temos a Variância Explicada pela qualidade do Reagente usado E.... temos um resíduo de variabilidade, um ruído, que vamos “distribuir” por todo o sistema !!!!!

VARIÂNCIA RESIDUAL: = 52,2+(56,4-52,2)+(56,2-52,2) = 60,4 Só há uma observação do laboratório E usando reagente 4  NÃO HÁ VARIÂNCIA; Sem variância (sem erro), como prever o desempenho do laboratório E cada vez que ele usar o reagente 4? VALOR OBSERVADO em E4: Xij = XE4 = 57,5 (Xij > j e > i) VALOR ESPERADO: ij = + ( i- ) + ( j- ) = i + j - = 52,2+(56,4-52,2)+(56,2-52,2) = 60,4

Quem é a diferença entre valor observado (xij) e valor esperado ? Elemento aleatório, que restou inexplicado, após o ajuste de laboratório e de reagente XE4 - E4 = 57,5 - 60,4 = - 2,9 INTERESSANTE?! o desempenho do laboratório E ao usar o reagente 4 ficou 2,9 unidades abaixo do valor esperado... Surpreendente, pois 57,5 é maior que a média do laboratório E e do reagente 4

VARIÂNCIA RESIDUAL DO SISTEMA

VARIÂNCIA RESIDUAL DO SISTEMA Rejeita-se H0, com <0,05 Rejeita-se H0, com <0,05 CONCLUSÃO: O teste ficou mais forte porque se reduziu a VARIÃNCIA NÃO EXPLICADA, mas o denominador de F perdeu 4 graus de liberdade

qual o Intervalo de Confiança de 95% destas diferenças? Se A = B, qual o Intervalo de Confiança de 95% destas diferenças? INTERVALOS DE CONFIANÇA INDIVIDUAIS: (A - mB) = (xA - xB) ± t[2,5%;L(C-1)] . sx .  1/CA + 1/CB, onde sx é a raiz quadrada da variância não explicada (mA - mB) = (48,6 - 56,4) ± 2,18 .  0,55 .  2/5 (mA - mB) = -7,8 ± 1,0 (mA - mC) = -3,0 ± 1,0 (mB - mC) = +4,8 ± 1,0 E, no conjunto? IC  (0,95)3 = 0,857 e, se n = 100?

INTERVALOS DE CONFIANÇA SIMULTÂNEOS (COMPARAÇÃO MÚLTIPLA): (A - mB) = (xA - xB) ± F[5%;(L-1);L(C-1)] . sx .  [(L-1)/C] * 2 onde sx é a raiz quadrada da variância não explicada (mA - mB) = (48,6 - 56,4) ± 3,89 .  0,55 .  2/5 * 2 (mA - mB) = -7,8 ± 1,3 (mA - mC) = -3,0 ± 1,3 (mB - mC) = +4,8 ± 1,3

IC95% SIMULTÂNEO = VALOR ± 1,3: DIFERENÇAS ENTRE MÉDIAS DE POPULAÇÕES (i -I), ESTIMADAS DE MÉDIAS DE AMOSTRAS (xi-xI) IC95% SIMULTÂNEO = VALOR ± 1,3: A B C -7,8 -3,0 +7,8 +4,8 +3,0 -4,8 -9,1 < (mA - mB) < -6,5 -4,3 < (mA - mC) < -1,7 +3,5 < (mB - mC) < +6,1

SQ=MQ . Grau de liberdade. Media das médias Variância da média das médias, Variância entre tratamentos, Variância explicada Média das variâncias dentro dos grupos, não explicada SQ=MQ . Grau de liberdade. MQ = Produto de (C ou L) pela Variância de cada fator = variância explicada pelo fator. Entre grupos:77,4=5x15,5; Dentro dos grupos:0,55=média das variâncias de cada grupo F calculado= = MQ entre grupos / MQ dentro dos grupos Prob. de F calculado F de alfa critico = 0.05 (especificado pelo usuário) Excel ANOVA um fator

Excel ANOVA dois fatores

ANOVA one way no Statistica Labs Amostras VALORES 1 A 48.4 2 49.7 3 48.7 4 48.5 5 47.7 6 B 56.1 7 56.3 8 56.9 9 57.6 10 55.1 11 C 52.1 12 51.1 13 51.6 14 15

ANOVA one way no Statistica Alguns Resultados

ANOVA one way no Statistica Se posso rejeitar H0, quais são os laborató-rios diferentes? Todos os laborató-rios têm desempe-nhos diferentes (α ≤ 0,01)

ANOVA de um fator rejeitou H0 com α < 0,001 Conteúdo de CO2(%) em quatro fumarolas ANOVA one way no Statistica CO2 Fumarola 1 27 2 28 3 31 4 32 5 33 6 7 34 8 35 9 36 10 39 11 40 12 30 13 38 14 42 15 43 16 17 20 18 21 19 26 29 22 ANOVA de um fator rejeitou H0 com α < 0,001 Se posso rejeitar H0, quais são as fumarolas diferentes? TUKEY: As fumarolas 2 e 3 têm CO2 diferente da fumarola 4 Rock, 1986, Tab. 11.2

ANOVA two way no Statistica Labs Reagente Valores 1 D 56.7 2 45.7 3 48.6 4 54.6 5 37.7 6 E 64.5 7 53.4 8 52.3 9 57.5 10 52.6 11 F 12 50.6 13 49.5 14 56.5 15 44.7 ANOVA two way no Statistica

ANOVA não-paramétrica no Statistica Teste de Kruskal Wallis e Teste entre Medianas

Nonparametrics Statistics Kruskal-Wallis ANOVA by Ranks and Median Test Tradução livre de Statistica v. 7.1® Ambos os testes são alternativas não-paramétricas para o teste ANOVA de um fator. É necessário que o BD contenha variáveis código (codes) que identifiquem univocamente cada membro dos grupos em comparação.

Premissas e Interpretações: O “Teste Kruskal-Wallis ANOVA por postos” assume que a variável é contínua e medida, pelo menos, em escala ordinal. Ele avalia a hipótese de que as diferentes amostras foram extraídas da mesma distribuição, ou de distribuições que têm a mesma MEDIANA. Portanto, sua interpretação é, basicamente, a mesma do teste ANOVA, exceto porque ele compara postos ao invés de médias.

Premissas e Interpretações: O Teste da Mediana é uma versão mais “crua” do Kruskal-Wallis ANOVA. Ele simplesmente conta o número de casos, em cada grupo, que estão abaixo ou acima da mediana comum e computa o valor de χ2 numa tabela de contingência 2 x k. Sob a hipótese de nulidade (todas as amostras originam-se de populações com medianas idênticas), espera-se que, aproximadamente 50% de todos os casos, em cada amostra, fiquem abaixo (ou acima) da mediana comum. O Teste de Medianas é particularmente útil quando a escala contém limites artificiais, de modo que muitos casos caem “fora da escala”. Nesta situação, o Teste da Mediana é, de fato, o único teste apropriado para comparar amostras.

A probabilidade de um H=12,6 sob H0 é muito pequena A probabilidade de um H=12,6 sob H0 é muito pequena. Rejeito H0: as fumarolas têm medianas diferentes