2.5 INFERÊNCIAS SOBRE A DIFERENÇA NAS MÉDIAS, COMPARAÇÕES EMPARELHADAS

Slides:



Advertisements
Apresentações semelhantes
Escola Politécnica de Pernambuco Departamento de Ensino Básico
Advertisements

Análise Estatística Testes de Hipóteses.
DISTRIBUIÇÕES AMOSTRAIS
Aprendizado de Máquina
Estatística amintas paiva afonso.
Analise de Regressão Parte 2.
CAPÍTULO 7 TESTE DE HIPÓTESE
Intervalos de Confiança
TESTE PARA ESTRUTURA ESPECIAL DE CORRELAÇÃO
ANÁLISE DISCRIMINANTE
Q-Q plots Construídos a partir das distribuições marginais de cada componente do vetor p-variado. São de fato um gráfico do quantil amostral versus quantil.
Blocos aleatorizados, quadrados latinos e experimentos relacionados
Cássio Luís Fernandes de Oliveira
CAPÍTULO 7 TESTE DE HIPÓTESE
ESTIMAÇÃO.
Capítulo 8 Inferências com Base em Duas Amostras
Estatística: Aplicação ao Sensoriamento Remoto ANO 2010
Distribuição F Considere duas populações com distribuição de Gauss com médias 1, 2 e variâncias 12 e 22 . Retire uma amostra aleatória de tamanho.
ESTATÍSTICA.
TESTE DE HIPÓTESES PARA A MÉDIA POPULACIONAL 
ANOVA Prof. Herondino.
J. Landeira-Fernandez Ética e Ciência
ESTATÍSTICA.
Análise da Regressão múltipla: Inferência Revisão da graduação
Sérgio Mário Lins Galdino
ME623A Planejamento e Pesquisa. Não Interação no Modelo de 2 Fatores A presença de interação tem um impacto na interpretação dos dados No entanto, se.
ME623 Planejamento e Pesquisa
ME623 Planejamento e Pesquisa
ME623A Planejamento e Pesquisa
ME623A Planejamento e Pesquisa
4. Experimentos em Blocos
ME623 Planejamento e Pesquisa
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2014 Intervalo de Confiança Camilo Daleles Rennó
Teste de Hipóteses de uma amostra Prof. Helcio Rocha
Estatística e Probabilidade
DISTRIBUIÇÕES AMOSTRAIS
Estatística Para um dado conjunto de dados, podemos calcular as seguintes grandezas: 1) Medidas de posição 2) Medidas de dispersão 3) Parâmetros de simetria.
Modelagem Estatística
Teste de Hipóteses para a média, caso da pequena amostra
Diogo Fernando Bornancin Costa Fábio de H.C.R. dos Santos
Profº: Glauco Vieira de Oliveira AGR/ICET/CUA/UFMT
PLANEJAMENTO DO EXPERIMENTO
Aula 5 - Método experimental ou de seleção aleatória
Análise de Incertezas Introdução.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Intervalo de Confiança Camilo Daleles Rennó
Noções de Inferência Estatística
Estatística e Probabilidade
Teste de Hipóteses Pontos mais importantes: -objectivo
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Análise de Variância (ANOVA) Camilo Daleles Rennó
UFSC.PósMCI.FME.Inferências Envolvendo Variâncias. (8.1) 6 Inferências Envolvendo Variâncias.
... Blocos Aleatorizados AMOSTRAS INDEPENDENTES DADOS PAREADOS y11 y12
Regressão e Previsão Numérica.
Universidade Federal Fluminense Faculdade de Medicina Mestrado Profissional em Saúde Materno-Infantil 2011 BIOESTATÍSTICA-aula 2 Prof. Cristina Ortiz Valete.
ERROS E TRATAMENTO DE DADOS ANALÍTICOS
Estimativas de grandezas cap 2. e cap 3 Média Desvio Padrão e Variância Definições importantes Distribuição Normal Teorema do limite central Hipóteses.
Aula 6. Delineamento amostral
Aula 4 – Estatística- Conceitos básicos
ME623A Planejamento e Pesquisa
Testes de Hipóteses.
Prof. Marllus Gustavo Ferreira Passos das Neves
Métodos Estatísticos Aplicados às Ciências Biológicas - 7ª aula -
Estimação: Estimativa Pontual Estimativa Intervalar
GESTÃO E GARANTIA DA QUALIDADE
Estimação e Intervalo de Confiança. Estimação Frequentemente necessitamos, por meio das amostras, conhecer informações gerais da população. A estimação.
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
Estatística Aplicada - Componente Prática Ensaio de hipóteses estatísticas Ensaio para µ com  2 conhecido e desconhecido.
INTERVALO DE CONFIANÇA PARA A MEDIA POPULACIONAL (σ 2 desconhecido ) Sabemos que se o tamanho da amostra for superior a 30 a distribuição amostral das.
Revisão de Estatística Parte II J M Fernandes. Amostras estatísticas para parâmetros populacionais Assumir que a distribuição é normal X~N(µ(σ 2 )) Gerar.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Teste de Hipótese Camilo Daleles Rennó
Como construir modelos empíricos. Nos modelos estudados, cada fator foi fixado em dois níveis Por esta razão temos que nos contentar com uma visão limitada.
Transcrição da apresentação:

2.5 INFERÊNCIAS SOBRE A DIFERENÇA NAS MÉDIAS, COMPARAÇÕES EMPARELHADAS

2.5.1 O problema da comparação emparelhada/pareada Exemplo: Considere uma máquina de teste de resistência que pressiona uma vareta com uma ponta fina em um metal com uma força conhecida. Medindo o comprimento da depressão causada pela vareta, a resistência do metal é determinada. Dois tipos de vareta estão disponíveis para a máquina e, apesar da variabilidade das medidas feitas pelos dois tipos de vareta parecerem ser a mesma, suspeita-se que uma vareta produz leituras de resistência média diferente da outra.

2.5.1 O problema da comparação emparelhada Um experimento pode ser realizado da seguinte forma: SELECIONE aleatoriamente n peças do metal. TESTE metade dessas peças com a vareta tipo 1 e, a outra metade, com a vareta tipo 2. Designe cada peça a uma vareta de forma aleatória. Esse é um planejamento completamente aleatorizado. Portanto, a resistência média das duas amostras pode ser comparada via teste-t para duas amostras.

2.5.1 O problema da comparação emparelhada Uma pequena reflexão revelará uma séria desvantagem do experimento completamente aleatorizado para esse problema. Suponha que as espécies de metal não são exatamente homogêneas e os resultados da análise poderão ser afetados por essa fonte de variação (ruído) que não é de interesse no estudo. Essa falta de homogeneidade contribuirá para a variabilidade das medidas de resistência e tenderá a inflacionar a variância do erro experimental, tornando assim mais difícil detectar uma real diferença entre as resistências às varetas.

2.5.1 O problema da comparação emparelhada plano experimental alternativo Suponha que cada peça é grande o suficiente tal que duas determinações de resistência sejam possíveis. O plano alternativo consiste em dividir cada peça em duas partes, e então, aleatoriamente, designar uma vareta para cada uma das partes. A ordem na qual as varetas seriam testadas para uma particular peça, também seria aleatória.

Exemplo: Dados de resistência peça Vareta_1 Vareta_2 1 7 6 2 3 5 4 8 9 10 Suponha a realização desse experimento com 10 peças. (dados na tabela ao lado). O modelo que descreve esses dados pode ser escrito na forma:

Exemplo: Dados de resistência - modelo

Exemplo: Dados de resistência - modelo Observe que se calculamos as diferenças emparelhadas o valor esperado dessa diferença é: Ou seja, podemos fazer inferência sobre a diferença na média das leituras de resistência das duas varetas μ1- μ2 fazendo inferência sobre a média das diferenças μd . Observe que o efeito adicional das peças se anula quando as observações estão emparelhadas dessa forma.

Exemplo: Dados de resistência - teste Observe que aqui o teste da hipótese de que as médias são iguais é equivalente ao teste da hipótese de que Ou seja, nesse caso, caímos no problema de um teste t para uma amostra, se olhamos as diferenças individuais como as observações independentes.

Exemplo: Dados de resistência - teste Nesse caso calculamos a média e variância amostrais dos dados, para depois calcular o valor da estatística t. Sob a hipótese nula, a estatística de teste tem distribuição t-de-Student com n-1 graus de liberdade tal que a região crítica do teste bilateral é dada por

Exemplo: Dados de resistência - teste O p-valor também pode ser facilmente obtido, calculando-se Exemplo de saída do R: One Sample t-test t= 0.2641, df = 9, p-value = 0.7976 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: -0.7564389 0.9564389 sample estimates: mean of x 0.1

Vantagens do plano de comparação emparelhada Esse tipo de plano ilustra o princípio de blocagem. De fato, ele é um caso especial de um experimento mais geral chamado experimento em blocos aleatorizado. O termo bloco refere-se a unidades experimentais relativamente homogêneas. (Nesse exemplo, as peças de metal são os blocos). Os blocos representam uma restrição sobre aleatorização completa, porque as combinações de tratamento somente são aleatorizadas dentro de cada bloco. (Cap. 4) Apesar de terem sido feitas 2n observações, somente n-1 graus de liberdade estão disponiveis para a estatistica t. (A medida que cresce o número de graus de liberdade, o teste t torna-se mais sensível.)

Vantagens do plano de comparação emparelhada Com blocagem ou pareamento, efetivamente “perde-se” n-1 graus de liberdade, mas espera-se um ganho num conhecimento melhor da situação, eliminando-se fonte de variabilidade adicional ( a diferença entre espécies nesse caso.) Podemos obter uma medida da qualidade da informação produzida do planejamento emparelhado comparando-se o desvio-padrão das diferenças (Sd) com o desvio padrão combinado, sob a hipótese de variâncias iguais (Sp). Nesse exemplo, Sd=1,20 e Sp=2,32.

Vantagens do plano de comparação emparelhada Geralmente, se não introduzimos a estratégia de blocos ou pareamento quando isso é necessário Sp2 será maior que Sd2 . Se pareamos as observações, é fácil mostrar que Sd2 é um estimador não viesado da variancia das diferenças djsob o modelo considerado. Porém, se não fazemos isso e tratamos as observações como duas amostras independentes, Sp2 será um estimador viesado da variância.

Vantagens do plano de comparação emparelhada De fato, supondo que ambas as variâncias são iguais, é possível mostrar que Ou seja, os efeitos de bloco, βj ‘s, inflacionam a estimativa da variância. Isso explica porque a blocagem é uma técnica de planejamento que visa a redução do ruído.

Intervalos de confiança para a diferença 1-2 Usando dados pareados tem-se Usando a análise supondo duas amostras independentes tem-se:

O intervalo de confiança sob observações pareadas é muito mais estreito que o sob amostras independentes. Blocagem nem sempre é a melhor estratégia de planejamento. Se a variabilidade dentro dos blocos é a mesma variabilidade entre blocos, a variância da diferença das médias amostrais será a mesma sem olhar a estratégia usada. De fato, blocagem sob essas condições seria uma escolha ruim de planejamento, pois resultaria na perda de n-1 graus de liberdade e acabaria levando a um intervalo mais largo. (Capítulo 4)

2.6 Inferência sobre variâncias na normal - revisão Do teorema fundamental da Inferência na normal, temos que

2.6 Inferência sobre variâncias na normal - revisão Assim, se a hipótese nula for verdadeira, segue que: e a região crítica do teste de nível de significância pode ser dada por

2.6 Inferência sobre variâncias na normal - revisão Um intervalo de confiança de 100(1-α)% para 2 é dado por

2.6 Comparação de variâncias Sob a hipótese nula, a razão das variâncias amostrais tem distribuição F com n1 -1 e n2 -1 graus de liberdade e uma região crítica para o teste de nível α de significância é dada por

Exercícios sugeridos do Capítulo 2 3,4,6,7,10,19,22,25,27,31,32,33,39 e 40 (sétima edição)