Capítulo 8 Inferências com Base em Duas Amostras ESTATÍSTICA APLICADA Capítulo 8 Inferências com Base em Duas Amostras Prof. Paulo Renato de Morais
Amostragem Independente e Dependente 9 26
Amostragem Independente e Dependente 1. Fontes de dados diferentes Não relacionadas Independentes 1. Mesma fonte de dados Pares Medidas repetidas (antes/depois) Matching Match according to some characteristic of interest. Repeated Measures Assumes the same individual behaves similarly under both treatments except for treatment effect. Any difference will be due to treatment effect.
Amostragem Independente e Dependente 1. Fontes de dados diferentes Não relacionadas Independentes 2. Usa diferença entre as 2 médias amostrais X1 -X2 1. Mesma fonte de dados Pares Medidas repetidas (antes/depois) 2. Usa diferença entre cada par de observações Dn = X1n - X2n Matching Match according to some characteristic of interest. Repeated Measures Assumes the same individual behaves similarly under both treatments except for treatment effect. Any difference will be due to treatment effect.
Exemplos de Populações Independentes 1. Um dentista deseja determinar se há diferença no número médio de cáries em 2 grupos de classes sociais diferentes. 2. O Ministério da Educação deseja comparar as notas no Provão entre alunos de universidades públicas e privadas. These are comparative studies. The general purpose of comparative studies is to establish similarities or to detect and measure differences between populations. The populations can be (1) existing populations or (2) hypothetical populations.
Exemplos de Populações Dependentes 1. A Nike deseja verificar se há diferença na durabilidade de 2 materiais para sola. Um tipo é colocado em um dos pés do tênis, o outro tipo é colocado no outro pé do mesmo par de tênis. 2. Uma universidade deseja comparar as notas de alunos em um simulado do Provão antes e depois de um curso de revisão.
Testando Duas Médias Populacionais Dependentes Experimentos de Pares 9 26
Teste para Diferença de Médias para Amostras aos Pares 1. Testa médias de 2 populações relacionadas Pares Medidas repetidas (antes/depois) 2. Elimina variação entre elementos 3. Hipóteses: Amostras aleatórias independentes Ambas populações com distribuição normal (caso de pequenas amostras somente)
Tabela de Coleta de Dados para Teste de Amostras aos Pares Observação Grupo 1 Grupo 2 Diferença 1 x x D = x -x 11 21 1 11 21 2 x x D = x -x 12 22 2 12 22 ... ... ... ... i x x D = x - x 1i 2i i 1i 2i ... ... ... ... n x x D = x - x 1n 2n n 1n 2n
Teste t para Amostras aos Pares xD S n D gl n 1 D Just take the mean and standard deviation of the difference. SD is simply the standard deviation. The formula is the computational formula. x D n i 1 S D n i 2 1 Média Amostral Desvio Padrão Amostral
Exemplo de Teste t para Amostras aos Pares Você deseja saber se um programa de treinamento foi efetivo. Você coletou as seguintes notas de um teste padrão: Nome Antes (A) Depois (B) Samuel 85 94 Tadeu 94 87 Bruno 78 79 Marcos 87 88 Ao nível de 0,10, o treinamento foi efetivo?
Tabela de Cálculos Observação Antes Depois Diferença Samuel 85 94 -9 Tadeu 94 87 7 Bruno 78 79 -1 Marcos 87 88 -1 Total - 4
Solução da Hipótese Nula 1. O treinamento foi efetivo? 2. Efetivo significa ‘Depois’ > ‘Antes’. 3. Estatisticamente, significa B > A. 4. Rearranjando termos, dá 0 A - B. 5. Definindo D = A - B e substituindo em (4), dá 0 D ou D . 6. A hipótese alternativa é H1: D 0.
Solução do Teste t para Amostras aos Pares H0: D = 0 (D = A - B) H1: D < 0 = 0,10 gl = 4 - 1 = 3 Valor Crítico: Estatística de Teste: Decisão: Conclusão: x D 1 D t , 306 S 6 , 53 D n 4 D Reject Não rejeitar com = 0,10 .10 Não há evidência que treinamento foi efetivo -1.6377 t
Caso de Amostras Grandes Estimação por Intervalo: Diferença de Duas Médias Populacionais Independentes Caso de Amostras Grandes 9 26
Intervalo de Confiança para Amostras Grandes 1. Hipóteses: Amostras aleatórias independentes Tamanho de ambas as amostras no mínimo 30 (n1 30 e n2 30 ) Se 1 e 2 desconhecidos, use dados amostrais
Intervalo de Confiança para Amostras Grandes 1. Hipóteses: Amostras aleatórias independentes Tamanho de ambas as amostras no mínimo 30 (n1 30 e n2 30 ) Se 1 e 2 desconhecidos, use dados amostrais 2. Intervalo de confiança para 1 - 2:
Exemplo de Estimação de Duas Médias (Amostras Grandes) Usando os seguintes dados sobre preços de automóveis, construa um intervalo com 95% de confiança para a diferença entre os preços médios populacionais. 49
Solução do Exemplo de Estimação 49
Testando Duas Médias Populacionais Independentes Teste Z para Amostras Grandes 9 26
Teste Z de Duas Médias Independentes (Amostra Grande) 1. Hipóteses: Amostras aleatórias independentes Tamanho de ambas as amostras no mínimo 30 (n1 30 e n2 30 )
Teste Z para Duas Médias Independentes (Amostra Grande) 1. Hipóteses: Amostras aleatórias independentes Tamanho de ambas as amostras no mínimo 30 (n1 30 e n2 30 ) 2. Teste Z para duas amostras independentes: Z (X X ) n 1 2 s
Exemplo de Teste Z para Amostras Grandes Você é um analista financeiro. Você deseja saber se há diferença nos rendimentos em dividendos entre ações listadas no NYSE e NASDAQ. Você coletou os seguintes dados: NYSE NASDAQ Número 121 125 Média 3,27 2,53 Desv. Pad. 1,30 1,16 Há diferença no rendimento médio ( = 0,05)? © 1984-1994 T/Maker Co.
Solução do Teste Z para Amostras Grandes H0: 1 - 2 = 0 (1 = 2) H1: 1 - 2 0 (1 2) 0,05 n1 = 121, n2 = 125 Valores Críticos: Estatística de Teste: Decisão: Conclusão: 3 , 27 2 , 53 z 4 , 69 1 , 698 1 , 353 121 125 Reject H Reject H Rejeitar com = 0,05 .025 .025 Há evidência de diferença nas médias z -1.96 1.96
Comparando 2 Variâncias Populacionais Independentes: Teste F 9 26
Teste F para Duas Variâncias 1. Testa a diferença entre 2 variâncias populacionais 2. Hipóteses Ambas populações são normalmente distribuídas Teste não é robusto quanto a violações Amostras aleatórias independentes Key words that show a test on variances, not on means or proportions: variance, standard deviation, variability, variation, scatter, dispersion.
Teste F para Variâncias: Hipóteses e Estatística de Teste H0: 12 = 22 OU H0: 12 22 H1: 12 22 H1: 12 22 (ou >) 2. Estatística de teste F = s12 /s22 Dois conjuntos de graus de liberdade 1 = n1 - 1; 2 = n2 - 1 Segue a distribuição F F ratio is a statistic defined as the ratio of 2 independent estimates of a normally distributed population’s variance. Note: degrees of freedom refer to numerator and denominator
Teste F para 2 Variâncias: Valores Críticos The lower F is not the reciprocal of the upper F. What do you do if equal sample sizes? F 66
Teste F para 2 Variâncias: Valores Críticos Rejeita H Rejeita H The lower F is not the reciprocal of the upper F. What do you do if equal sample sizes? F 66
Teste F para 2 Variâncias: Valores Críticos The lower F is not the reciprocal of the upper F. What do you do if equal sample sizes? 66
Teste F para 2 Variâncias: Valores Críticos The lower F is not the reciprocal of the upper F. What do you do if equal sample sizes? /2 /2 66
Teste F para 2 Variâncias: Valores Críticos The lower F is not the reciprocal of the upper F. What do you do if equal sample sizes? /2 /2 66
Teste F para 2 Variâncias: Valores Críticos The lower F is not the reciprocal of the upper F. What do you do if equal sample sizes? /2 /2 Note! 66
Exemplo de Teste F para Variâncias Você é um analista financeiro. Você deseja comparar dividendos de ações listadas na NYSE e na NASDAQ. Você coletou os seguintes dados: NYSE NASDAQ Número 21 25 Média 3,27 2,53 Desv. Pad. 1,30 1,16 Há diferença de variâncias entre a NYSE e a NASDAQ ao nível de 0,05? © 1984-1994 T/Maker Co.
Solução do Teste F para 2 Variâncias H0: 12 = 22 H1: 12 22 1 2 Valores Críticos: Estatística de Teste: Decisão: Conclusão: 68
Solução do Teste F para 2 Variâncias H0: 12 = 22 H1: 12 22 0,05 1 20 2 24 Valores Críticos: Estatística de Teste: Decisão: Conclusão: 68
Solução do Teste F para 2 Variâncias /2 = 0,025 /2 = 0,025 69
Solução do Teste F para 2 Variâncias H0: 12 = 22 H1: 12 22 0,05 1 20 2 24 Valores Críticos: Estatística de Teste: Decisão: Conclusão: 68
Solução do Teste F para 2 Variâncias H0: 12 = 22 H1: 12 22 0,05 1 20 2 24 Valores Críticos: Estatística de Teste: Decisão: Conclusão: 68
Solução do Teste F para 2 Variâncias H0: 12 = 22 H1: 12 22 0,05 1 20 2 24 Valores Críticos: Estatística de Teste: Decisão: Conclusão: Não rejeitar com = 0,05 68
Solução do Teste F para 2 Variâncias H0: 12 = 22 H1: 12 22 0,05 1 20 2 24 Valores Críticos: Estatística de Teste: Decisão: Conclusão: Não rejeitar com = 0,05 Não há evidência de diferença nas variâncias 68
Questão Você é um analista para a companhia de luz. Você deseja comparar o consumo de eletricidade de casas em 2 cidades. Você obteve os seguintes dados de uma amostra de casas: Cidade 1 Cidade 2 Número 25 21 Média $ 85 $ 68 Desv. Pad. $ 30 $ 18 Ao nível de 0,05, há evidência de diferença nas variâncias das duas cidades? Allow students about 15 minutes to solve this.
Solução H0: H1: 1 24 2 Valores Críticos: 1 24 2 Valores Críticos: Estatística de Teste: Decisão: Conclusão: 72
Solução H0: 12 = 22 H1: 12 22 0,05 1 24 2 20 1 24 2 20 Valores Críticos: Estatística de Teste: Decisão: Conclusão: 72
Solução /2 = 0,025 /2 = 0,025 73
Solução H0: 12 = 22 H1: 12 22 0,05 1 24 2 20 1 24 2 20 Valores Críticos: Estatística de Teste: Decisão: Conclusão: 72
Solução H0: 12 = 22 H1: 12 22 0,05 1 24 2 20 1 24 2 20 Valores Críticos: Estatística de Teste: Decisão: Conclusão: 72
Solução H0: 12 = 22 H1: 12 22 0,05 1 24 2 20 1 24 2 20 Valores Críticos: Estatística de Teste: Decisão: Conclusão: Rejeitar com = 0,05 72
Solução H0: 12 = 22 H1: 12 22 0,05 1 24 2 20 1 24 2 20 Valores Críticos: Estatística de Teste: Decisão: Conclusão: Rejeitar com = 0,05 Há evidência de diferença nas variâncias 72
Testando as Médias de Duas Populações Independentes Teste t para Amostras Pequenas 9 26
Teste t para Duas Médias Independentes (Amostra Pequena) 1. Testa médias de 2 populações independentes com variâncias iguais 2. Hipóteses: Tamanho de ao menos uma das amostras menor que 30 Amostras aleatórias independentes Ambas populações com distribuição normal Variâncias populacionais são desconhecidas mas supostas iguais
Teste t para Amostras Pequenas Diferença suposta 39
Exemplo de Teste t para Amostras Pequenas Você é um analista financeiro. Você deseja saber se há diferença nos rendimentos em dividendos entre ações listadas no NYSE e NASDAQ. Você coletou os seguintes dados: NYSE NASDAQ Número 21 25 Média 3,27 2,53 Desv. Pad. 1,30 1,16 Supondo populações normais, há diferença no rendimento médio ( = 0,05)? © 1984-1994 T/Maker Co.
Solução do Teste t para Amostras Pequenas 42
Solução do Teste t para Amostras Pequenas H0: 1 - 2 = 0 (1 = 2) Ha: 1 - 2 0 (1 2) 0,05 gl 21 + 25 - 2 = 44 Valores Críticos: Estatística de Teste: Decisão: Conclusão: Rejeitar com = 0,05 Há evidência de diferença nas médias 41
Teste Z para Diferenças entre Duas Proporções 9 26
Teste Z para Diferença entre Duas Proporções 1. Hipóteses: Populações são independentes Populações seguem distribuição binomial Aproximação pela Normal pode ser usada não contém 0 ou n
Teste Z para Diferença entre Duas Proporções 1. Hipóteses: Populações são independentes Populações seguem distribuição binomial Aproximação pela Normal pode ser usada não contém 0 ou n 2. Teste Z para duas proporções:
Exemplo de Teste Z para Duas Proporções Você quer testar a percepção de justiça de dois métodos de avaliação de desempenho. 63 de 78 empregados acharam o Método 1 justo. 49 de 82 acharam o Método 2 justo. Ao nível de 0,01, há diferença nas percepções? To check assumptions, use sample proportions as estimators of population proportion: n1·p = 78·63/78 = 63 n1·(1-p) = 78·(1-63/78) = 15
Solução do Teste Z para Duas Proporções 12
Solução do Teste Z para Duas Proporções H0: p1 - p2 = 0 H1: p1 - p2 0 = 0,01 n1 = 78 n2 = 82 Valores Críticos: Estatística de Teste: Decisão: Conclusão: Rejeitar com = 0,01 Há evidência de diferença nas proporções 11