Amostragem e estimadores Prof. Elisson de Andrade eapandra@uol.com.br
EXERCÍCIO PRÁTICO
O diretor de sua empresa quer que você desenvolva o perfil médio de salário de 200 funcionários de sua empresa, ao redor do mundo – todos esses valores expressos em R$. Suponha que levantar esses 200 dados fosse uma tarefa árdua e que, para simplificar seu trabalho, você decidisse traçar esse perfil apenas colhendo uma amostra de 8 observações. A partir de agora, vamos compreender os DESAFIOS dessa sua tarefa.
Amostragem Temos uma amostra FINITA O indicado é fazer uma AMOSTRA PROBABILÍSTICA, em que cada amostra de tamanho n tem a mesma probabilidade de se selecionada É isso que iremos fazer agora, utilizando uma tabela de números aleatórios e o nosso problema de 200 funcionários
Suponha que vamos começar por aqui. A primeira coisa a fazer é escolher um par qualquer dentro dessa tabela. Suponha que vamos começar por aqui.
A partir desse ponto, vamos selecionar números de 3 algarismos e ir anotando. Nesse exemplo teríamos: 354 734 053 892 260 533 409 123 etc
Porém, como queremos selecionar 8 amostras de 1 a 200 funcionários, vamos sempre desconsiderando qualquer centena que fique acima de 200 No nosso exemplo, teríamos contabilizado apenas 3 observações, precisando continuar o exercício, até obter 8 números abaixo de 200: 354 734 053 892 260 533 409 123 etc
Agora, preciso que cada pessoa da classe faça esse processo, começando de um ponto qualquer, e obtenha uma amostra aleatória de 8 valores entre 1 e 200 OBS: se, por um acaso, entre esses 8 valores aparecer um número entre 1 e 200 REPETIDO, desconsiderar esse valor.
Anote os salários apenas dos 8 elementos de sua amostra. Uma vez que todos estão com 8 números aleatórios diferentes, vou apresentar uma tabela com o salário dos 200 funcionários. Anote os salários apenas dos 8 elementos de sua amostra.
Estimadores Uma vez que temos a amostra, podemos calcular a estatística amostral. Estimador da média populacional μ 𝑥 = 𝑥 𝑖 𝑛 Calcule o estimador 𝑥 para sua amostra de 8 dados.
Estimadores Estimador do desvio padrão amostral σ 𝑠= 𝑥 − 𝑥 𝑖 2 𝑛−1 𝑠= 𝑥 − 𝑥 𝑖 2 𝑛−1 Calcule o estimador 𝑠 para sua amostra de 8 dados.
Conclusões preliminares Todos vocês calcularam uma ESTIMATIVA PONTUAL de μ e σ Obviamente, cada um chegou a um valor diferente, pois cada um baseou-se numa amostra diferente ESTIMATIVA PONTUAL é uma forma de Inferência Estatística.
Conclusões preliminares Usamos amostragem para fazer inferências sobre parâmetros de uma população O grande desafio é conseguir fazer amostras que REALMENTE representem a população Mas antes de entrar a fundo sobre isso, continuemos nosso exercício
Planilha em Excel Vamos colocar em uma tabela de frequência, os valores de 𝑥 de todos os alunos
Conclusões Em qual intervalo apareceu o maior número de observações? Provavelmente: entre 𝑥 3556,34 e 3943,73 Sabe qual é a média verdadeira da população? μ = 3834,89 Veja que a DISTRIBUIÇÃO AMOSTRAL com o valor de todos os 𝑥 calculados, tende a uma distribuição Normal
Conclusões Pode-se demonstrar que: E( 𝑥 ) = μ Quando o valor esperado de um estimador pontual é igual ao parâmetro populacional, dizemos que o estimador pontual é NÃO VIESADO Para calcular o desvio padrão de 𝑥 : 𝜎 𝑥 = 𝜎 𝑛
Forma da Distribuição de 𝑥 Tanto faz se a distribuição da POPULAÇÃO é normal ou não Teorema do limite central: Ao selecionar amostras aleatórias de tamanho n a partir de uma população, a distribuição amostral de 𝑥 se aproxima de uma distribuição normal à medida que n se torna grande
Voltando ao exercício dos salários Não sabemos a distribuição de probabilidade dos salários (população), mas sabemos que 𝑥 tem dist. Normal (para n grande) Mas agora vamos mudar nosso olhar para a SUA observação de 8 dados Como nós temos os valores de μ e σ da POPULAÇÃO: E( 𝑥 ) = μ, logo E( 𝑥 ) = 3834,88 𝜎 𝑥 = 𝜎 𝑛 , logo 𝜎 𝑥 = 1000,27 8 =353,63 Ou seja, dado que SABEMOS os parâmetros da população, conseguirmos estimar média e desvio de uma amostra de tamanho 8 (lembre-se, em geral, não temos os dados da população)
Tamanho da Amostra Portanto, e se aumentássemos o número da amostra para 30 observações? Novos parâmetros: E( 𝑥 ) = 3834,88 e 𝜎 𝑥 =182,62 Vamos recalcular a nova chance de seu 𝑥 estar entre 3634,88 e 4034,88? P(0< z <1,095) = P(-1,095< z <0) = 2. P(0< z <1,095) = 2 . 0,3621 = 72,42% Conclusão Preliminar: ao utilizar uma amostra maior, as chances do 𝑥 calculado com 30 observações estar no intervalo desejado sobe para 72,42%
EXERCÍCIO
Exercício 1 O salário médio do país A é de R$168 mil no ano, e do país B de R$117 mil. Os desvios são: Pais A σ = R$40 mil e País B σ = R$25 mil Qual a probabilidade de uma amostra de 40 pessoas do País B produzir uma média dentro do intervalo de R$R$10 mil ao redor da média populacional? E( 𝑥 ) = 168 e 𝜎 𝑥 = 40000 40 =6324,55 P(0< z <1,58) = P(-1,58< z <0) = 2. P(0< z <1,58) = 2 . 0,4429 = 88,58%
Exercício 2 O salário médio do país A é de R$168 mil no ano, e do país B de R$117 mil. Os desvios são: Pais A σ = R$40 mil e País B σ = R$25 mil Qual a probabilidade de uma amostra de 40 pessoas do País A produzir uma média dentro do intervalo de R$R$10 mil ao redor da média populacional? E( 𝑥 ) = 117 e 𝜎 𝑥 = 25000 40 =3952,84 P(0< z <2,53) = P(-2,53< z <0) = 2. P(0< z <2,53) = 2 . 0,4943 = 98,86%
Fazer 4 exercícios da lista que está no site obs: não fazer exercícios do Hoffmann