Prof. Dr. Adolpho Walter Pimazoni Canton Faculdade de Economia, Administração e Contabilidade da Universidade de São Paulo Amostragem Prof. Dr. Adolpho Walter Pimazoni Canton
Censo
O Censo é um levantamento de informações relacionadas a todos os elementos de uma determinada população.
De acordo com o IBGE: A palavra censo vem do latim census e quer dizer "conjunto dos dados estatísticos dos habitantes de uma cidade, província, estado, nação". O Censo é a única pesquisa que visita todos os domicílios brasileiros.
Na Roma Antiga era realizado o censo para mapear os proprietários de terras e determinar o pagamento dos impostos.
População
População A população é formada por todas as observações do universo de referência. O tamanho da população será denotado por N.
Algumas populações são consideradas finitas e outras populações são consideradas infinitas. Populações finitas são aquelas que podem ser quantificadas numericamente. Populações infinitas são aquelas que não podem ser quantificadas numericamente.
Exemplos de população finita Os clientes do Banco Itaú. Os alunos da Faculdade de Economia, Administração e Contabilidade da Universidade de São Paulo.
Exemplos de população infinita As Populações infinitas são geradas por um processo contínuo em que os elementos da população são gerados indefinidamente. O número de bactérias em uma colônia de bactérias. O número de habitantes do planeta.
Amostra
Alguns métodos Probabilisticos de Amostragem Amostra Aleatória Simples Amostra Aleatória Sistemática Amostra Aleatória Estratificada
Amostra Aleatória Simples
Determinação do Tamanho da Amostra para estimação de MÉDIA considerando uma Amostragem Aleatória Simples
Qual o valor de n ? Para a obtenção do valor de n é necessário definir a confiança a ser utilizada. Geralmente considera-se 95 % de confiança. A média amostral possui distribuição Normal quando são selecionados pelo menos 30 elementos. Desta forma, o valor que gera uma confiança de 95 % será obtido por meio da Distribuição Normal Padrão (Z=1,96). 1,96 -1,96 95 %
Qual o valor de n ? Caso o objetivo seja considerar 90 % de confiança o valor obtido por meio da distribuição Normal Padrão é Z=1,64. 1,64 -1,64 90 %
Qual o valor de n ? Para a obtenção do valor de n é necessário definir a margem de erro (ME) do estudo. A margem de erro (ME) é a diferença esperada entre o valor do parâmetro populacional e o valor obtido com a média amostral .
Qual o valor de n ? Exemplo de margem de erro Considere a afirmação: Uma pesquisa indica que o ganho mensal médio dos habitantes de uma comunidade é R$ 1200,00 com uma margem de erro de R$ 200,00, para uma confiança de 95 %. Esta afirmação quer dizer que com 95 % de probabilidade o verdadeiro ganho mensal médio dos habitantes da comunidade pode ser um valor entre R$ 1.000,00 e R$ 1.400,00.
Como a população da comunidade é finita e pretende-se estimar a média populacional o tamanho da amostra a ser retirada é dado pela expressão. Em que : ME é a margem de erro do estudo; Z é o valor da Distribuição Normal que fornece a confiança desejada; N é o tamanho da população; S2 é a variância estimada em uma amostra piloto.
Deseja-se estimar o ganho mensal médio dos habitantes de uma determinada comunidade. Seja N=15.000 o número de habitantes da comunidade que possuem ganho mensal. Considere que a margem de erro (ME) é R$ 100,00. Considere 95 % de confiança. Desta forma, o valor obtido por meio da Distribuição Normal Padrão é Z=1,96.
Inicialmente deve-se extrair uma amostra piloto para obter o valor de S2. Suponha que neste exemplo, foi extraída uma amostra piloto e originou um desvio padrão S=500. Desta forma, S2=250.000. O tamanho da amostra é dado por:
Determinação do Tamanho da Amostra, para estimação de MÉDIA , para População Infinita considerando um amostra aleatória simples
Quando a população é muito grande (infinita) e pretende-se estimar a média populacional o tamanho da amostra a ser retirada é dado pela expressão. Em que : ME é a margem de erro do estudo Z é o valor da Distribuição Normal que fornece a confiança desejada S2 é a variância estimada por uma amostra piloto.
Amostra Aleatória Simples Tamanho da Amostra Amostra Aleatória Simples
Estimação de Proporção
População Finita
Para estimar a proporção amostral de pessoas com intenção em votar em um determinado candidato, por meio de uma amostra aleatória simples, o tamanho da amostra, considerando população finita, é dado por:
População Infinita
Tamanho da Amostra, para estimação de proporção, para População INFINITA, considerando uma amostra aleatória simples
Quando a população é muito grande (infinita) e pretende-se estimar uma proporção, considerando a margem de erro máxima, o tamanho da amostra a ser retirada é dado pela expressão. Em que : ME é a margem de erro do estudo; Z é o valor da Distribuição Normal que fornece a confiança desejada.
Amostra Aleatória Sistemática
A amostragem aleatória sistemática é um esquema amostral em que os elementos são selecionados a partir de um critério que é aplicado a toda a população de forma sistemática.
Pode-se por exemplo selecionar um elemento a cada dois elementos da população.
Quando se deseja extrair uma amostra sistemática de tamanho n de uma população de tamanho N, deve-se amostrar um elemento a cada para daelementos da população.
Exemplo: Deseja-se obter uma amostra sistemática de n=2.000 clientes de uma base de dados de N=12.000 clientes de uma empresa. Como deve-se selecionar sistematicamente de 6 em 6 clientes.
Procedimento: Deve-se ordenar a base de dados populacional por algum critério. Por exemplo ordenar a base por idade, renda, tempo de relacionamento. 2. Deve-se selecionar aleatoriamente um elemento dos primeiros elementos da lista populacional. Suponha que entre os 6 primeiros elementos o elemento selecionado foi o terceiro. 3. De forma sistemática deve-se selecionar os elementos de 6 em 6 a partir do terceiro elemento. Sorteado Aleatoriamente entre os 6 primeiros
Amostra Aleatória Estratificada
População Finita
Deve-se extrair uma amostra estratificada quando a população é composta por estratos.
Gasto Médio de Famílias com Cartão de Crédito em um Supermercado Exemplo Gasto Médio de Famílias com Cartão de Crédito em um Supermercado
Suponha que deseja-se estimar o gasto médio com cartão de crédito dos clientes em um supermercado. Suponha que a população é composta por três estratos. Considere o Estrato 1 os usuários do Mastercard, o Estrato 2 os usuários do Visa e o Estrato 3 os usuários do American Express.
Suponha que a população é composta por: Estrato 1 N1= 8.000 usuários do cartão Mastercard Estrato 2 N2= 7.000 usuários do cartão Visa Estrato 3 N3=2.000 usuários do American Express
A população de clientes é distribuída da seguinte forma: W1 W2 W3
Para estimar o gasto médio com cartão de crédito dos clientes no supermercado suponha que o gerente de Marketing retirou uma amostra estratificada de n=1.500 clientes distribuída da seguinte forma Amostra do Estrato 1 n1=705 usuários do cartão Mastercard Amostra do Estrato 2 n2=617 usuários do cartão Visa Amostra do Estrato 3 n3=178 usuários do American Express
Com base na amostra obteve-se o valor gasto médio: Amostra do Estrato 1 - n1=705 Gasto médio = R$ 650,00 Amostra do Estrato 2 - n2=617 Gasto médio = R$ 450,00 Amostra do Estrato 3 - n3=178 Gasto médio = R$ 1250,00
O estimador da média populacional, calculado por meio da amostragem estratificada, é dado por:
A Tabela apresenta o peso de cada estrato e a média amostral do gasto médio do cliente em cada estrato. A média populacional estimada é dado por:
Neste exemplo pode-se concluir que em média os clientes gastam com o cartão de crédito R$ 650,00.
Alguns clientes gastam no cartão de crédito mais do que R$ 650,00 e outros gastam menos do que R$ 650,00. Qual o desvio padrão do gasto em cartão de crédito ?
Para cada estrato pode-se obter a variância e o desvio padrão do gasto do cliente. Amostra do Estrato 1 Variância = R$ 2.500,00 Desvio padrão = R$ 50,00 Amostra do Estrato 2 Variância = R$ 6.400,00 Desvio padrão = R$ 80,00 Amostra do Estrato 3 Variância = R$ 12.100,00 Desvio padrão = R$ 110,00
A variância de é dada por: O desvio padrão é obtido por meio da raiz quadrada da variância.
A variância de é dada por: 1,89 + 4,22 + 2,33 = 8,44
A variância de = 8,44 O desvio padrão de =
A estimativa por intervalo, com 95 % de confiança, para a média populacional é dada por: (desvio padrão de )
A estimativa por intervalo, com 95 % de confiança, para o gasto médio dos clientes é dada por: (desvio padrão de ) Com 95 % de confiança, para o verdadeiro gasto médio dos clientes está entre 644,31 e 655,69.
Tamanho da Amostra, para estimação de MÉDIA , para População Finita considerando um amostra aleatória estratificada
Alocação Proporcional
, d é a margem de erro, , D é o desvio padrão da média O tamanho da amostra a ser retirada quando a população é finita, considerando três estratos, é dado pela expressão. Em que : , d é a margem de erro, , D é o desvio padrão da média Z é o valor da Distribuição Normal que fornece a confiança desejada; N é o tamanho da população e N1, N2, N3 é o tamanho dos estratos na população; são as variâncias amostrais dos estratos a serem estimadas por uma amostra piloto.
O tamanho da amostra a ser retirada em cada estrato, quando a população é finita, é dado pela expressão. Em que : N é o tamanho da população; n é o tamanho da amostra; N1, N2, N3 é o tamanho dos estratos na população;
Tamanho da Amostra, para estimação de MÉDIA , para População Finita e Infinita considerando um amostra aleatória estratificada
Alocação de Neyman
O tamanho da amostra a ser retirada quando a população é finita, considerando três estratos, é dado pela expressão. d é a margem de erro Em que : , d é a margem de erro, , D é o desvio padrão da média Z é o valor da Distribuição Normal que fornece a confiança desejada; N é o tamanho da população e N1, N2, N3 é o tamanho dos estratos na população; são as variâncias amostrais dos estratos a serem estimadas por uma amostra piloto.
O tamanho da amostra a ser retirada em cada estrato, quando a população é finita, é dado pela expressão. Em que : N é o tamanho da população; n é o tamanho da amostra; N1, N2, N3 é o tamanho dos estratos na população;
1 - Considere uma instituição financeira que deseja obter o tamanho da amostra para estimar a renda de pessoas economicamente ativas de dos 3 maiores municípios de São Paulo. Considere uma precisão de R$ 500,00. Considerar a alocação de Neyman e obter o tamanho da amostra para cada municipio. Considerar uma margem de erro de 90 %.
População Infinita
O estimador da média populacional, calculado por meio da amostragem estratificada, é dado por:
A variância de é dada por: O desvio padrão é obtido por meio da raiz quadrada da variância.
Amostragem Estratificada para Proporção População Finita
Estimativa da Proporção Em que Nh: é o número de elementos do estrato h da população; N = número total de elementos do universo de referência; ph = proporção amostral o estrato h;
Intervalo de Confiança ESTIMATIVA DA VARIÂNCIA DA PROPORÇÃO ESTIMATIVA DO DESVIO PADRÃO DA PROPORÇÃO Intervalo de Confiança
Alocação Proporcional
d é a margem de erro
Alocação de Neyman