A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Unidade 4 – amostragem Introdução

Apresentações semelhantes


Apresentação em tema: "Unidade 4 – amostragem Introdução"— Transcrição da apresentação:

1 Unidade 4 – amostragem Introdução
Quais as etapas da construção estatística? Porquê a utilização de amostras? O que se entende por uma boa amostra? Que são desenhos Amostrais? 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

2 Conceitos preliminares
População Conjunto de indivíduos (famílias ou outras organizações), acontecimentos ou outros objectos de estudo que o investigador pretende descrever ou para o quais pretende generalizar as suas conclusões/resultados. Também designada por UNIVERSO. POPULAÇÃO TEÓRICA (ou de INFERÊNCIA) — A população para a qual se pretende generalizar as conclusões do inquérito. A totalidade dos elementos que compõem a População. POPULAÇÃO-ALVO — A População Teórica, menos os grupos ou indivíduos que o investigador decidiu explicitamente excluir, com base em critérios devidamente fundamentados. POPULAÇÃO-GRELHA — A parte da População que pode ser efectivamente listada na Grelha de Amostragem. A População que é contactável e da qual se selecciona efectivamente a Amostra. Também designada por POPULAÇÃO ACESSÍVEL, POPULAÇÃO INQUIRIDA ou POPULAÇÃO DO ESTUDO. 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

3 Conceitos preliminares
Unidade Cada um dos elementos que constitui a População ou Universo. Uma unidade concreta sobre a qual se recolhem informações designa-se por CASO. UNIDADE DE AMOSTRAGEM: Cada um dos elementos da população identificado e listado na Grelha de Amostragem. NÚMERO DE IDENTIFICAÇÃO (ID): Número sequencial (de 1 a n) atribuído aos casos que compõem a Grelha de Amostragem. 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

4 Conceitos preliminares
Estrato Subconjunto ou segmento da população caracterizado simultaneamente por um ou mais atributos. As unidade de amostragem de um estrato situam-se no mesmo nível hierárquico das unidades junto das quais se obtém a informação. VARIÁVEL DE ESTRATIFICAÇÃO: Qualquer variável utilizada como critério na determinação de um estrato. Em regra, tomam-se como variáveis de estratificação as características sociodemográficas dos indivíduos (v.g., sexo, idade, nível de escolaridade, classe social, etc.). A intersecção das categorias de duas ou mais variáveis de estatificação define um estrato: se consideremos o sexo (1 = masculino; 2 = feminino) e o nível de escolaridade (1 = 4º ano de escolaridade ou inferior; 2 = do 5º ao 12º ano de escolaridade; 3 = escolaridade superior ao 12º ano), dividimos a população em seis estratos. 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

5 Conceitos preliminares
Cluster Subconjunto ou segmento da população caracterizado por um ou mais atributos. As unidades de amostragem de um cluster situam-se num nível hierárquico superior ao das unidades junto das quais se obtém a informação (casos). Na situação mais frequente, os clusters constituem zonas ou áreas geográficas (v.g., bairros ou quarteirões de uma cidade). Podem, igualmente ser formados por organizações (v.g., empresas, escolas, etc.) ou qualquer outra entidade supra-ordenada na qual se “encaixam” as unidades a inquirir (v.g., indivíduos). 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

6 Conceitos preliminares
Amostra Subconjunto da População ou Universo. Teoricamente, um MODELO da População. AMOSTRA TEÓRICA — A totalidade unidades da População-Grelha ou Grelha de Amostragem que foram efectivamente seleccionadas para o inquérito. AMOSTRA OBTIDA — As unidades contactadas e que responderam ao inquérito. Plano de Amostragem Conjunto que inclui, entre outros elementos, a definição da População em estudo, a especificação dos Procedimentos de Amostragem, a Grelha de Amostragem e a indicação do Tamanho pretendido para a Amostra. Grelha de Amostragem Operacionalização da População. Lista ou registo de todas as Unidades que compõem a População ou dispositivo equivalente (v.g., um programa que gere aleatoriamente os números de telefone de uma População é uma Grelha de Amostragem que substitui adequadamente — e com vantagens evidentes — a lista telefónica). 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

7 Conceitos preliminares
Tamanho da População e da Amostra TAMANHO DA POPULAÇÃO (N): Número de Unidades que compõem a População em estudo. TAMANHO DA AMOSTRA (n): Número de Unidades que integram a Amostra. Para calcular o tamanho da amostra teórica, o investigador deve estabelecer previamente, o nível de confiança e o grau de precisão (intervalo de confiança) para as estimativas e/ou generalizações a efectuar. Inversamente, uma vez realizado o inquérito, o grau de precisão das estimativas depende do tamanho da amostra obtida, do nível de confiança pretendido para as generalizações e do erro-padrão das estatísticas amostrais .FRACÇÃO DE AMOSTRAGEM (FA): Proporção de casos da Amostra em relação à População (FA = n/N).I NTERVALO DE AMOSTRAGEM (IA): Na Amostragem Aleatória Sistemática é a razão N/n (arredondada para o inteiro imediatamente inferior) e corresponde à distância entre os números de ordem ou identificação (ID) das sucessivas unidades seleccionadas para integrar a Amostra. INÍCIO ALEATÓRIO (R): Na Amostragem Aleatória Sistemática, número de ordem da primeira unidade a incluir na Amostra. Gerado aleatoriamente no Intervalo de Amostragem 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

8 Conceitos preliminares
Erro Total do Inquérito Enviesamento das estimativas dos parâmetros populacionais a partir das respostas obtidas na amostra efectivamente inquirida. Divide-se em quatro componentes: 1) ERRO DE COBERTURA: Desfasamento entre a População Teórica e a População efectivamente incluída na Grelha de Amostragem; 2) ERRO DE NÃO-RESPOSTA: Desfasamento entre a Amostra Teórica e a amostra efectivamente inquirida; Percentagem de resposta: Percentagem de inquéritos válidos em relação ao número total de casos incluídos na Amostra Teórica (o mesmo que taxa de resposta “bruta” ou não corrigida);Taxa de resposta: Percentagem de resposta corrigida para as diferentes categorias de não-respondentes 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

9 Conceitos preliminares Erro Total do Inquérito (cont1)
3) ERRO DE AMOSTRAGEM: Erro resultante da heterogeneidade das possíveis amostras com o mesmo tamanho que podem ser extraídas de uma dada população. Para um dado nível de confiança, a margem máxima do erro de amostragem (ou magnitude do intervalo de confiança das estimativas e/ou generalizações) é função do tamanho da amostra, do erro padrão das estatísticas amostrais e da fracção de amostragem.O grau de precisão das estimativas baseadas na totalidade dos efectivos da amostra é, obviamente, superior ao das estimativas feitas a partir das diversas segmentações (v.g., por sexo, classe etária, nível de escolaridade, etc.) dos inquiridos. NÍVEL DE CONFIANÇA: Grau de “certeza” associado às estimativas, geralmente expresso em percentagem. Mais exactammente, o nível de confiança é a probabilidade complementar do Erro de Tipo I (rejeição da hipótese nula quando esta é verdadeira) e corresponde à decisão correcta de rejeitar a hipótese nula quando ela é falsa [NC = (1 – a) x 100]. INTERVALO DE CONFIANÇA: Margem de erro em torno de uma estatística.ERRO-PADRÃO: Desvio padrão de uma estatística. 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

10 Conceitos preliminares Erro Total do Inquérito (cont2)
4) ERROS DE MEDIÇÃO: Distância entre os “verdadeiros valores” dos parâmetros e as respostas efectivamente registadas. Os erros de medição podem ser conceptualizados como problemas de validade (erros sistemáticos) e de fidelidade (erros aleatórios) das medidas, sendo imputáveis a quatro fontes distintas: Questões e categorias de resposta Inquiridor ou entrevistador Modo de administração do inquérito e de registo das respostas Respondente 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

11 Tipo de amostras AMOSTRAGENS PROBABILÍSTICAS
AMOSTRAGEM ALEATÓRIA SIMPLES AMOSTRAGEM ALEATÓRIA SISTEMÁTICA AMOSTRAGEM ALEATÓRIA ESTRATIFICADA PROPORCIONAL NÃO PROPORCIONAL AMOSTRAGEM ALEATÓRIA POR CLUSTERS AMOSTRAGEM MULTI-ETAPAS (Multistage Sampling) AMOSTRAGEM MULTIFÁSICA (Multiphase Sampling) 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

12 Tipo de amostras AMOSTRAGENS NÃO PROBABILÍSTICAS
AMOSTRAGENS INTENCIONAIS AMOSTRAGEM DE INSTÂNCIAS MODAIS (Casos típicos) AMOSTRAGEM DE CASOS CRÍTICOS AMOSTRAGEM PARA A HETEROGENEIDADE OU DIVERSIDADE (Casos mais similares/dissimilares) AMOSTRAGEM DE “ESPECIALISTAS”AMOSTRAGEM FOCALIZADA EM GRUPOS PARTICULARES (Focus Groups) AMOSTRAGEM EM “BOLA DE NEVE” AMOSTRAGEM POR QUOTASProporcional Não proporcional AMOSTRAGENS NÃO INTENCIONAIS (por conveniência ou acidentais) 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

13 Ferramentas da amostragem Distribuição normal
A distribuição Normal é a mais familiar das distribuições de probabilidade e também uma das mais importantes em estatística. Esta distribuição tem uma forma de sino. 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

14 Medidas de Tendência Central
--média aritmética ou média (populacional) -média amostral -mediana: observação do meio de uma amostra, quando os dados são ordenados, de forma que existam tantas observações maiores quanto as menores que a mediana; expressa menos informação que a média, pois só considera o posto (rank) de cada observação; menos afetada porém por valores extremos -moda: observação mais frequente da amostra; menos afetada pela simetria do que a média e a mediana, mas muito afetada pelo tamanho da amostra 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

15 Medidas de Dispersão -variância: média dos quadrados dos desvios em relação à média. -soma dos quadrados dos desvios (SS): - se s2=0, então não existe variabilidade e quanto maior o valor de s2, maior é a variabilidade - uma maneira mais fácil de calcular o valor de SS é: -desvio padrão: raiz quadrada da variância -coeficiente de variação: medida de variação relativa, sem unidade; independente da magnitude dos dados, ao contrário da variância e do desvio padrão é expresso em percentagem V.100% 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

16 Probabilidade de X assumir um valor em um dado intervalo
-como lidamos com variáveis contínuas na distribuição normal, não se pode determinar a probabilidade da variável ser exatamente igual a um dado valor, uma vez que a área da curva correspondente a qualquer ponto ao longo da curva é infinitesimal; entretanto, pode-se calcular a probabilidade da variável assumir um valor entre dois pontos -neste caso, usamos uma tabela da distribuição normal padronizada, ou seja, que possui µ=0 e s=1 -para transformar uma variável de forma que tenha média 0 e desvio padrão 1 (padronização ou normalização), basta fazer o cálculo: -Z é chamado de score padrão ou de desvio normal -a tabela de distribuição normal dá a probabilidade (A) de Z assumir qualquer valor entre a média (0) e um dado z: P(0<Z<z), uma vez que P(µ<X<x)= P(0<Z<z) 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

17 Probabilidade de X assumir um valor em um dado intervalo
Apresentação do intervalo: -Z entre 0 e z: A -Z entre -z e z: 2A -Z fora do intervalo (-z,z): 1-2A -Z menor que z (z positivo): 0.5+A -Z menor que z (z negativo): 0.5-A -Z maior que z (z positivo): 0.5-A -Z maior que z (z negativo): 0.5+A 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

18 Distribuição normal A equação da curva Normal é especificada
usando 2 parâmetros: a média populacional , e o desvio padrão populacional , ou equivalentemente a variância populacional . Denotamos N() à curva Normal com média e variância . A média refere-se ao centro da distribuição e o desvio padrão à amplitude de curva. A distribuição normal é simétrica em torno da média o que implica que e média, a mediana e a moda são todas coincidentes. 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

19 A notação para a distribuição gaussiana é:
Distribuição normal curva é afectada pelos valores numéricos de µ e σ. isto é mostrado no diagrama ao lado A notação para a distribuição gaussiana é: Х ~N (µ, σ) 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

20 Distribuição normal A área sob a curva normal (na verdade abaixo de qualquer função de densidade de probabilidade) é 1. Então, para quaisquer dois valores específicos podemos determinar a proporção de área sob a curva entre esses dois valores. Para a distribuição Normal, a proporção de valores caindo dentro de um, dois, ou três desvios padrão da média são: Amplitude         Proporção µ ± 1σ    68.3%   µ ± 2σ %   µ ± 3σ   %   2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

21 Distribuição normal Propriedades da distribuição normal :
1ª - A variável aleatória X pode assumir todo e qualquer valor real. 2ª - A representação gráfica da distribuição normal é uma curva em forma de sino, simétrica em torno da média, que recebe o nome de curva normal ou de Gauss. 3ª - A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área corresponde à probabilidade de a variável aleatória X assumir qualquer valor real. 4ª - A curva normal é assintótica em relação ao eixo das abscissas, isto é, aproxima-se indefinidamente do eixo das abscissas sem, contudo, alcançá-lo. 5ª - Como a curva é simétrica em torno da média, a probabilidade de ocorrer valor maior que a média é igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas as probabilidades são iguais a 0,5 ou 50%. Cada metade da curva representa 50% de probabilidade. 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

22 Distribuição normal Standardizada (Z)
Quando a distribuição possui média zero e desvio-padrão igual a um, ela é chamada de distribuição gaussiana padrão. Uma variável que tem a curva de Gauss padrão como distribuição é denotada pela letra Z e é representada por Z ~ N(0,1). O cálculo de probabilidade é a área sob a curva, e as tabelas trazem o valor da probabilidade calculada de forma numérica. As tabelas com a distribuição gaussiana são padronizadas, então, se a variável não tem média zero e desvio-padrão igual a 1, é necessário padronizá-la: Para a distribuição normal têm-se: Ou seja, a média mais um desvio e menos um desvio, tem área de 0,683 sob a curva, ou, uma probabilidade de 68,3%. A média mais dois desvios e menos dois desvios, tem probabilidade de 95,4% e a média mais três desvios e menos três desvios, tem 99,7% de probabilidade 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

23 Distribuição normal Standardizada (Z)
2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

24 Distribuição normal Standardizada (Z)
A distribuição normal calculada no intervalo P(a < Z < b) é a área dada : então pode-se escrever P(a < Z < b) = P(Z < b) - P(Z<a). 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

25 Distribuição normal Standardizada (Z)
Exemplo: Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por certa máquina. Vamos supor que essa variável tenha distribuição normal com média = 2 cm e desvio padrão = 0,04 cm. Qual a probabilidade de um parafuso ter o diâmetro com valor entre 2 e 2,05 cm ? P ( 2 < X < 2,05) = ? Com o auxílio de uma distribuiçào normal reduzida, isto é, uma distribuição normal de média = 0 e desvio padrão = 1. Resolveremos o problema através da variável  z , onde z = (X - µ) / S Utilizaremos também uma tabela normal reduzida, que nos dá a probabilidade de z tomar qualquer valor entre a média 0 e um dado valor z, isto é: P ( 0 < Z < z) Temos, então, que se X é uma variável aleatória com distribuição normal de média  e desvio padrão S, podemos escrever: P(  < X < x ) = P (0 < Z < z) No nosso problema queremos calcular P(2 < X < 2,05). para obter ees probabilidade, precisamos, em primeiro lugar, calcular o valor de z que correponde a x = 2,05 z = (2,05 - 2) / 0,04 = 1,25 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

26 Distribuição normal Standardizada (Z)
Utilização da Tabela  Z Procuremos, agora, na tabela Z o valor de z = 1,25 Na primeira coluna encontramos o valor até uma casa decimal = 1,2. Em seguida, encontramos, na primeira liha, o valor 5, que corresponde ao último alagarismo do número 1,25. Na intersecção da linha e coluna correspondentes encontramos o valor 0,3944, o que nos permite escrever: P (0 < Z < 1,25 ) = 0,3944 ou 39,44 %, assim a probabilidade de um certo parafuso apresentar um diâmetro entre a média = 2cm e x = 2,05 cm é de 39,44 %. 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia


Carregar ppt "Unidade 4 – amostragem Introdução"

Apresentações semelhantes


Anúncios Google