Unidade 6 – Desenho da amostra Aspectos técnicos

Slides:



Advertisements
Apresentações semelhantes
O Processo de Poisson Série: Processos Estocásticos Disciplina: Métodos Matemáticos 1C Dennis S. Poisson, Sceaux, France.
Advertisements

Análise estatística de dados da PNAD: incorporando a estrutura do plano amostral Pedro Luís do Nascimento Silva, Djalma Galvão Carneiro Pessoa e Maurício.
Prof. Thiago Costa ADMINISTRAÇÃO DA PRODUÇÃO II TEORIA DA PREVISÃO DOS ESTOQUES.
Estatística Aula 16 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.
Amostragem Cuidados a ter na amostragem Tipos de amostragem
1) Defina sequências numéricas.
Probabilidade e Estatística Aplicadas à Contabilidade I
Estatística aplicada a ensaios clínicos
Medições – parte I: Precisão.
Taciana Villela Savian
Confiabilidade Estrutural
TÉCNICAS DE AMOSTRAGEM AMOSTRAGENS NÃO PROBABILÍSTICAS
ESTATÍSTICA AULA 15 Testes de hipóteses – Unidade 10
Testes de Hipóteses.
ESTATÍSTICA AULA 11 Modelos probabilísticos mais comuns – Unidade 7
Probabilidade e Estatística Aplicadas à Contabilidade II
DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO
Probabilidade e Estatística Aplicadas à Contabilidade I
Distribuições de Probabilidade
ESTATÍSTICA . SÍNTESE DO 10.º ANO . RELAÇÕES BIDIMENSIONAIS (11.º ANO)
Estatística Descritiva (I)
Estimação de Parâmetros – Unidade 9 Professor Marcelo Menezes Reis
Fundamentos de Eletricidade
Medidas de Dispersão.
Probabilidade e Estatística Aplicadas à Contabilidade I
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2017 Intervalo de Confiança Camilo Daleles Rennó
ESTATÍSTICA AULA 12 Inferência Estatística e Distribuição Amostral – Unidade 8 Professor Marcelo Menezes Reis.
A física é uma ciência experimental
EAL ESTATÍSTICA, PLANEJAMENTO E OTIMIZAÇÃO DE EXPERIMENTOS
Distribuições de Probabilidade
Algumas Distribuições de Probabilidade e Estatística de Contagem
Curso de Medicina/Nutrição Ms.Rosebel Trindade Cunha Prates
Estatística aplicada a ensaios clínicos
Cálculo da Amostra.
Frequência (n.Pessoas)
Prof. Eduardo Bezerra (CEFET/RJ)
Amostragem: Concepção e Procedimento
Métodos Numéricos de Determinação de Raízes: Bisseção, Secante e Newton-Raphson Professor.: Heron Jr.
Estatística Descritiva
ESTATÍSTICA AULA 04 ANÁLISE EXPLORATÓRIA DE DADOS I – Unidade 3
DISTRIBUIÇÕES AMOSTRAIS
AULA 5 ESTATÍSTICA DANIEL PÁDUA.
Prof. Elisson de Andrade
TEMA V Estatística.
Enfoque sistêmico na agricultura Fundamentos Estatísticos
INTEGRAL DEFINIDA APLICAÇÕES
Avaliação de testes diagnósticos
Profa. Andréia Adami Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE0211 – Estatística Geral Profa.
Amostragem e estimadores
Unidade 4 – amostragem Introdução
Estudo caso-controle Hjm jul-2001.
Capítulo 8 Seleção da amostra. Capítulo 8 Seleção da amostra.
Intervalo de confiança
Estatística amintas paiva afonso.
Prof. Elisson de Andrade
Profa. Andréia Adami Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE0211 – Estatística Geral Profa.
Amostragem e estimadores
Variância e Desvio padrão
Métodos Quantitativos
Mestrado Profissional em Física Médica
Algumas Distribuições de Probabilidade e Estatística de Contagem
Profa. Andréia Adami Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE0211 – Estatística Geral Profa.
Prof. Antonio Lopo Martinez
Expressões algébricas
PROJETO FATORIAL 23 Considere que três fatores A, B e C, cada um em dois níveis O projeto experimental é denominado projeto fatorial 23 Oito combinações.
A física é uma ciência experimental
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2018 Intervalo de Confiança Camilo Daleles Rennó
Aula 05 Distribuição de freguência Prof. Diovani Milhorim
Metodologia da Pesquisa em Ensino de Ciências I
Probabilidade e Estatística Aplicadas à Contabilidade II
Transcrição da apresentação:

Unidade 6 – Desenho da amostra Aspectos técnicos Carlos Arriaga Costa (alguns elementos foram retirados de M Angeles D’Ancona,Metodologia Cuantitativa, Sintesis Sociologia,1996) l 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Unidade 6 – Desenho da amostra Aspectos técnicos O que determina a dimensão da amostra? Qual a relação entre o erro da amostra e a dimensão da amostra? Qual a relação entre o nível de confiança desejado e a dimensão da amostra? Como inferir a média da amostra à média do universo? Quais as principais vantagens e desvantagens de cada tipo de amostra? 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Dimensão da amostra O que determina? Tempo e recursos Modalidade amostra escolhida Heterogeneidade da população (variância) Diversidade da análise de dados pretendida Margem de erro máxima admitida Nível de confiança da estimação 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Dimensão da amostra e a heterogeneidade dos dados (variância) Para um nível de confiança de 95,5% (2 σ) Para várias hipóteses do erro de amostragem (e) Variância dada em termos proporcionais: p – proporção de situação de sucesso ou acontecimento q - proporção de situação de insucesso ou não acontecimento 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Dimensão da amostra Dimensão da amostra para uma população superior a 100 000 n = (Z2 . p. q ) / e2 (n Dimensão da amostra; e erro da amostra; Z intervalo de confiança standardizado pelo valor de σ) Dimensão da amostra para uma população inferior a 100 000 n = (Z2 . p. q ). N / (e2 (N-1) + Z2 . p. q ) 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Dimensão da amostra e a heterogeneidade dos dados (variância Limite do erro (%) para ± 2 σ Valores de p e q (%) 1/99 10/90 20/80 30/70 40/60 50/50 0,1 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 5,0 39 600 1 584 396 176 99 63 44 32 25 16 360 000 14 400 3 600 1 600 900 576 400 294 225 144 640 000 25 600 6 400 2 844 1 024 711 522 256 840 000 33 600 8 400 3 733 2 100 1 344 933 686 525 336 960 000 38 400 9 600 4 267 2 400 1 536 1 067 784 600 384 1 000 000 40 000 10 000 4 444 2 500 1 111 816 625 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Dimensão da amostra e a heterogeneidade dos dados (variância), o erro de amostragem e o nível de confiança Limite do erro (%) para ± 2 σ Valores de p e q (%) Nível confiança (%) 10/90 20/80 30/70 40/60 50/50 1,0 2,0 2,5 3,0 4,0 95,5 99,7 3 600 8 100 900 2 025 576 1 296 400 225 506 6 400 14 400 1 600 1 024 2 304 711 8 400 18 900 2 100 4 725 1 344 3 024 933 525 1 181 9 600 21 600 2 400 5 400 1 536 3 456 1 067 600 1 350 10 000 22 500 2 500 5 627 1 111 625 1 406 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Elementos que intervêm: Dimensão da amostra Variância da população Erro da amostra Elementos que intervêm: Dimensão da amostra Variância da população Nível de confiança pretendido Tipo de amostra 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Erro da amostra e a heterogeneidade dos dados (variância) e a dimensão da amostra para um nível de confiança de 95,5% Dimensão da amostra Valores de p e q (%) 1/99 10/90 20/80 30/70 40/60 50/50 50 100 200 500 1000 1500 2000 3000 4000 5000 10000 50000 2,8 2,0 1,4 0,9 0,6 0,5 0,4 0,3 0,2 0,1 8,5 6,0 4,3 2,7 1,9 1,6 1,3 1,1 1,0 11,4 8,0 5,7 3,6 2,6 2,1 1,8 1,5 13,0 9,2 6,5 4,1 2,9 2,4 1,7 13,9 9,8 7,0 4,4 3,1 2,5 2,2 14,2 10,0 7,1 4,5 3,2 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Erro da amostra e o tipo de amostra Uma amostra aleatória sistemática provoca um erro de amostragem semelhante ao deuma amostra aleatória simples As amostras aleatórias estratificadas apresentam menor erro que as amostras aleatórias simples para id~entica dimensão, desde que a estratificação considere a heterogeneidade da classe de estratificação (estrato) A amostra por clusters apresenta maior erro de amostragem 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Erro da amostra aleatória simples Universo infinito Universo finito (< 100 000 unid) Erro de amostragem da média E(x) =√S2/n E(x) =√S2/n . √(N-n)/N-1 Erro de amostragem de uma proporção E(p) =√p.q/n E(p) =√p.q/n . √(N-n)/N-1 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Erro da amostra aleatória Estratificada Universo infinito Universo finito (< 100 000 unid) Erro de amostragem da média E(x) =√∑niSi2/n2 E(x) =√∑niSi2/n2. √(N-n)/N-1 Erro de amostragem de uma proporção E(p) =√∑nipi.qi/n2 E(p) =√∑nipi.qi/n2. √(N-n)/N-1 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Erro da amostra por clusters Universo infinito Erro de amostragem da média E(xclusters) =√(1- m/M). √Sb2/m M : número de clusters da população M: Número de clusters seleccionados da amostra Sb2= (1/m-1)/∑(xi – x)2 Sb2 : Variância dos valores do cluster xi 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Deff = (err a. Aleat. Estrat.)2 / / (err a. Aleat. simples)2 Ratio – Diferença de variância da amostra aleatória simples e estratificada Deff = (err a. Aleat. Estrat.)2 / / (err a. Aleat. simples)2 Ex : deff = (0,0095)2/(0,0099)2 = 0,921 A variância amostra aleatória estratificada para uma mesma dimensão de n é cerca de (1-0,921 = 0,08) 8% menor que a variância da amostra aleatória simples 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Vantagens e inconvenientes da amostra aleatória simples Desvantagens Facilidade de cálculo estatístico Probabilidade elevada de compatibilidade dos dados da amostra e da população Requer listagem da população Trabalhosa em populações elevadas Custos elevados se a dispersão da amostra for elevada 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Vantagens e inconvenientes da amostra aleatória estratificada Desvantagens Pressupõe um erro de amostragem menor Assegura uma boa representatividade das variáveis estratificadas Podem empregar-se metodologias diferentes para cada estrato Fácil organização do trabalho de campo Necessita de maior informação sobre a população Cálculo estatístico mais complexo 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Vantagens e inconvenientes da amostra aleatória por clusters Desvantagens Não existem listagem de toda a população Concentra os trabalhos de campo num número limitado de elementos da população Maior erro de amostragem Cálculo estatístico mais complexo na estimação do erro de amostragem 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Vantagens e inconvenientes da amostra por quotas (não aleatória Desvantagens Mais económica Fácil administração Não necessita de listagem da população Maior erro de amostragem que em amostras aleatórias Não existem metodologias válidas para o cálculo do erro de amostragem Limitação de representatividade Maior dificuldade de controlo do trabalho de campo 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Distribuição normal Standardizada (Z) 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Distribuição normal Standardizada (Z) A distribuição normal calculada no intervalo P(a < Z < b) é a área dada : então pode-se escrever P(a < Z < b) = P(Z < b) - P(Z<a). 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Probabilidade de X assumir um valor em um dado intervalo Apresentação do intervalo: -Z entre 0 e z: A -Z entre -z e z: 2A -Z fora do intervalo (-z,z): 1-2A -Z menor que z (z positivo): 0.5+A -Z menor que z (z negativo): 0.5-A -Z maior que z (z positivo): 0.5-A -Z maior que z (z negativo): 0.5+A 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Distribuição normal Standardizada (Z) Quando a distribuição possui média zero e desvio-padrão igual a um, ela é chamada de distribuição gaussiana padrão. Uma variável que tem a curva de Gauss padrão como distribuição é denotada pela letra Z e é representada por Z ~ N(0,1). O cálculo de probabilidade é a área sob a curva, e as tabelas trazem o valor da probabilidade calculada de forma numérica. As tabelas com a distribuição gaussiana são padronizadas, então, se a variável não tem média zero e desvio-padrão igual a 1, é necessário padronizá-la:   Para a distribuição normal têm-se: Ou seja, a média mais um desvio e menos um desvio, tem área de 0,683 sob a curva, ou, uma probabilidade de 68,3%. A média mais dois desvios e menos dois desvios, tem probabilidade de 95,4% e a média mais três desvios e menos três desvios, tem 99,7% de probabilidade 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Distribuição normal Standardizada (Z) Exemplo: Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por certa máquina. Vamos supor que essa variável tenha distribuição normal com média = 2 cm e desvio padrão = 0,04 cm. Qual a probabilidade de um parafuso ter o diâmetro com valor entre 2 e 2,05 cm ? P ( 2 < X < 2,05) = ? Com o auxílio de uma distribuiçào normal reduzida, isto é, uma distribuição normal de média = 0 e desvio padrão = 1. Resolveremos o problema através da variável  z , onde z = (X - µ) / S Utilizaremos também uma tabela normal reduzida, que nos dá a probabilidade de z tomar qualquer valor entre a média 0 e um dado valor z, isto é: P ( 0 < Z < z) Temos, então, que se X é uma variável aleatória com distribuição normal de média  e desvio padrão S, podemos escrever: P(  < X < x ) = P (0 < Z < z) No nosso problema queremos calcular P(2 < X < 2,05). para obter ees probabilidade, precisamos, em primeiro lugar, calcular o valor de z que correponde a x = 2,05 z = (2,05 - 2) / 0,04 = 1,25 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia

Distribuição normal Standardizada (Z) Utilização da Tabela  Z Procuremos, agora, na tabela Z o valor de z = 1,25 Na primeira coluna encontramos o valor até uma casa decimal = 1,2. Em seguida, encontramos, na primeira liha, o valor 5, que corresponde ao último alagarismo do número 1,25. Na intersecção da linha e coluna correspondentes encontramos o valor 0,3944, o que nos permite escrever: P (0 < Z < 1,25 ) = 0,3944 ou 39,44 %, assim a probabilidade de um certo parafuso apresentar um diâmetro entre a média = 2cm e x = 2,05 cm é de 39,44 %. 05-12-2018 2º ano de Economia - FMIE e 1º ano de NI - Metodologias de investigação em Economia