MÉTODOS QUANTITATIVOS submódulo 2 - ESTATÍSTICA

Slides:



Advertisements
Apresentações semelhantes
DISTRIBUIÇÕES AMOSTRAIS
Advertisements

Estimação de parâmetros
PESQUISA DE MARKETING 1 Metodologia Planejamento Prof. Dr. Fauze Najib Mattar.
Estatística amintas paiva afonso.
PESQUISA DE MARKETING 1 Metodologia Planejamento Prof. Dr. Fauze Najib Mattar.
Intervalos de Confiança
PROBABILIDADE Introdução
ESTATÍSTICA INFERÊNCIA ESTATÍSTICA
ESTIMAÇÃO.
NOÇÕES DE PROBABILIDADE
ESTATÍSTICA BÁSICA Engenharia Mecânica II período 19/04/2011.
Análise de regressão linear simples: abordagem matricial
Estatística 8 - Distribuições Amostrais
Capítulo 6 Estimativas e Tamanho de Amostras
APLICAÇÕES COM EXCEL: Distribuição Binomial
Estatística Aplicada (Aula 4)
Estatística Aplicada (Aula 5)
Estatística Aplicada (Aula 4)
ESTATÍSTICA.
ESTATÍSTICA.
Site: Estatística Prof. Edson Nemer Site:
ESTATÍSTICA.
ESTATÍSTICA.
Aula de Recuperação: Matemática
Estatística Descritiva (I)
ME623A Planejamento e Pesquisa
Variáveis aleatórias Uma variável aleatória, X, é uma função que associa um valor numérico aos possíveis resultados de um experimento probabilístico.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2014 Inferência Estatística Camilo Daleles Rennó
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2014 Intervalo de Confiança Camilo Daleles Rennó
DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO DA AMOSTRA OU
DISTRIBUIÇÃO AMOSTRAL DA MÉDIA DA AMOSTRA OU DISTRIBUIÇÃO AMOSTRAL DE
Exponential Random Graph Models
Medidas de posição  Estudando as distribuições de  frequência,  percebe-se que existe uma  posição de  concentração dos valores, que podem estar mais concentrados no início, no meio ou no 
DISTRIBUIÇÕES DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS DISCRETAS
DISTRIBUIÇÕES AMOSTRAIS
Métodos Quantitativos II
Modelagem Estatística
O que é Estatística, afinal de contas?
ESTATÍSTICA.
NOÇÕES DE PROBABILIDADE
Amostragem Pontos mais importantes:
Técnicas de amostragem
Estatística Inferencial (cap. 7 Martins)
Distribuição da Proporção Amostral
ANÁLISE ESTATÍSTICA II
ANÁLISE ESTATÍSTICA II
VARIÁVEL ALEATÓRIA UNIVERSIDADE FEDERAL DE PERNABUCO - UFPE
Olhe fixamente para a Bruxa Nariguda
ANÁLISE ESTATÍSTICA II
Inferência Estatística
Estatística Aplicada Aula 7
NOÇÕES DE PROBABILIDADE
NOÇÕES DE PROBABILIDADE
Clique para editar o estilo do título mestre Clique para editar o estilo do subtítulo mestre 1 Seminário: Disciplina: Probabilidade e Inferência Professor:
Professor Antonio Carlos Coelho
Estatística Aula 13 Prof. Marllus Gustavo Ferreira Passos das Neves
Estatística Geral (Probabilidade Exercícios)
Medidas de Dispersão Aula 8.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Intervalo de Confiança Camilo Daleles Rennó
Noções de Inferência Estatística
Matemática e suas Tecnologias - Matemática PROBABILIDADE CONDICIONAL
Modelagem Estatística
POPULAÇÃO-ALVO E AMOSTRA Capítulo 10 – Richardson
Aula 9 - Amostragem, probabilidade, distribuição binomial
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Inferência Estatística Camilo Daleles Rennó
INFERÊNCIA ESTATÍSTICA PROPORÇÃO POPULACIONAL p
Estimação: Estimativa Pontual Estimativa Intervalar
NOÇÕES DE INFERÊNCIA ESTATÍSTICA
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
Amostragem e tratamento de dados faltantes Prof. Luciana Nunes Amostragem.
Transcrição da apresentação:

MÉTODOS QUANTITATIVOS submódulo 2 - ESTATÍSTICA Pós GRADUAÇÃO MÉTODOS QUANTITATIVOS submódulo 2 - ESTATÍSTICA Gestão inovadora da empresa gráfica

Programa Aula 1 – 26 de agosto – recordação de probabilidade e estatística básica – conceitos gerais de amostragem Aula 2 – 2 de setembro – amostragem aleatória simples (AAS) e amostragem estratificada (AE) Aula 3 – 16 de setembro – Estimadores do tipo razão e do tipo regressão Aula 4 – interpretação da norma NBR5426 – planos de amostragem e procedimentos na inspeção por atributos Aula 5 – exercícios práticos com aplicação da NBR5426 na empresa gráfica CURSO SUPERIOR DE TECNOLOGIA GRÁFICA – PÓS GRADUAÇÃO – GESTÃO INOVADORA DA EMPRESA GRÁFICA SENAI - SP

Exercícios de probabilidade 1. Jogando-se três dados, calcular a probabilidade de que a soma dos pontos obtidos seja superior a 14.

Solução Número de resultados do espaço amostral S: n = 6 3 = 216 Cada um dos 216 resultados de S tem a mesma probabilidade 1/216. Resultados favoráveis ao evento E (m): m=20 P(E) = m/n = 20/216=0,0926

Exercícios de probabilidade 2. Seja um baralho comum de 52 cartas. Qual é a probabilidade de uma carta ser de ouros ou de copas?

Solução E = sair carta de ouros F = sair carta de copas P(E υ F) = P(E) + P(F) = ¼ + ¼ =1/2

Exercícios de probabilidade 3. Seja um baralho comum de 52 cartas. Qual é a probabilidade da primeira carta ser de ouros e a segunda ser de copas, com reposição?

Solução E = sair primeira carta de ouros F = sair segunda carta de copas P(E ∩ F) = P(E) × P(F) = ¼ × ¼ =1/16

Exercícios de probabilidade 4. Seja um baralho comum de 52 cartas. Qual é a probabilidade da primeira carta ser de ouros e a segunda ser de copas, sem reposição?

Solução E = sair primeira carta de ouros F = sair segunda carta de copas P(E ∩ F) = P(E) × P(F│E) = ¼ × 13/51 =13/204

Exercícios de probabilidade 5. Seja um baralho comum de 52 cartas. Qual é a probabilidade da primeira carta ser de ouros ou a segunda ser de copas, com reposição?

Solução E = sair primeira carta de ouros F = sair segunda carta de copas P(E υ F) = P(E) + P(F) – P(E ∩ F) = 7/16 Solução alternativa pelo evento complementar P(E υ F) = 1 – P(~E ∩ ~F) = 1 – 9/16

Exercícios de probabilidade 6. Seja uma urna com 7 bolas com as letras A A A C C R R. Extraindo-se as bolas uma por uma, calcular a probabilidade de obter a palavra CARCARÁ.

Solução Evento desejado: F, intersecção dos 7 eventos: E1 = primeira bola com C E2 = segunda bola com A E3 = terceira bola com R E4 = quarta bola com C E5 = quinta bola com A E6 = sexta bola com R E7 = sétima bola com A

P(F) = P(E1) × P(E2|E1) × P(E3|E1E2) ×... = = 2/7 × 3/6 × 2/5 × ¼ × 2/3 × ½ × 1 = 1/210

Exercícios de probabilidade 7. Seja uma urna com 3 bolas brancas e 4 bolas pretas. Extrái-se simultaneamente 3 bolas. Calcular a probabilidade de a) pelo menos duas sejam brancas. E = saírem 3 bolas brancas F = saírem 2 bolas brancas e uma preta. P(EUF) = P(E) + P(F) P(E) = 3/7 . 2/6 . 1/5 = 1/35 P(F) = 3 (1 – 1/7 . 2/6 . 4/5) = 12/35 P(EUF) = 1/35 + 12/35 = 13/35

Exercícios de probabilidade 7. Seja uma urna com 3 bolas brancas e 4 bolas pretas. Extrái-se simultaneamente 3 bolas. Calcular a probabilidade de b) pelo menos uma seja preta. G = pelo menos uma ser preta. ~G = nenhuma ser preta = saírem 3 bolas brancas = E P(G) = 1 - P(~G) = 1 – 1/35 = 34/35

Exercícios de probabilidade 8. Seja um baralho de 32 cartas de 7 a Ás. Qual é a probabilidade de tirar no poquer uma quadra de mão?

Exercícios de probabilidade 9. Seja um baralho de 32 cartas de 7 a Ás. Qual é a probabilidade de tirar no poquer um flush (todas do mesmo naipe) de mão?

Exercícios de probabilidade 10. Seja um baralho de 32 cartas de 7 a Ás. Qual é a probabilidade de tirar no poquer um par de mão?

Aula 2 - AMOSTRAGEM Noções Básicas Procedimentos amostrais Objetivo: obter informações sobre o todo, baseando-se no resultado de uma amostra Perigo: viés de interpretação do resultado Adequações e inadequações de alguns protocolos de obtenção de amostras Inferência estatística: obter resultados para o todo, baseando-se em resultados da amostra

Vocabulário Técnico Ver apêndice A (Bolfarine) Amostra – subconjunto de uma população Amostragem por quotas – processo de amostragem em que a seleção das unidades amostrais é feita em campo, até o número especificado em projeto para ser coletado em cada estrato. Característica de interesse (variável) – propriedade dos elementos da população que se pretende conhecer.

Vocabulário Técnico Censo – resultado do levantamento estatístico que visa a conhecer a totalidade das características individuais de uma população. População ou universo – conjunto de elementos, cujas propriedades e investigam por meio de subconjuntos que lhes pertencem. Viés ou vício (de um estimador de um parâmetro) – é a diferença entre o seu valor esperado e o valor do parâmetro. Sistema de referência – lista ou descrição das unidades amostrais da população, por meio da qual é possível selecionar a amostra.

Tópicos para um levantamento amostral Apêndice B Identificação dos objetivos e populações Coleta das informações Planejamento e seleção da amostra Processo de coleta dos dados (em campo) Processamento dos dados Análise dos resultados (modelos estatísticos) Apresentação dos resultados Disponibilização dos dados

O que é uma boa amostra? É aquela que permite a generalização de seus resultados dentro dos limites aceitáveis de dúvidas. É aquela que possui um custo mínimo de planejamento e execução e ainda atenda ao objetivo no. 1

O tamanho da amostra e o erro do estimador O erro padrão do estimador decresce à medida que aumenta o tamanho da amostra. Exemplo: seja um levantamento amostral cujo objetivo é prever qual dentre os dois únicos possíveis partidos terá maior porcentagem de votos válidos. Um dos partidos obteve 56% dos votos. Caso tenha sido usada uma amostra de 100 eleitores: intervalo de 95% de confiança indicaria um número entre 46% e 66% (inconclusivo).

O tamanho da amostra e o erro do estimador Um dos partidos obteve 56% dos votos. Caso tenha sido usada uma amostra de 400 eleitores: intervalo de 95% de confiança indicaria um número entre 51% e 61% (conclusivo e suficiente). Caso tenha sido usada uma amostra de 1600 eleitores: intervalo de 95% de confiança indicaria um número entre 53,5% e 58,5% (conclusivo e exagerado).

Viés e desvio padrão Seja uma população ou universo: o conjunto u = {1,2,...,N} de todas as unidades elementares de interesse. N é o tamanho fixo da população, às vezes desconhecido. Elemento populacional é qualquer elemento i pertencente a u, do qual se deseja conhecer Yi

Parâmetro populacional É o vetor de todos os valores de uma variável de interesse que se denota por D = ( Y1,...,YN)

Função paramétrica populacional É uma característica numérica qualquer da população, que condensa funcionalmente os Yi. Tal função será denotada por θ(D)

Exemplo 2.1 (pag. 38) Variável Notação Unidade 1 2 3 i Nome do chefe Ada Beto Ema Ai Sexo Xi Idade 20 30 40 Yi Fumante Gi Renda bruta familiar 12 18 Fi No. de trabalhadores Ti

Funções paramétricas populacionais Idade média θ(Y) = (20+30+40)/3 = 30 Renda média do trabalhador θ(D) = (12+30+18)/(1+3+2) = 10

Funções paramétricas populacionais mais usadas Média populacional θ(Y) = μ = (Y1+ Y2+...+YN)/N Variância populacional θ(Y) = σ2 = Σ(Yi – μ)2/N Desvio padrão σ

Exercício Determinar a média e o desvio padrão das idades dos habitantes de um determinado bairro. Os valores estão apresentados à direita: 45 54 23 35 46 67 37 19 66 43 22 76 44 33 41 60 81 47 39 56 20 29 31 40 24 80 34 70 79 21 32 55 50 38 78

Amostras Uma seqüência qualquer de n unidade de u é denominada uma amostra ordenada de u. Exemplo: u = {1,2,3} s1 = (1,2) s2 = (2,1) s3 = (1,1,3)

Planejamento amostral Se cada amostra tem associada a si uma probabilidade de ser sorteada e a soma de todas as probabilidades for igual a 1, então tem-se um planejamento amostral ordenado. Exemplo: u = {1,2,3} Plano A: P(11) = P(12) = P(13) = 1/9 P(21) = P(22) = P(23) = 1/9 P(31) = P(32) = P(33) = 1/9 P(s) = 0, para as demais s pertencentes ao conjunto de todas as amostras possíveis S.

Planejamento amostral Plano B: P(12) = P(13) = P(21) = P(23) = P(31) = P(32) = 1/6 P(s) = 0, para as demais s pertencentes ao conjunto de todas as amostras possíveis S. Diferença entre o plano A e o plano B: Plano A: com reposição Plano B: sem reposição

Planejamento amostral Plano C: P(2) = 1/3 P(12) = P(32) = 1/9 P(112) = P(132) = P(332) = P(312) = 1/27 P(111) = P(113) = P(131) = P(311) = 1/27 P(133) = P(313) = P(331) = P(333) = 1/27 P(s) = 0, para as demais s pertencentes ao conjunto de todas as amostras possíveis S.

Descrição textual do Plano C “Sorteie uma unidade após a outra, repondo a unidade sorteada antes de sortear a seguinte, até o surgimento da unidade 2 (i=2) ou até que 3 unidades tenham sido sorteadas”.

Planos equiprobabilísticos São os planos em que todas as amostras têm a mesma probabilidade de ser escolhida.

Amostragem Aleatória Simples (AAS) Seleciona-se seqüencialmente cada unidade amostral com igual probabilidade, de tal forma que cada amostra tenha a mesma chance de ser escolhida. A seleção pode ser feita com ou sem reposição.

Estimadores O objetivo principal da amostragem é produzir estimadores para parâmetros populacionais desconhecidos. Quando se associa uma estatística com a expressão que irá estimar o parâmetro populacional, ele recebe o nome de estimador. O valor numérico do estimador, para cada amostra, chama-se estimativa.

Viés ou vício do estimador BA[θe] = EA[θe – θ] B de bias (viés em inglês)

Variância de uma estatística H Var A[H] = Σ {h(ds) – EA[H]}2 PA(s) para todas as amostras do plano A.

Distribuição binomial Seja p a probabilidade de um evento acontecer em uma tentativa única (probabilidade de sucesso) q = 1 – p é a probabilidade insucesso A probabilidade do evento ocorrer X vezes, em N tentativas, é p(X) = NCXpXqN-X = N!/[X!(N-X)!] pXqN-X Exemplo: Qual é a probabilidade de obter exatamente 2 caras em 6 lances de uma moeda não-viciada?

Distribuição binomial Esta distribuição discreta de probabilidade é denominada distribuição binomial, visto que a X= 0, 1, 2, ..., N correspondem os termos sucessivos da fórmula binomial ou do desenvolvimento binomial (p+q)n = qN + NC1qN-1p1 + NC2qN-2p2 +...+pN em que 1, NC1, NC2,... são os coeficientes binomiais

Propriedades da distribuição binomial Média μ = N p Variância σ2 = N p q Desvio padrão σ = raiz (N p q)

Distribuição de Poisson p(X) = λX e-λ/X! em que e = 2,71828... e λ é uma constante dada Média: μ = λ Variância: σ2 = λ

Relação entre as distribuições binomial e de Poisson Se N for grande e p for pequeno, o evento é raro. Na prática: N≥50 e Np<5, então o evento é raro. Neste caso, a distribuição binomial é muito aproximada da de Poisson, com λ= Np

Exercício Dez por cento das revistas produzidas por um certo processo revelaram-se defeituosos. Determinar a probabilidade de em uma amostra de 10 ferramentas escolhidas ao acaso, exatamente duas serem defeituosas, mediante o emprego: da distribuição binomial da aproximação de Poisson para essa distribuição

Exercício - resolução Probabilidade de uma revista ser defeituosa: Pr{2 revistas defeituosas em 10} = 10C2p2q8 = 10!/(2!8!) (0,1)2 (0,9)8 = 0,1937 λ = Np = 10 (0,1) = 1 Pr{2 revistas defeituosas em 10} = λ2e- λ/2! = 0,1839

Distribuição normal (ou de Gauss) na qual μ é a média, σé o desvio padrão, π=3,14159..., e= 2,712828...

Distribuição normal (ou de Gauss) Usando a unidade reduzida z = (X – μ)/σ:

Distribuição normal (ou de Gauss) 68,27% 95,45% (-2 a +2) 99,73%

Relação entre as distribuições binomial e normal Se N for grande e nem p nem q forem próximos de zero, a distribuição binomial é muito aproximada da de uma normal. Quanto maior o N, melhor será a aproximação.

Exercício Determinar a probabilidade de, em 120 lances de uma moeda honesta, ocorrerem caras: entre 40 e 60%; em 5/8 ou mais desses lances.

Solução caras entre 40% e 60% 40% de 120 = 48 60% de 120 = 72 probabilidade do evento cara p = ½ probabilidade do evento coroa q = 1 –p = ½ Número de caras é uma variável discreta Em uma distribuição normal, verifica-se a probabibilidade do número de caras estar situado entre 47,5 e 72,5

Solução (cont.) μ = número esperado de caras = Np = 60 σ2 = 120 (1/2) (1/2) = 30 σ = 5,48 47,5 em unidades reduzidas=(47,5-60)/5,48 z1 = -2,28 72,5 em unidades reduzidas=(72,5-60)/5,48 z2 = +2,28 Probabilidade = área (sob a curva normal entre z1= -2,28 e z2=+2,28) = 0,9774

Solução (cont.) 5/8 ou mais dos lances serem caras número de caras > 120 x 5/8 = 75 caras número de caras entre 74,5 e 120 74,5 em unidades reduzidas: z1 = (74,5 – 60)/5,48 = 2,65 120 em unidades reduzidas: z2 = (120 – 60)/5,48 = 10,95 Prob = 0,50 – 0,4960 = 0,004

Exercício Cada pessoa de um grupo de 500, lança uma moeda honesta 120 vezes. Quantas pessoas seria de esperar que relatassem ter obtido caras: entre 40 e 60% dos seus lances; em 5/8 ou mais desses lances. Resposta a) 489 pessoas b) 2 pessoas.

Exercício Verificou-se que 2% das revistas produzidas por uma certa impressora são defeituosas. Qual é a probabilidade de, em uma remessa de 400 dessas revistas, revelarem-se defeituosas: (a) 3% ou mais; (b) 2% ou menos?

Solução a) 3% ou mais (3% de 400) = 12 revistas defeituosas. Baseado na continuidade, 12 ou mais revistas significam 11,5 ou mais. X = (2% de 400) = 8 σ2 = N p q = (400) x (0,02) x (0,98) = 7,84 σ = 2,8 11,5 em unidades reduzidas: z = (11,5 – 8)/2,8 z = 1,25 Prob = 0,5 – 0,3944 = 0,1056 = 10,56%

Solução (cont.) b) 2% ou menos (2% de 400) = 8 revistas 8 revistas ou menos significa 8,5 ou menos 8,5 em unidades reduzidas: z = (8,5 – 8)/2,8 = 0,18 Prob = (0,5 + 0,0714) = 0,5714 = 57,14%

Exercício Uma pesquisa amostral foi conduzida com o objetivo de se estudar o índice de ausência ao trabalho em um determinado tipo de indústria. Uma AAS sem reposição de mil operários de um total de 36 mil é observada com relação ao número de faltas não justificadas em um período de 6 meses. Os resultados obtidos foram: Faltas 0 1 2 3 4 5 6 7 8 Operários 451 162 187 112 49 21 5 11 2 Qual é a estimativa de μ dada por essa amostra? Qual é o erro aceitável dentro de um intervalo de confiança de 95%?

Distribuição amostral das médias Todas as amostras possíveis de tamanho N são retiradas, sem reposição, de uma população finita de tamanho Np > N. Se a media e o desvio padrão da distribuição amostral das médias foram designados por e e os valores correspondentes da população o forem por μ e σ, então:

Para ter 95% de certeza: intervalo entre μ -1,96σX e μ+1,96σX isto é, (1,20;1,39)

Exercício Em uma população de 60 milhões de eleitores, foi feita uma pesquisa com 2500 eleitores de acordo com um plano de amostragem aleátoria simples, sem reposição. Um determinado candidato obteve 51% dos votos. Qual é a estimativa de número total de votos desse candidato na população total, a partir da estatística amostral? Qual é o erro aceitável dentro de um intervalo de confiança de 95%?

Distribuição amostral das proporções

Exercício Em uma tiragem de 3000 livros, foi analisada uma amostra de 100 livros de acordo com um plano de amostragem aleátoria simples, sem reposição. Foram encontrados um certo número de livros defeituosos. Qual é a estimativa de número total de livros defeituosos na tiragem? Qual é o erro aceitável dentro de um intervalo de confiança de 95%?

Intervalos de confiança % n, em nσ 68,27 1 95 1,96 95,45 2 99 2,58 99,73 3

NBR 5426 Planos de amostragem e procedimentos na inspeção por atributos