Modelagem Estatística
População e Amostra População: Conjunto dos elementos que se deseja abranger no estudo considerado. Amostra: Subconjunto dos elementos da população.
População Finita - Alunos do mestrado, funcionários de uma empresa, eleitores etc. Infinita - Nascimentos em um cidade, produção de uma máquina etc.
População e Amostra Censo: Estudo através do exame de todos os elementos da população. Amostragem: Estudo por meio do exame de uma amostra.
Técnicas de Amostragem Amostragem probabilística (aleatória) - a probabilidade de um elemento da população ser escolhido é conhecida. Amostragem não probabilística (não aleatória) - Não se conhece a probabilidade de um elemento da população ser escolhido para participar da amostra.
Amostragem Aleatória Simples Faz-se uma lista da população e sorteiam-se os elementos que farão parte da amostra. Cada subconjunto da população com o mesmo nº de elementos tem a mesma chance de ser incluído na amostra. pr = n/N
DISTRIBUIÇÕES AMOSTRAIS
Parâmetro e Estatística Parâmetro - característica relacionada à população. Estatística - característica relacionada à amostra.
Parâmetros Média Proporção p Desvio Padrão etc
Estatísticas Média X Proporção p Desvio Padrão s etc
Distribuições Amostrais Qualquer característica de uma amostra aleatória (estatística) é uma variável aleatória. Em outras palavras, se tomarmos várias amostras de forma parecida, os resultados da característica (estatística) que nos interessa variarão por causa da aleatoriedade do sorteio.
Distribuições Amostrais Distribuição Amostral - Distribuição de probabilidades de uma estatística.
Exemplo A população de um estudo é composta de 4 pessoas (N=4) e a variável de interesse é a altura. X1=1,50m X2=1,60m X3=1,70m X4=1,80m
Parâmetros N=4 X1=1,50m X2=1,60m X3=1,70m X4=1,80m Média populacional: = 1,65m Desvio Padrão: = 0,1118m
Exemplo Retira-se uma amostra aleatória simples com 2 elementos (n=2), com reposição. Qual será a média amostral? Qual é a distribuição de probabilidades da média amostral?
Exemplo Amostra Amostra X X X X X X X X X X X X X X X X X 3 1 2 4 1 1
Exemplo Amostra X X 1,50 1,55 1,60 1,65 1,70 Amostra X X 1,60 1,65 2 3 4 X 1,50 1,55 1,60 1,65 1,70 Amostra X 3 1 2 4 X 1,60 1,65 1,70 1,75 1,80
Exemplo Amostra X Total X 1,50 1,55 1,60 1,65 1,70 1,75 1,80 - Prob. 2 3 4 Total X 1,50 1,55 1,60 1,65 1,70 1,75 1,80 - Prob. 1/16 1
Distribuição Amostral da Média 0,0625 0,1250 0,1875 0,2500 1/16 2/16 3/16 4/16 1 P(X) X 1,50 1,55 1,60 1,65 1,70 1,75 1,80 Total
Distribuição Amostral da Média 4/16 3/16 3/16 2/16 2/16 1/16 1/16 1,50 1,55 1,60 1,65 1,70 1,75 1,80
Distribuição Amostral da Média Calcular o valor esperado (média) e o desvio padrão da média amostral.
Média e Variância X P(X) x1 p1 x2 p2 ... ... xn pn Total 1 ... ... xn pn Total 1 E(X) = x = (xi.pi) VAR(X) = x = pi.(xi-x)2
Distribuição Amostral da Média 0,0625 0,1250 0,1875 0,2500 1/16 2/16 3/16 4/16 1 P(X) X 1,50 1,55 1,60 1,65 1,70 1,75 1,80 Total
Distribuição Amostral da Média X = E(X) = 1,65 m X = 0,0791 m
Exercício Retira-se uma amostra aleatória simples com 2 elementos (n=2), sem reposição. Qual é a distribuição de probabilidades da média amostral?
Exemplo Amostra X X 1,50 1,55 1,60 1,65 1,70 Amostra X X 1,60 1,65 2 3 4 X 1,50 1,55 1,60 1,65 1,70 Amostra X 3 1 2 4 X 1,60 1,65 1,70 1,75 1,80
Exercício X 1,55 1,60 1,65 1,70 1,75 Total P(X) 1 1/6 2/6
Distribuição Amostral da Média Calcular o valor esperado (média) e o desvio padrão da distribuição amostral da média.
Exercício = E( ) = 1,65 = 0,0645497 X x x
Distribuição Amostral da Média Características = x a)
= = Distribuição Amostral da Média Características n x n x população infinita ou muito grande ou amostragem com reposição = n x b) população finita = n x N - 1 N - n
Distribuição Amostral da Média Características c) A distribuição da média amostral é normal.
Exercício Uma fábrica de pneus alega que a vida média dos pneus é 30.000 Km, com desvio padrão de 2.000 Km. Tomando-se como verdadeiros estes dados, qual é a probabilidade de uma amostra com 40 pneus apresentar vida média menor que 29.500 Km?
Exercício n = x = x 2000 40 = 316,22777 x
Exercício P(X<29500) X 30 29,5
Exercício 29500 = = -1,58 29.500 - 30.000 316,23 0,057053 -1,58 Z
Exercício Um lote com 100 pneus apresenta vida útil média de 30.000 Km, com desvio padrão de 2.000 Km. Qual é a probabilidade de uma amostra aleatória simples com 40 pneus apresentar vida média de menos que 29.500 Km?
= = = 246,18298 Exercício N - n x n N - 1 x x 2000 100 - 40 = n x N - 1 N - n = x 2000 40 100 - 40 100 - 1 = 246,18298 x
Exercício P(X<29500) X 30 29,5
Exercício 29500 = = -2,03 29.500 - 30.000 246,18 0,021178 -2,03 Z
Exercício 1 Se a vida útil média de uma peça é 5.000 horas, com desvio padrão de 200 horas, qual é a probabilidade de que uma amostra com 25 produtos apresente média superior a 5.100 horas? 0,00621
Exercício 2 Um banco informa que o saldo médio das 2000 contas de pessoas físicas é $ 500, com desvio padrão de $ 100. Se uma amostra aleatória de 50 correntistas (pessoa física) daquele banco for retirada, qual é a probabilidade do saldo médio ser menor que $ 480?
Exercício População finita : Resp = 0,076359 População infinita: Resp = 0,079270
Modelagem Estatística Distribuição Amostral da Proporção
Distribuição Amostral da Proporção p - prop. populacional p - prop. amostral População Amostra Plano de amostragem p p
Exemplo A população de um estudo é composta de 4 pessoas (N=4) e a variável de interesse é a proporção de pessoas altas (altura > 1,75m). N=4 X1=1,50m X2=1,60m X3=1,70m X4=1,80m
Parâmetro N=4 X1=1,50m X2=1,60m X3=1,70m X4=1,80m Proporção populacional: 1/4 = 0,25
Exemplo Retira-se uma amostra aleatória simples com 2 elementos (n=2), com reposição. Qual será a proporção amostral? Qual é a distribuição de probabilidades da proporção amostral?
Exemplo Amostra Amostra X X X X X X X X X X X X X X X X X 3 1 2 4 1 1
Exemplo Amostra X 1 2 3 4 p 0,5 Amostra X 3 1 2 4 p 0,5 1
Exemplo Amostra X 1 2 3 4 Total p 0,5 1 - Prob. 1/16 1
Distribuição Amostral da Proporção 9/16 6/16 1/16 1 P(p) p 0,5 Total
Distribuição Amostral da Proporção Binomial (n=2 , p=1/4) proporção = número de pessoas altas tamanho da amostra
Distribuição Amostral da Proporção P(X=0) = P(p=0)= ( ) 2 (1/4)0.(3/4)(2-0) = 9/16 P(X=1)=P(p=0,5)= ( ) 2 1 (1/4)1.(3/4)(2-1) = 6/16 P(X=2) = P(p=1)= ( ) 2 (1/4)2.(3/4)(2-2) = 1/16
Distribuição Amostral da Proporção 9/16 6/16 1/16 1 P(p) p 0,5 Total
Distribuição Amostral da Proporção Calcular o valor esperado (média) e o desvio padrão da distribuição amostral da proporção.
Distribuição Amostral da Proporção 9/16 6/16 1/16 1 P(p) p 0,5 Total (0,5625) (0,3750) (0,0625)
Distribuição Amostral da Proporção p = E(p) = 0,25 p = raiz(0,09375) = 0,30619
Exercício Retira-se uma amostra aleatória simples com 2 elementos (n=2), sem reposição. Qual é a distribuição de probabilidades da proporção amostral?
Exercício Amostra X 1 2 3 4 p 0,5 Amostra X 3 1 2 4 p 0,5 1
Exercício 0,5 1 P(p) p Total
Distribuição Amostral da Proporção Calcular o valor esperado (média) e o desvio padrão da distribuição amostral da proporção.
Exercício 0,5 1 P(p) p Total
Distribuição Amostral da Proporção p = E(p) = 0,25 p = raiz(0,0625) = 0,25
Distribuição Amostral da Proporção Características
Distribuição Amostral da Proporção Características = p n p.(1-p) população infinita ou muito grande ou amostra com reposição = p N - 1 N - n n p.(1-p) população finita
Distribuição Amostral da Proporção Características c1) A distribuição das proporções amostrais é binomial no caso de população infinita. Quando o tamanho da amostra for grande, esta distribuição pode ser aproximada por uma distribuição normal. c2) A distribuição das proporções amostrais é hipergeométrica no caso de população finita. Quando o tamanho da amostra for grande, esta distribuição pode ser aproximada por uma distribuição normal.
Exercício Uma fábrica de pneus alega que 99% de seus produtos possuem vida útil longa (duram mais que 30.000 Km). Tomando-se como verdadeiros estes dados, qual é a probabilidade de uma amostra com 400 pneus apresentar menos que 2% dos pneus com vida útil menor que 30.000 Km?
Exercício n p.(1-p) = p 0,01.0,99 = = 0,004975 p p 400
Exercício P 0,01 0,02 P(p<0,02)
Exercício = 2,01 0,02 - 0,01 0,004975 Z 0,02 = 0,977784 Z 2,01
Exercício Um lote com 100 peças apresenta 20 com defeitos. Qual é a probabilidade de uma amostra aleatória simples com 20 elementos apresentar menos que 40% de pecas defeituosas?
= = Exercício p.(1-p) N - n p N - 1 n p 99 80 20 0,2.0,8 = p N - 1 N - n n p.(1-p) = p 99 80 20 0,2.0,8 = 0,080403
Exercício P(p<0,4) P 0,2 0,4
Exercício Z 0,4 = = 2,49 0,4 - 0,2 0,080403 0,993613 Z 2,49
Exercício 3 Um banco informa que apenas 10% dos 5000 clientes possuem saldo médio acima de $500. Se uma amostra aleatória de 100 correntistas daquele banco for retirada, qual é a probabilidade de haver mais de 15 clientes na amostra com saldo acima de $500?
Exercício População finita : Resp = 0,046479 População infinita: Resp = 0,047460
Modelagem Estatística Estimação
Estimação de Parâmetros População Amostra p 2 P S 2 X
? Estimação População Amostra X S P Conhecidas as estatísticas (amostra), estimar quais são os parâmetros (população). População Amostra P S 2 X ?
Estimação Pontual Estima-se apenas um valor para o parâmetro. Intervalar Estima-se um intervalo de valores onde deve-se encontrar o parâmetro (intervalo de confiança).
Propriedades Desejáveis de um Estimador Não-tendenciosidade ou justeza: um estimador é justo (não tendencioso, não viesado; não viciado) se sua média (ou valor esperado) for o próprio parâmetro que se pretende estimar.
Tendenciosidade Xi Ex:Média n = X = X E( ) = X Não-tendencioso
Tendenciosidade Ex: Proporção P Xi n = E( ) = P p = Não-tendencioso
Tendenciosidade ^ ^ (Xi - X n -1 = E ( ) = n n 2 n -1 = E ( ) = ^ 2 2 n Tendencioso
Tendenciosidade ^ ^ ^ ^ (Xi - ^ 2 n -1 = ^ 2 E ( ) = 2 n n Tendencioso (Xi - X ^ 2 ^ = S2 = E( ) = 2 E(s2) = 2 n-1 Não-tendencioso
Consistência Um estimador é consistente se o aumento do tamanho da amostra leva a uma redução da variância.
Eficiência Um estimador não-tendencioso (E1) é mais eficiente que outro estimador não-tendencioso (E2) se a variância de E1 for menor que a variância de E2. 2 E1 E2 <
Eficiência E1 é mais eficiente que E2 E1 E2 E3 Não-tendenciosos x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x E1 E2 E3 Não-tendenciosos Tendencioso
Métodos de Estimação Como selecionar o melhor estimador? Método da Máxima Verossimilhança Método dos Mínimos Quadrados Métodos Bayesianos ...
Intervalos de Confiança Problema: Estimar 2 limites, dentro dos quais deve se encontrar o valor real, com um determinado nível de confiança.
Exemplo: Média População infinita (valor real = ) (desconhecido)
Exemplo: Média = n Amostra: média amostral ( ) X X E( ) = X
Exemplo População infinita (valor real = ) (desconhecido) = 10
Exemplo Distribuição Amostral Amostra: média amostral ( ) X = X 10 25 = 2
Exemplo Qual a probabilidade de ser maior que ? X
Exemplo Qual a probabilidade de ser maior que ? X 0,50
Exemplo Qual a probabilidade de ser maior que 1,96 vezes o desvio padrão? Qual a probabilidade da distância entre a média populacional (µ) e a média amostral (X) ser maior do que 1,96 vezes o desvio padrão da distribuição amostral da média? X -
Exemplo = X 10 25 = 2 1,96 . 2 = 3,92 Qual a probabilidade da distância entre a média populacional (µ) e a média amostral (X) ser maior do que 3,92?
Exemplo Qual a probabilidade de ser maior que 1,96 vezes o desvio padrão? X - Resp: 5% -1,96 1,96 0,025
Exemplo: Média Se alguém afirmar que X estará a menos de 1,96 vezes o desvio padrão da média (para mais ou para menos), terá 95% de probabilidade de estar certo e 5% de probabilidade de estar errado.
Simbologia Probabilidade de erro admitida (probabilidade do parâmetro encontrar- se fora do intervalo a ser criado). No exemplo,
Simbologia Grau de confiança(probabilidade do parâmetro encontrar-se no intervalo) No exemplo,
Simbologia Limite do I.C. na distribuição padronizada. No exemplo,
Limites O intervalo é construído somando-se e diminuindo-se Z vezes o desvio padrão da média amostral obtida.
Limites A média da amostra não se diferenciará da média populacional em mais que Z vezes o desvio padrão (da distribuição amostral) + - _ X x Int. Conf.:
Limites + - _ X Int. Conf.: n = População infinita n = N -1 Int. Conf.: n x = População infinita n x = N -1 N -n População finita
Exemplo Foi retirada uma amostra com 64 elementos de uma população com desvio padrão igual a 100. A média encontrada foi 300. Construir um intervalo para a média com: a) 90% de confiança
Exemplo Z0,05 5%
Exemplo X n 100 Linf = 279,4 X n + - Lim= 300 1,645 64 100 Linf = 279,4 Lsup = 320,6 20,5625
Exemplo b) 99% de confiança Linf = 267,8 Lsup = 332,2 + - Lim= 300 2,575 64 100 32,1875
Exemplo Encontrar, na tabela da normal reduzida, os valores de Z para:
Exemplo Encontrar, na tabela da normal reduzida, os valores de Z para:
Intervalo de Confiança Média ( conhecido) + - _ X x Int. Conf.: n x = População infinita n x = N -1 N -n População finita
Intervalo de Confiança Média ( desconhecido) Normalmente, não se conhece o desvio padrão da população cuja média se deseja estimar. Então, utiliza-se um estimador pontual para o desvio padrão populacional.
Intervalo de Confiança Média ( desconhecido) s = Desvio padrão da amostra s n-1 Xi - X)2
Intervalo de Confiança Média ( desconhecido) Nesta situação, a distribuição correta a ser utilizada é a distribuição “t” de Student, com (n-1) graus de liberdade. (supondo que a população seja normal). Obs: se a amostra for grande, pode utilizar-se a distribuição normal como aproximação.
Intervalo de Confiança Média ( desconhecido) normal t t
Interv.Conf. Média ( desconhecido) + - _ X t x ^ Int. Conf.: ^ n x s = População infinita ^ n x s = N -1 N -n População finita
Limites do Intervalo t - valor limite da distribuição t, para a probabilidade de erro , com (n-1) graus de liberdade. tabela t.
Exemplo Encontrar o valor limite de t/2 para: a) = 1%, com 19 graus de liberdade (amostra com 20 elementos) 2,861
Exemplo Encontrar o valor limite de t/2 para: a) = 10%, com 19 graus de liberdade (amostra com 20 elementos) 1,729
Exemplo Encontrar o valor limite de t/2 para: a) = 5%, com 19 graus de liberdade (amostra com 20 elementos) 2,093
Exemplo Encontrar o valor limite de t/2 para: a) = 5%, com 29 graus de liberdade (amostra com 30 elementos) 2,045
Exemplo Encontrar o valor limite de t/2 para: a) = 5%, com graus de liberdade 1,960 Comparar este resultado com Z0,025. 8
Exemplo Na construção de um motor, o diâmetro dos cilindros é de grande importância. Em uma pesquisa feita com 5 blocos com 4 cilindros cada (20 furos), o diâmetro médio encontrado foi 82 mm e o desvio padrão 0,1 mm. Construir um intervalo com 95% de confiança para este parâmetro.
Exemplo n = 20 (19 graus de liberdade) s = 0,1 mm X = 82 mm = 5% - da tabela: t19 = 2,093
Exemplo tc IC : LS = 82,05 mm LI = 81,95 mm 81,95 < m < 82,05 com 95% de confiança n s tc + - _ X 2,093 20 0,1 + - 82 0,05
Intervalo de confiança para a proporção População com proporção p (desconhecida). Amostra com n elementos e proporção p conhecidos.
Distribuição Amostral da Proporção p LI P LS (1-)
Intervalo de Confiança Limites: + - _ P n P(1-P) (População infinita)
Exemplo Foi retirada uma amostra com 100 itens de um grande lote de peças, sendo encontrados 10 defeituosos. Construa um intervalo de confiança com 3% de erro para a percentagem de defeituosos no lote.
Exemplo 1,5% Z0,05
Exemplo 3 p n Linf = 0,035 0,10.0,90 + 3 p n 0,10.0,90 Linf = 0,035 + - Lim= 0,10 2,17 100 Lsup = 0,165 0,0651
Tamanho de Amostras
Intervalo de Confiança Média _ X n + - Z/2 (população infinita) erro máximo (e)
Tamanho de Amostras 2 Z/2 x Média e = Z/2 (erro máximo ou margem de erro) n = (População infinita) 2 e Z/2 x
Tamanho de Amostras 2 Z/2 x 2 Z/2 x x N Z/2 x + e (N-1) Média n = (População infinita) 2 e Z/2 x n = (População finita) 2 Z/2 x x N Z/2 x + e (N-1)
Tamanho de Amostras Estimação “a priori” do desvio padrão: Estudos passados Amostra piloto Fixando-se um valor teórico
Intervalo de Confiança Proporção + - _ P n p(1-p) (População infinita) erro máximo (e)
Tamanho de Amostras 2 Proporção p (1-p) e = Z/2 n Z/2 n = (População infinita) p (1-p) Z/2 2 e
Tamanho de Amostras 2 2 Proporção Z/2 n = (População infinita) p (1-p) Z/2 2 e x p (1-p) x N Z/2 2 e (N-1) x p (1-p) + n = (População finita)
Tamanho de Amostras Estimação “a priori” da proporção: Estudos passados Amostra piloto Fixando-se um valor teórico (0,5)
Tamanho de Amostras Z 2 2 Se p = 0,5 máximo tamanho de amostra. n = x 0,25 Z 2 e (população infinita) n = 0,25 x Z x N 2 0,25 x Z + e x (N-1) (população finita)