Profa. Andréia Adami deiaadami@terra.com.br Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE0211 – Estatística Geral Profa. Andréia Adami deiaadami@terra.com.br
Relembrando Distribuição Normal 𝑋~𝑁 𝜇, 𝜎 2 se sua função densidade de probabilidade for dada por: 𝑓 𝑋 𝑥 = 1 𝜎 2𝜋 𝑒𝑥𝑝 − 𝑥−𝜇 2 2 𝜎 2 Distribuição Normal Padrão – valores de probabilidade tabelados 𝑧= 𝑥−𝜇 𝜎 𝑍~𝑁 0,1 se sua função densidade de probabilidade for dada por: 𝑓 𝑍 𝑧 = 1 2𝜋 𝑒𝑥𝑝 − 𝑧 2 2
Estimação de Parâmetros Avaliar certas características dos elementos da população com base nos dados de uma amostra. Relembrar algumas definições: População: é o conjunto de elementos para os quais desejamos que as conclusões da pesquisa sejam válidas; Parâmetro: é uma medida que descreve certa característica da população; Amostra aleatória simples: parte da população cujos elementos foram extraídos por sorteio.
Estimação de Parâmetros Estatística: alguma medida associada com os dados de uma amostra a ser extraída da população, também chamada de estimador; Erro amostral: é a diferença entre uma estatística e o parâmetro que se quer estimar; Estimativa: valor da estatística, calculado com base na amostra efetivamente observada.
Estimação de Parâmetros (características na população) Estatísticas (características da amostra) 𝜋= proporção de algum atributo, dentre os elementos da população 𝑝= proporção de elementos com o atributo de interesse, dentre os que serão observados na amostra 𝜇= média de alguma variável quantitativa, nos elementos da população 𝑥 = média da variável, a ser calculada com os elementos da amostra 𝜎= desvio padrão de uma variável, dentre os elementos da população 𝑠= desvio padrão da variável, a ser calculado com os elementos da amostra
Distribuição Amostral A distribuição amostral de uma estatística é a distribuição dos possíveis valores dessa estatística, se examinássemos todas as possíveis amostras de tamanho n, extraídas aleatoriamente de uma população.
Distribuição Amostral A distribuição amostral de uma estatística é a distribuição dos possíveis valores dessa estatística, se examinássemos todas as possíveis amostras de tamanho n, extraídas aleatoriamente de uma população. Distribuição amostral da média ( 𝑥 ) Distribuição amostral da proporção (p)
Distribuição Amostral da Média Consideremos uma população identificada pela variável X, cujos parâmetros média populacional, 𝜇=𝐸 𝑋 , e variância populacional, 𝜎 2 =𝑉𝑎𝑟 𝑋 , sejam conhecidos. Vamos retirar todas as possíveis AAS (amostra aleatória simples) de tamanho n dessa população e para cada uma das amostras iremos calcular a média amostral dada por 𝑋 . Estudaremos então a Distribuição Amostral da Média 𝑿
Distribuição Amostral da Média Teorema do Limite Central: Quando o tamanho da amostra (n) aumenta, independentemente da forma da distribuição da população (distribuição da variável aleatória X), a distribuição amostral de 𝑿 aproxima-se cada vez mais de uma distribuição Normal com média 𝝁 e variância 𝝈 𝟐 𝒏 . 𝑿 ~𝑵 𝝁, 𝝈 𝟐 𝒏
Distribuição Amostral da Média Teorema do Limite Central
Distribuição Amostral da Média Teorema do Limite Central Exemplo: Uma variável aleatória X tem distribuição Normal com média 𝜇=100 e desvio padrão 𝜎=10. Semana passada: 𝑃 90<𝑋<110 =? 𝑃 90−100 10 <𝑍< 110−100 10 =? 𝑃 −1,0<𝑍<1,0 =0,3413+0,3413=0,6826
Distribuição Amostral da Média Teorema do Limite Central Exemplo: Uma variável aleatória X tem distribuição Normal com média 100 e desvio padrão 10. Se desta população for retirada uma amostra de tamanho n=16 elementos. Qual a probabilidade de a média dessa amostra, 𝑋 , estar entre 90 e 110? 𝑃 90< 𝑿 <110 =? Temos que usar o Teorema do Limite Central
Distribuição Amostral da Média Teorema do Limite Central Para fazer a padronização da variável X (𝑋𝑍) tínhamos que subtrair a média de sua distribuição (𝜇) e dividir essa diferença pelo desvio padrão (𝜎). Para fazer a padronização da média amostral 𝑋 →𝑍 seguiremos o mesmo procedimento. Dado que: 𝑋 ~𝑁 𝜇, 𝜎 2 𝑛 𝑍= 𝑋 −𝜇 𝜎 2 𝑛
Distribuição Amostral da Média Teorema do Limite Central Exemplo: 𝑍= 𝑋 −𝜇 𝜎 2 𝑛 𝑃 90< 𝑿 <110 =𝑃 90−100 100 16 <𝒁< 110−100 100 16 =𝑃 −4,0<𝒁<4,0
Distribuição Amostral da Média Teorema do Limite Central 𝑃 −4,0<𝒁<4,0 ≈1,0000
Distribuição Amostral da Média Exemplo: Deseja-se estudar o tempo médio de estudo (em anos) da população adulta de um município. Sabe-se que o tempo de estudo (variável X) tem distribuição normal com média 𝝁=10,5 anos e desvio padrão σ = 2,6 anos. Qual probabilidade de que, entrevistados n = 25 indivíduos dessa população, o tempo médio de estudo ( 𝑿 ) seja inferior a 10 anos. X: tempo de estudo; 𝑿~𝑵 𝟏𝟎,𝟓; 𝟐,𝟔 𝟐 𝑿 : tempo médio de estudo; 𝑿 ~𝑵 𝟏𝟎,𝟓; 𝟐,𝟔 𝟐 𝟐𝟓
Distribuição Amostral da Média Exemplo: Deseja-se estudar o tempo médio de estudo (em anos) da população adulta de um município. Sabe-se que o tempo de estudo (variável X) tem distribuição normal com média 𝝁=10,5 anos e desvio padrão σ = 2,6 anos. Qual probabilidade de que, entrevistados n = 25 indivíduos dessa população, o tempo médio de estudo ( 𝑿 ) seja inferior a 10 anos. 𝑃 𝑿 <10 =? 𝑍= 𝑋 −𝜇 𝜎 2 𝑛 𝑿 : tempo médio de estudo 𝑿 ~𝑵 𝟏𝟎,𝟓; 𝟐,𝟔 𝟐 𝟐𝟓
Distribuição Amostral da Média Exemplo: Deseja-se estudar o tempo médio de estudo (em anos) da população adulta de um município. Sabe-se que o tempo de estudo (variável X) tem distribuição normal com média 𝝁=10,5 anos e desvio padrão σ = 2,6 anos. Qual probabilidade de que, entrevistados n = 25 indivíduos dessa população, o tempo médio de estudo ( 𝑿 ) seja inferior a 10 anos. 𝑃 𝑿 <10 =? 𝑍= 10−10,5 2,6 2 25 =−0,96
Distribuição Amostral da Média Exemplo: Deseja-se estudar o tempo médio de estudo (em anos) da população adulta de um município. Sabe-se que o tempo de estudo (variável X) tem distribuição normal com média 𝝁=10,5 anos e desvio padrão σ = 2,6 anos. Qual probabilidade de que, entrevistados n = 25 indivíduos dessa população, o tempo médio de estudo ( 𝑿 ) seja inferior a 10 anos. 𝑃 𝑿 <10 =𝑃 𝒁<−0,96 = =0,5−0,3315 =0,1685
Distribuição Amostral da Média com 𝜎 2 desconhecida Observe que, para utilização do teorema do limite central, temos que assumir que a variância populacional 𝜎 2 é conhecida. Entretanto, é muito pouco provável que em uma situação real ela realmente seja conhecida. Assim, faz-se necessário o uso do seguinte Teorema: Seja uma população descrita por uma variável 𝑋~𝑁 𝜇, 𝜎 2 da qual coleta-se infinitas amostras de tamanho 𝑛 a partir das quais são calculadas 𝑋 e 𝑠 2 . Então a variável T= 𝑋 −𝜇 𝑠 2 𝑛 , tem distribuição t de Student, que tem como único parâmetro a constante 𝝂=𝒏−𝟏 graus de liberdade.
Distribuição Amostral da Média com 𝜎 2 desconhecida 𝑫istribuição t de Student É semelhante à distribuição Normal, pois é simétrica em relação à média e tem forma campanular (sino); A distribuição t de Student é definida a partir de um único parâmetro, o número de graus de liberdade obtido por 𝜈=𝑛−1; Será bastante utilizada em testes de hipótese para média e diferença entre médias populacionais. Utilizaremos a distribuição t de Student na aula de teste de hipóteses.
Distribuição Amostral da Média com 𝜎 2 desconhecida 𝑬𝒙𝒆𝒎𝒑𝒍𝒐 A precipitação pluviométrica anual em uma certa região segue uma distribuição Normal com média 30mm e variância desconhecida 𝜎 2 . Para os nove últimos anos, foram obtidos os seguintes resultados: 30,5; 34,1; 27,9; 35,0; 26,9; 30,2; 28,3; 31,7; 25,8mm. ( 𝑠 2 =3,15). Qual a probabilidade da precipitação pluviométrica anual média ( 𝑋 ) ser superior a 31mm. 𝑃 𝑿 >31 =?
Distribuição Amostral da Média com 𝜎 2 desconhecida 𝑬𝒙𝒆𝒎𝒑𝒍𝒐 X: precipitação pluviométrica anual; 𝑿~𝑵 𝟑𝟎; 𝝈 𝟐 𝑿 : precipitação pluviométrica anual média; 𝑿 ~ 𝒕 𝜈 𝝂=𝒏−𝟏=𝟗−𝟏=𝟖 T= 𝑋 −𝜇 𝑠 2 𝑛 = 31−30 3,15 9 =1,69 𝑃 𝑿 >31 =𝑃 𝑻>1,69
Distribuição Amostral da Proporção ( 𝑝 ) Designemos uma variável X para cada ensaio de Bernoulli, onde há somente dois resultados possíveis: Sucesso (S) e Fracasso (F), com P[Sucesso]=p. Neste contexto, considerando n ensaios independentes, X1, X2, ... , Xn constitui uma amostra aleatória simples com reposição. Como os resultados individuais são 0 (fracasso) ou 1 (sucesso), 𝑖=1 𝑛 𝑋 𝑖 é o número de resultados favoráveis em n ensaios. Plantar 4 sementes (n=4). X: Avaliar cada semente (𝐺 ou 𝐺 ) Ensaio Bernoulli Y: Avaliar número de sementes germinadas Ensaio Binomial
Distribuição Amostral da Proporção Então, Y = X1 + X2 + ... + Xn = 𝑖=1 𝑛 𝑋 𝑖 = número de sucessos em n ensaios. Portanto, a proporção amostral de sucessos é dada por: 𝑝 = 𝑖=1 𝑛 𝑋 𝑖 𝑛 = 𝑋 , ou seja, 𝑝 é igual à média da variável aleatória Xi (i = 1, 2, ..., n). Y tem distribuição binomial 𝑌~𝐵𝑖𝑛(n, p) média 𝐸 𝑌 =𝑛𝑝 variância 𝑉𝑎𝑟 𝑌 =𝑛𝑝 1−𝑝 . Consequentemente, 𝐸 𝑝 =𝑝 e 𝑉𝑎𝑟 𝑝 = 𝑝(1−𝑝) 𝑛
Distribuição Amostral da Proporção Assim, pelo Teorema do Limite Central, quando n égrande (n>30), a proporção amostral de sucessos ( 𝑝 ) em uma amostra de tamanho n tem distribuição aproximadamente normal com: 𝜇=𝑝 e 𝜎 2 = 𝑝(1−𝑝) 𝑛 𝑍= 𝑋 −𝜇 𝜎 2 𝑛 = 𝑝 −𝑝 𝑝(1−𝑝) 𝑛
Distribuição Amostral da Proporção Exemplo: De um lote de produtos manufaturados, extrai-se uma amostra aleatória simples de 100 itens. Se 10% dos itens do lote são defeituosos, calcule a probabilidade de, nessa amostra, serem sorteados no máximo 12% itens defeituosos. Seja X = “número de itens defeituosos na amostra”. Então, X ∼ Bin(100; 0,1). 𝑃 𝑝 ≤0,12 =𝑃 𝑝 <0,12 +𝑃 𝑝 =0,12
Distribuição Amostral da Proporção Exemplo: De um lote de produtos manufaturados, extrai-se uma amostra aleatória simples de 100 itens. Se 10% dos itens do lote são defeituosos, calcule a probabilidade de, nessa amostra, serem sorteados no máximo 12%itens defeituosos(passa a ser 12,5%) Correção de continuidade 𝑃 𝑝 ≤0,125
Distribuição Amostral da Proporção Exemplo: 𝑍= 𝑝 −𝑝 𝑝(1−𝑝) 𝑛 = 0,125−0,10 0,10(1−0,10) 100 =0,83 𝑃 𝑝 ≤0,125 =𝑃 𝑍≤0,83 =0,5+𝑃 0≤𝑍≤0,83 = =0,5+0,2967=0,7967
Exercícios 1) Uma fábrica de sapatos tem uma máquina que corta peças de borracha comprimida para serem usadas em solas. A espessura dessas solas é uma variável aleatória com distribuição normal com desvio padrão igual a 2mm, com valor médio 𝜇. Para se tentar corrigir estas medidas, reajustando a máquina, é conveniente verificar a qualidade do produto, medindo espessura das solas de uma amostra aleatória retirada periodicamente da máquina. ....continua
Exercícios ...continuação De uma amostra de 5 elementos foram registadas as espessuras e calculada a média aritmética ( 𝑋 ). Se 𝑋 <24,8𝑚𝑚 ou 𝑋 >25,2𝑚𝑚 diz-se que a máquina não está controlada, pelo que é parada e reajustada. Com a média 𝜇 = 25 mm, qual a probabilidade de a amostra indicar que a máquina não está controlada? b) Se a média mudar para 𝜇= 25,3 mm, qual a probabilidade de a amostra indicar que a máquina não está controlada?
Exercícios 2) Uma proporção de 37% dos visitantes de um parque são favoráveis a cobrança de taxas de entrada. Uma amostra aleatória de 200 visitantes foi tomada. (a) Qual é a probabilidade de que na amostra de 200 visitantes pelo menos 40% sejam favoráveis a cobrança de taxas? (b) Qual é a probabilidade de que na amostra de 200 visitantes, a proporção de favoráveis a cobrança de taxas esteja entre 35% e 39%?
Exercícios 3) Uma empresa produz parafusos em duas máquinas. O comprimento dos parafusos produzidos em ambas é aproximadamente Normal com média de 20mm na primeira máquina e 25 mm na segunda máquina e desvio padrão comum de 4mm. Uma caixa com 16 parafusos, sem identificação, é encontrada e o gerente de produção determina que, se o comprimento médio for maior que 23 mm, então a caixa será identificada como produzida pela máquina 2. Especifique os possíveis erros nessa decisão e calcule as suas probabilidades.
Exercícios 4) No controle de qualidade de produtos, uma técnica comumente utilizada é a amostragem de aceitação. Segundo essa técnica, um lote inteiro é rejeitado se contiver mais do que um número determinado de itens defeituosos. A companhia X compra parafusos de uma fábrica em lotes de 5000 e rejeita o lote se uma amostra aleatória simples de 20 parafusos contiver pelo menos 2 defeituosos. Se o processo de fabricação tem uma taxa de 10% de defeituosos, qual é a probabilidade de um lote ser rejeitado pela companhia X?
Exercícios 5) A velocidade (em km/h) dos carros num túnel do Rio de Janeiro num horário de pouco movimento é uma variável aleatória com distribuição Normal com média 85 km/h e desvio padrão 10 km/h. A que velocidade você deve trafegar para estar entre os 5% mais rápidos? A velocidade máxima permitida no túnel é 80 km/h, mas há uma tolerância de 10% (e então, se você estiver a uma velocidade menor ou igual a 88 km/h não leva multa). Qual a probabilidade de um carro selecionado aleatoriamente ser multado? ...continua
Exercícios ...continuação (c) Toma-se uma amostra de 10 carros. Calcule a probabilidade de que a velocidade média dos carros na amostra seja maior que 100 km/h.