A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Aula 1. Introdução à Inferência Estatística

Apresentações semelhantes


Apresentação em tema: "Aula 1. Introdução à Inferência Estatística"— Transcrição da apresentação:

1 Aula 1. Introdução à Inferência Estatística
Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

2 Estatística Técnicas de amostragem População Amostra / dados
População é o conjunto de todos os elementos ou resultados sob investigação Amostra é qualquer subconjunto da população Técnicas de amostragem População Características Amostra / dados 𝑥 1 , 𝑥 2 ,…, 𝑥 𝑛 Informações contidas nos dados Análise descritiva Conclusões sobre as características da população Inferência estatística

3 Amostra representativa
População ↔ Amostra Exemplo 10.1: Consideramos uma pesquisa para estudar os salários dos 500 funcionários da Companhia M&B. Seleciona-se uma amostra de 36 indivíduos, e anotam-se os seus salários. População = 500 salários correspondentes aos 500 funcionários Amostra = 36 salários de funcionários selecionados Esperamos que amostra reflita as caraterísticas principais da distribuição populacional de salários da empresa = Amostra representativa

4 Amostra representativa
População ↔ Amostra Exemplo 10.3: Consideramos uma pesquisa para estudar a duração de vida útil de um novo tipo de lâmpadas, pois acredita-se que a duração desse novo tipo é maior. Então 100 lâmpadas do novo tipo são deixadas acesas até queimarem. População = a vida útil de todas as lâmpadas fabricadas ou que venham a ser fabricadas por essa empresa; = a distribuição de vida útil de lâmpada fabricada por empresa Amostra = tempos de vida observada de 100 lâmpadas selecionados Esperamos que amostra reflita as caraterísticas principais da distribuição populacional de vida útil de lâmpadas produzidas pela empresa = Amostra representativa

5 Técnicas de amostragem
População Características Amostra / dados 𝑥 1 , 𝑥 2 ,…, 𝑥 𝑛 A.A.S. Amostragem Aleatória Simples Aleatoriamente sorteia-se um elemento da população, sendo que todos os elementos têm a mesma chance de ser escolhidos. Repete-se o procedimento até que sejam sorteadas as n unidades da amostra. AAS com/sem reposição. AAS com reposição implica a propriedade de independência entre unidades selecionadas. Isso facilita o tratamento matemático de propriedades de estimadores que vamos construir em cima de amostra.

6 Amostra aleatória simples
Amostra / dados 𝑥 1 , 𝑥 2 ,…, 𝑥 𝑛 Amostra aleatória simples 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 Amostra Aleatória Simples de tamanho 𝑛 de uma variável aleatória 𝑋, com dada distribuição, é o conjunto de 𝑛 variáveis aleatórias independentes 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 cada uma com a mesma distribuição de 𝑋.

7 Amostra aleatória simples
Amostra / dados 𝑥 1 , 𝑥 2 ,…, 𝑥 𝑛 População Características é v.a. 𝑋 Amostra aleatória simples 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 Amostra Aleatória Simples de tamanho 𝑛 de uma variável aleatória 𝑋, com dada distribuição, é o conjunto de 𝑛 variáveis aleatórias independentes 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 cada uma com a mesma distribuição de 𝑋.

8 Amostra aleatória simples
Amostra / dados 𝑥 1 , 𝑥 2 ,…, 𝑥 𝑛 População Características é v.a. 𝑋 Amostra aleatória simples 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 Amostra Aleatória Simples de tamanho 𝑛 de uma variável aleatória 𝑋, com dada distribuição, é o conjunto de 𝑛 variáveis aleatórias independentes 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 cada uma com a mesma distribuição de 𝑋. Em caso de população 𝑋 contínua, com função de densidade 𝑓(𝑥), a densidade conjunta da amostra ( 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 ) será dada por 𝑓( 𝑥 1 , 𝑥 2 ,…, 𝑥 𝑛 ) tal que 𝑓 𝑥 1 , 𝑥 2 ,…, 𝑥 𝑛 =𝑓 𝑥 1 𝑓( 𝑥 2 )…𝑓( 𝑥 𝑛 )

9 Estatística Qualquer função de amostra ( 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 ) chamaremos estatística 𝑋 = 1 𝑛 𝑖=1 𝑛 𝑋 𝑖 𝑆 2 = 1 𝑛−1 𝑖=1 𝑛 𝑋 𝑖 − 𝑋 2 𝑋 (1) = min 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 𝑊= 𝑋 (𝑛) − 𝑋 (1) 𝑋 (𝑛) = max 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 𝑋 (𝑖) − 𝑖-gêsima maior observação da amostra

10 Amostra ↔amostra amostra ( 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 ) é vetor aleatório
é vetor de números observados estatística 𝑋 = 1 𝑛 𝑖=1 𝑛 𝑋 𝑖 é variável aleatória estatística 𝑥 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 é valor observado de 𝑋 estatística 𝑆 2 = 1 𝑛−1 𝑖=1 𝑛 𝑋 𝑖 − 𝑋 2 é variável aleatória estatística 𝑠 2 = 1 𝑛−1 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 2 é valor observado de 𝑆 2

11 distribuição amostral da estatística 𝑇 𝑛 = 𝑇 𝑛 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛
𝑇 𝑛 = 𝑇 𝑛 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 𝑇 𝑛 ~𝑔(𝑦) distribuição populacional 𝑋~𝑓(𝑥) distribuição amostral da estatística 𝑋 = 1 𝑛 𝑖=1 𝑛 𝑋 𝑖 𝑋 ~𝑁 𝜇, 𝜎 2 𝑛 distribuição populacional 𝑋~𝑁(𝜇, 𝜎 2 )

12 Distribuição amostral da média
Teorema. Seja 𝑋 uma variável aleatória com média 𝜇 e variância 𝜎 2 , e seja 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 uma amostra aleatória simples (AAS) de variável 𝑋. Então 𝐸 𝑋 =𝜇, 𝑉𝑎𝑟 𝑋 = 𝜎 2 𝑛 𝐸 𝑋 =𝐸 1 𝑛 𝑖=1 𝑛 𝑋 𝑖 = 1 𝑛 𝑖=1 𝑛 𝐸 𝑋 𝑖 = 1 𝑛 𝑖=1 𝑛 𝜇 = 1 𝑛 𝑛𝜇=𝜇 𝑉𝑎𝑟 𝑋 =𝑉𝑎𝑟 1 𝑛 𝑖=1 𝑛 𝑋 𝑖 = 1 𝑛 𝑖=1 𝑛 𝑉𝑎𝑟 𝑋 𝑖 = 1 𝑛 𝑖=1 𝑛 𝜎 2 = 1 𝑛 𝑛 𝜎 2 = 𝜎 2

13 Distribuição amostral da média
𝑍= 𝑋 −𝜇 𝜎/ 𝑛 = 𝑛 ( 𝑋 −𝜇) 𝜎 ≈ 𝑁 0,1 aprox

14 Distribuição amostral da média
Teorema. Seja 𝑋 uma variável aleatória normal com média 𝜇 e variância 𝜎 2 , 𝑋~𝑁(𝜇, 𝜎 2 ) , e seja 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 uma amostra aleatória simples (AAS) de variável 𝑋. Então 𝑋 ~𝑁 𝜇, 𝜎 2 𝑛 𝑍= 𝑋 −𝜇 𝜎/ 𝑛 = 𝑛 ( 𝑋 −𝜇) 𝜎 ~𝑁 0,1

15 distribuição amostral da
estatística 𝑛=5 𝑋 ~𝑁 2, 1 5 distribuição populacional 𝑋~𝑁(2,1)

16 Exemplo 10.11 𝑃 𝑋 −500 <2 =𝑃 498< 𝑋 <502 =
Uma máquina está regulada para encher pacotes de café automaticamente segundo a distribuição normal com média de 500 gramas e desvio padrão de 10 gramas. Colhendo-se uma amostra de 𝑛=100 pacotes e pesando-os. Qual é a probabilidade de encontramos a média 𝑥 defirindo de 500 g. de menos de 2 gramas. 𝑃 𝑋 −500 <2 =𝑃 498< 𝑋 <502 = =𝑃 −2<𝑍<2 ≈0.95

17 Distribuição amostral de proporção
distribuição populacional 𝑋~𝐵 (𝑝) 𝐸 𝑋 =𝑝 𝑉𝑎𝑟 𝑋 =𝑝(1−𝑝)

18 Distribuição amostral de proporção
𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 𝑋 𝑖 ~𝐵 (𝑝) 𝐸 𝑋 𝑖 =𝑝 𝑉𝑎𝑟 𝑋 𝑖 =𝑝(1−𝑝) 𝑍= 𝑋 −𝜇 𝜎/ 𝑛 = 𝑛 ( 𝑋 −𝜇) 𝜎 ≈ 𝑁 0,1 𝑍= 𝑛 ( 𝑝 −𝑝) 𝑝(1−𝑝) ≈ 𝑁 0,1

19 Exemplo 10.12 Suponha que 30% dos estudantes de uma escola sejam mulheres. Colhemos uma AAS de 𝑛=10 estudantes e calculamos 𝑝 proporção de mulheres na amostra. Qual probabilidade de que 𝑝 difere de 𝑝 em menos de 0,01? 𝐸 𝑝 =𝑝, 𝑉𝑎𝑟 𝑝 = 𝑝(1−𝑝) 𝑛 𝑝 ≈𝑁 𝑝, 𝑝 1−𝑝 𝑛 =𝑁(0.3, 0.021) 𝑃 𝑝 −𝑝 <0.01 =𝑃 −0.01< 𝑝 −𝑝<0.01 ≈ ≈𝑃 − <𝑍< =𝑃 −0.07<𝑍<0.07 =0.056

20 Dimensionamento da amostra
Da relação segue que o tamanho amostral n, dados  e a margem de erro , tem a forma onde z é tal que  = P(-z  Z  z) e Z ~ N(0,1). Entretanto, nesta expressão, n depende de p(1-p), que é desconhecido.  Como calcular o valor de n?

21 Gráfico da função p(1-p), para 0  p  1.
Pela figura observamos que: a função p(1-p) é uma parábola simétrica em torno de p = 0,5; o máximo de p(1-p) é 0,25, alcançado quando p = 0,5. Assim, na prática, substituímos p(1-p) por seu valor máximo, obtendo que pode fornecer um valor de n maior do que o necessário.

22 Pergunta: É possível reduzir o tamanho da amostra quando temos alguma informação a respeito de p?
Por exemplo, sabemos que: p não é superior a 0,30, ou p é pelo menos 0,80, ou p está entre 0,30 e 0,60. Resposta: Depende do tipo de informação sobre p. Em alguns casos, podemos substituir a informação p(1-p), que aparece na expressão de n, por um valor menor que 0,25.

23 Redução do tamanho da amostra
Vimos que, se nada sabemos sobre o valor de p, no cálculo de n, substituímos p(1-p) por seu valor máximo, e calculamos Se temos a informação de que p é no máximo 0,30 (p  0,30), então o valor máximo de p(1-p) será dado por 0,3x0,7 = 0,21. Logo, reduzimos o valor de n para

24 Agora, se p é pelo menos 0,80 (p  0,80), então o máximo valor de p(1-p) é 0,8x0,2 = 0,16, e temos
Mas, se 0,30  p  0,60, o máximo valor de p(1-p) é 0,5x0,5=0,25 e, neste caso, não há redução, ou seja,

25 Exemplo 3: No Exemplo 2, suponha que temos a informação de que no máximo 30% dos alunos da USP foram ao teatro no último mês. Portanto, temos que p  0,30 e, como vimos, o máximo de p(1-p) neste caso é 0,21. Assim, precisamos amostrar conseguindo uma redução de = 384 estudantes.

26 Intervalo de confiança para p
Vimos que a estimativa intervalar para p tem a forma: com e z tal que  = P(-z  Z  z) na N(0,1). Na prática, substituímos a proporção desconhecida p pela proporção amostral , obtendo o seguinte intervalo de confiança com coeficiente de confiança  :


Carregar ppt "Aula 1. Introdução à Inferência Estatística"

Apresentações semelhantes


Anúncios Google