Amostragem Pontos mais importantes:

Slides:



Advertisements
Apresentações semelhantes
Estimação de parâmetros
Advertisements

PESQUISA DE MARKETING 1 Metodologia Planejamento Prof. Dr. Fauze Najib Mattar.
Intervalos de Confiança
ESTATÍSTICA INFERÊNCIA ESTATÍSTICA
Medidas de Dispersão.
ESTIMAÇÃO.
Estatística Descritiva Aula 02
Medidas de Posição e Dispersão
Estatística 9 - Estimação de Parâmetros por Intervalo
Estatística 8 - Distribuições Amostrais
Estatística Básica Utilizando o Excel
Capítulo 5 A Distribuição Normal de Probabilidade
Capítulo 6 Estimativas e Tamanho de Amostras
ALGUMAS MEDIDAS ASSOCIADAS A VARIÁVEIS QUANTITATIVAS
MEDIDAS DE DISPERSÃO Medidas de tendência central fornecem um resumo parcial das informações de um conjunto de dados. A necessidade de uma medida de variação.
Estatística Aplicada (Aula 4)
Análise de Dados.
Distribuição de probabilidade
Distribuição de probabilidade
Estatística Descritiva
Estatística Descritiva
Probabilidade e estatística-Mat013
ESTATÍSTICA.
ESTATÍSTICA.
ESTATÍSTICA.
Aula 0. Doces Lembranças de MAE0219
Estatística Descritiva (I)
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2014 Intervalo de Confiança Camilo Daleles Rennó
DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO DA AMOSTRA OU
DISTRIBUIÇÃO AMOSTRAL DA MÉDIA DA AMOSTRA OU DISTRIBUIÇÃO AMOSTRAL DE
Amostragem: Média e desvio-padrão amostral Prof. Helcio Rocha
Quais são, suas médias, medianas e modas?
DISTRIBUIÇÕES AMOSTRAIS
Estatística Para um dado conjunto de dados, podemos calcular as seguintes grandezas: 1) Medidas de posição 2) Medidas de dispersão 3) Parâmetros de simetria.
ESTATÍSTICA.
ESTATÍSTICA DECRITIVA
Erros e variáveis aleatórias
Modelagem Estatística
O que é Estatística, afinal de contas?
Modelos de distribuição de erros
ESTATÍSTICA.
Site: Estatística Prof. Edson Nemer Site:
ANÁLISE ESTATÍSTICA II
Distribuição da Proporção Amostral
ANÁLISE ESTATÍSTICA II
Site: Estatística Prof. Edson Nemer Site:
Inferência Estatística
Probabilidade e Estatística Exemplo da Moeda Balanceada
Medidas de tendência central e de dispersão
Medidas de Dispersão Aula 8.
Modelagem Estatística
DISTRIBUIÇÃO NORMAL.
Distribuição da Amostra
Aula 10 - Distribuição normal, distribuição amostral da média
Estatística Descritiva
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Inferência Estatística Camilo Daleles Rennó
Revisão básica Distribuição normal: conhecido o valor de z, podemos dizer qual a probabilidade de encontrar valores entre quaisquer dois números. Por.
Estimativas de grandezas cap 2. e cap 3 Média Desvio Padrão e Variância Definições importantes Distribuição Normal Teorema do limite central Hipóteses.
PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA
Metodologia da Pesquisa em Ensino de Ciências I
Estatística Básica usando o José CARDOSO Neto Professor Associado Departamento de Estatística - UFAM 26 a 30 de outubro de 2015 IX.
ANÁLISE DE DADOS EM BIOLOGIA
Estimação: Estimativa Pontual Estimativa Intervalar
1 Estatística Descritiva (I). 2 O que é Estatística A Estatística originou-se com a coleta e construção de tabelas de dados para o governo. A situação.
Média e valor médio No estudo da estatística descritiva, para além das tabelas de frequências e gráficos, estudam-se outros métodos para resumir a informação.
GESTÃO E GARANTIA DA QUALIDADE
Estimação e Intervalo de Confiança. Estimação Frequentemente necessitamos, por meio das amostras, conhecer informações gerais da população. A estimação.
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
Estatística Aplicada à Administração Prof. Alessandro Moura costa UNIVERSIDADE FEDERAL DO PAMPA BACHARELADO EM ADMINISTRAÇÃO DE EMPRESAS.
INFERÊNCIA ESTATÍSTICA
Transcrição da apresentação:

Amostragem Pontos mais importantes: -amostra: parâmetros e estatísticas -medidas de tendência central: média, mediana e moda -medidas de dispersão: variância -distribuição empírica e histograma -escolha de amostras aleatórias -amostragem de distribuição normal, teorema de limite central -distribuições t e c2 -amostragem de distribuição binomial 1

Num estudo confronta-se com uma grande colecção (quantidade) de elementos de interesse ou população. Geralmente as conclusões sobre a população está baseada de analise de um número (pouco) de observações ou amostra. amostra população amostragem analise conclusões Definição: Um conjunto de v.a-s independentes X1, X2,...,Xn com a mesma distribuição Fx constitui uma amostra da distribuição Fx. 2

Para tirar conclusões válidas (correctas) sobre qualquer população, a amostra tem de ser representativa Amostra Como tirar uma amostra representativa? Tamanho? Amostra mais representativa é uma amostra aleatória Amostra aleatória: qualquer membro de população têm a mesma probabilidade de ser escolhido como uma mostra 3

Uma medida directamente associada a população: Parâmetros Estatísticas Uma medida directamente associada a população: - valor de esperança (m) - variância - etc. Quantidades calculadas (completamente determinadas pela) de uma amostra: -média amostral -variância amostral -etc. As estatísticas são estimativas dos parâmetros da população. Cada amostra duma população resulta noutra estimativa estatísticas são v.a.-s. 4

Medidas de tendência central: Valor média (pesada) de v.a. X: E[X]=m Definição de média amostral: 5

é uma v.a., por isso: No caso que m não ser conhecido, a média amostral representa uma estimativa natural. 6

A mediana (m), é o valor central de distribuição (Fx(m)) no sentido em que é igualmente provável obter x superior ou inferior a m. P(Xm)=P(Xm)= 1/2 ou F(m)=1/2 Suponha que nos queremos escolher c numa forma que o erro absoluto |X-c| (ou E[|X-c|]) de previsão de X seja mínimo: 7

xk=0.5(x(0.5n)+x0.5n+1) se n é par xk= x(0.5(n+1)) se n é ímpar Nota: De igual modo, podemos definir outros Percentis(x), e.g 25%, 50% (m), 75% Exemplo: calcule a mediana de distribuição Weibull, x>0 Definição da mediana amostral (xk): seja X1 X2 ...  Xn uma amostra ordenada, a mediana amostral é: xk=0.5(x(0.5n)+x0.5n+1) se n é par xk= x(0.5(n+1)) se n é ímpar A mediana amostral representa uma estimativa natural de m 8

Exemplo: n=7, concentração de CO2 (g/m3): 0.3, 0.32, 0.35, 0.35, 0.4, 0.41 e 0.42 -> mediana (i=4): 0.35 n=8, concentração de CO2 (g/m3): 0.3, 0.32, 0.35, 0.35, 0.4, 0.41, 0.405 e 0.42 -> mediana ((x4+x5)/2): 0.375 9

O valor mais frequente numa população chama-se moda (a): A moda de uma amostra aleatória é o valor que ocorre com a maior frequência. Exemplo: n=8, concentração de CO2 (g/m3): 0.3, 0.32, 0.35, 0.35, 0.4, 0.41, 0.405 e 0.42 -> moda : 0.35 10

Medidas de dispersão: Variância da v.a. X: Var[X]=s2= E[(X-m)2] A estatística, variância e desvio padrão amostral, é definida pela: e ou 11

12 Grau de liberdade: a expressão anterior também se escreve, onde n é o grau de liberdade. Porque n=n-1? Isto implica que qualquer n-1 y determine o n-issimo elemento. Só n-1 elementos são independentes. 12

O que podemos dizer sobre o valor de esperança de S2? Agora sabendo: ; ; Temos: e A variância amostral representa uma estimativa natural de s2 13

Distribuições empíricas: Às vezes, podemos querer obter informação global sobre a distribuição da população (não só sobre os parâmetros). A função de distribuição empírica Fn(x), onde -<x< , é definida pela V.a. discreta, a função de distr. de probabilidade empírica(pn): pn(j) também chama-se proporção. 14

Exemplo: Amostra: 3 2 2 4 4 5 5 5 1 3 6 1 1 6 3 3 2 3 4 6 1 1 3 4 2 4 5 3 3 1 Amostra ordenada: 1 1 1 1 1 1 2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 4 4 5 5 5 5 6 6 6 Distribuição empírica: 1 2 3 4 5 6 p(xi) 6/30 4/30 8/30 5/30 3/30 F(xi) 10/30 18/30 23/30 27/30 30/30

V.a. continua, a função de distr. de frequência (fn): O gráfico de distribuição de frequência chama-se histograma: 60 50 40 frequency 30 20 10 2 4 6 8 10 16 F-value, min

Selecção de amostras aleatórias: Descrição mais representativa das propriedades da população é fornecida por uma amostra aleatória, onde qualquer membro da população têm a mesma probabilidade de ser escolhido. Como? Distribuição uniforme(U(a,b)): f(x) (b-a)-1 E[X]= (b+a)/2 a b Var(X)= (b-a)2 /12 U(0,1) chama-se número aleatório 17

Seja k uma amostra aleatória de n elementos. Para j=1,2, Seja k uma amostra aleatória de n elementos. Para j=1,2,...,n vamos definir: Para o primeiro elemento I1: P(I1=1)=k/n Para o segundo elemento I2: P(I2=1| I1=1)=(k-1)/(n-1) e, P(I2=1| I1=0)=(k)/(n-1) ou P(I2=1| I1)=(k-I1)/(n-1) Em geral: 18

Seja U um número aleatório (U(0,1)), assim P(U<a)=a 19

Escolha aleatoriamente k=2 de n=5 20

U1(0.68587)>0.4 U2(0.25848)<0.5  (2,X) U3(0.85227)>1/3 U4(0.78724)>0.5 (2,5) 21

Amostragem de distribuição normal: Distribuição normal (N(m,s2)): A distribuição normal tem importância elevada entre as distribuições especiais, porque muitos fenómenos seguem, pelo menos aproximadamente, distribuição normal: -altura de pessoas -movimento “Braun” das moléculas -o erro na medição de uma quantidade física 22

E[X]=m Var[X]=s2 s- inflexão m m-s 23

Seja X N(m,s2), a Y=aX+B é uma v.a. N(am+b,a2s2). Por isso a variável Z=(x-m)/s tem uma N(0,1): Z chama-se distr. normal padrão, e permite-nos facilmente calcular as probabilidades de X em termos de probabilidade de Z. 24

P(X>m-s, X<m+s)68% P(X>m-2s, X<m+2s) 96% f(x) P(X>m-s, X<m+s)68% P(X>m-2s, X<m+2s) 96% -tabelas de P(z<x)=f(x) para calcular probabilidades -Exemplo: m=3 e s2=16, calcule X<7 25

f(z) 26

Teorema de limite central: A soma de um grande número de variáveis aleatórias independentes tem uma distribuição normal. Fenómenos físicos (e não só) estão afectados por um grande número de factores, consequentemente seguem uma distr. normal. Seja X1, X2,..., Xn v.a.s independentes com a mesma distribuição (mas não necessariamente normal) com m e s2. Então para n grande: Muitas técnicas de estatística estão baseadas de pre-suposição de normalidade -exemplo: distr. da média do lançamento de n dados 27

28

Recordar: e Assim: Variância da população é estimada pela s2. O que podemos dizer sobre a distribuição de t=(x-m)/s ou ? t tem uma distribuição conhecida que chama-se distribuição Student “t” com n grau de liberdade. 29

f(t)- complicado (tabelas) Distribuição Student tn: Seja Z [N(0,1)] e X (c2n) duas v.a. independentes. Distribuição t está definida pela, -  t   n f(t)- complicado (tabelas) E[t]=0 Var[t]=n/(n-2) para n grande t~Z 30

31

tem uma distribuição chi-quadrado com n graus de liberdade. X>0 Outra característica importante da amostra de uma distribuição normal, é que X e s2 são independentes, e a v.a. (n-1)s2/s2 tem uma distribuição c2 com n-1 grau de liberdade Distribuição “Chi-quadrado”, c2(n): Se foram Z,1, Z2,... Zn v.a. normais padrão. A v.a. X: X= Z21+ Z22,...+ Z2n tem uma distribuição chi-quadrado com n graus de liberdade. X>0 n f(x)- complicado (tabelas) E[X]=n Var[X]=2n 32

33

Porquê é importante saber a distribuição de e X=(n-1)s2/s2 ? Porque podemos dar respostas sobre questões como: -qual é a probabilidade da média da população ser m , se a média de amostra é x -qual é a probabilidade da variância da população ser s2 , se a variância de amostra é s2 34

Amostragem de distribuição binomial: Distribuição Bernoulli e binomial (Bi(n,p)): Seja X é uma v.a. Bernoulli tal que, X=1 quando um acontecimento ocorre (sucesso) e X=0 no caso que não ocorre (falha). E.g. resposta “sim” num inquérito tipo sim/não P(X=0)= 1-p P(X=1)= p E[X]=1P(X=1) + 0P(X=0)= p Var(X)=E[X2]- E2[X]=p-p2=p(1-p) 35

Suponha que faça-se n experiências independentes de uma variável aleatória Bernoulli com probabilidade P de sucesso. Neste caso o número de sucesso X, chama-se uma variável binomial (Bi(n,p)) com a função distr. de probabilidade: O valor de esperança matemática e a variância é dada por: 36

37

Aplicando o teorema de limite central, temos que a v. a. X= X1+ X2, Aplicando o teorema de limite central, temos que a v.a. X= X1+ X2,..., +Xn tem uma distribuição aproximadamente normal. Se for np suficientemente grande, Assim, 38