A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Estatística Inferencial (cap. 7 Martins) Estatística descritiva – trata da organização, sumarização e descrição dos dados Estatística inferencial – métodos.

Apresentações semelhantes


Apresentação em tema: "Estatística Inferencial (cap. 7 Martins) Estatística descritiva – trata da organização, sumarização e descrição dos dados Estatística inferencial – métodos."— Transcrição da apresentação:

1 Estatística Inferencial (cap. 7 Martins) Estatística descritiva – trata da organização, sumarização e descrição dos dados Estatística inferencial – métodos que tornam possível a estimação de características de uma população baseadas nos resultados amostrais População é a totalidade de itens, objetos, ou pessoas sob consideração Amostra é uma parte da população que é selecionada

2 Amostragem Amostragem aleatória simples – todos os elementos da população têm igual probabilidade de compor a amostra; Se a população é finita, a escolha de uma amostra aleatória envolve a compilação de uma lista de todos os elementos da população, e a realização de sorteios para escolher os itens que irão compor a amostra

3 Níveis de mensuração As operações aritméticas e técnicas estatísticas admissíveis dependem do nível de mensuração da variável Nível nominal – a variável pode assumir duas ou mais categorias. Ex.: estado civil, religião. Não é possível realizar operações aritméticas. Estas variáveis são chamadas de variáveis categóricas Nível ordinal – quando as categorias mantêm uma relação de ordem. Ex.: escolaridade Nível intervalar – além de manter uma ordem, os intervalos de medição são iguais. Ex.: peso, altura, volume. Permite operações aritméticas básicas. Nível de razão – além das características do nível intervalar, o zero é real, é absoluto (não é arbitrário).

4 Medidas de posição e de dispersão X = Soma dos valores de x Número de observações = Σ x n X Dispersão Amostra (a) = 20, 19, 21 Amostra (b) = 30, 20, 10 Xa = 20Xb = 20 O que interessa é o desvio em relação à média

5 Medidas de posição e de dispersão X Dispersão Amostra (a) = 20, 19, 21 Amostra (b) = 30, 20, 10 Xa = 20Xb = 20 O que interessa é o desvio em relação à média, mas A variância amostral (S²), de uma amostra de n medidas é igual à soma dos quadrados dos desvios dividido por (n-1) S² = Σ (X i –X)² n-1 S = √ S² O desvio padrão (S),

6 Regra empírica O intervalo X ± S contém entre 60% e 80% de todas as observações amostrais O intervalo X ± 2S contém aproximadamente 95% de todas as observações amostrais Coeficiente de variação de Pearson Mede a dispersão relativa C.V = x 100 S X C.V 30% alta dispersão

7 Escore padronizado É outra medida relativa de dispersão Para uma medida Xi é dado por: Zi = X i –X S Um escore negativo indica que Xi está à esquerda da média e positivo à direita Exemplo: São dadas as médias e os desvios padrões das avaliações de duas disciplinas: Português Xp = 6,5 Sp = 1,2 Matemática Xm = 5,0 Sm= 0,9 Relativamente às duas disciplinas, em qual delas obteve melhor desempenho um aluno que tirou 7,5 em português e 6,0 em matemática?

8 Utilizando escore padronizado teremos: Zi = X i –X S Zp = 7,5 – 6,5 1,2 Zp = 0,83 Zm = 6,0 – 5,0 0,9 Zm = 1,11 Logo, o desempenho melhor foi em matemática, apesar da sua nota ter sido menor 33 -3  Xp= 6,5 Xm = 5,0 0,83 7,5 1,11 6,0

9 Outliers Observações que fogem das dimensões esperadas Considerar outliers as observações cujos escores padronizados sejam maiores do que 3, em valor absoluto 99,74 %  33 -3 

10 Distribuição normal padrão Z=0 ZiZi Uma tabela fornece a área em função de Z Área = probabilidade Z = X -  

11 Exercício 1 As alturas dos alunos de determinada escola são normalmente distribuídas com média 1,60 m e desvio padrão de 0,3 m. Encontre a probabilidade de um aluno medir entre 1,50 e 1,80m Z = 0  = 1,60  = 0,30 P (1,50 < X < 1,80) = P(Z 1 < Z < Z 2 ) Z1Z1 Z2Z2 Z = X -   Z 1 = 1,50 – 1,60 0,3 Z 1 = - 0,33 Z 2 = 1,80 – 1,60 0,3 Z 2 = 0,67 Solução

12 Exercício 1 - continuação Z = 0 Z1Z1 Z2Z2 Consultando a tabela: Área = 0,1293 p/Z 1 = 0,33 Área = 0,2486 p/Z 2 = 0,67 Logo, Área total = 0, ,2486 Área = 0,3779 ou P (1,50 < X < 1,80) = 37,79%

13 As alturas dos alunos de determinada escola são normalmente distribuídas com média 1,60 m e desvio padrão de 0,3 m. Encontre a probabilidade de um aluno medir mais de 1,75 m Exercício 2 X=1,60 1,75 Transformando em normal padrão 00,5 Consultando a tabela temos a área (amarela) que é 0,1915, logo a área azul será 0,5 – 0,1915 = 0,3085 A probabilidade de um aluno com mais de 1,75m é de 30,85% Solução

14 As alturas dos alunos de determinada escola são normalmente distribuídas com média 1,60 m e desvio padrão de 0,3 m. Encontre a probabilidade de um aluno medir menos de 1,48 m Exercício 3 1,481,60 -0,4 0 Z = 1,48 – 1,60 0,3 Z = - 0,4 Consultando a tabela temos a área igual (0,5 – 0,1554) = 0,3446 A probabilidade de um aluno com menos de 1,48m é de 34,46% Solução

15 As alturas dos alunos de determinada escola são normalmente distribuídas com média 1,60 m e desvio padrão de 0,3 m. Qual deve ser a medida mínima para escolhermos 10% dos mais altos? Exercício 4 Solução 0Z 10% mais altos, logo conhecemos a área e queremos determinar o valor de Z Consultando a tabela para uma área igual a 0,40 (0,5-0,1) temos Z=1,28 Z = (X – 1,60)/ 0,3 Logo X = (1,28x0,3) + 1,60 X = 1,98 Assim, a medida mínima para escolhermos os 10% mais altos é 1,98m

16 Inferência estatística Inferência ou indução estatística Estimador Parâmetro populacional Busca obter informações sobre a população a partir dos elementos amostrais  ^  População Amostra

17 Inferência estatística População  Amostra xsxs

18 Inferência estatística Pode ser feita por ponto ou por intervalo de confiança Exemplo: retira-se uma amostra aleatória de 500 brasileiros e calcula-se a média de suas alturas, encontrando-se 1,66. Uma estimativa pontual da verdadeira altura média (μ) é dada por X = 1,66m. Através do intervalo de confiança poder-se-ia encontrar um intervalo, por exemplo [1,58; 1,68] que, em 95% das vezes incluiria μ, o verdadeiro valor da média dos brasileiros

19 Intervalo de confiança α = erro 1- α = nível de confiança α = 5% 1- α = 95% 1- α - Z α/2 Z α/2 α/2

20 Intervalo de confiança O intervalo de confiança para a média populacional (μ) quando a variância (  ²) é conhecida X - Z α/2 ≤ μ ≤ X + Z α/2  √n  P [ ] = 1- α

21 Exemplo : a duração da vida de uma peça é tal que  horas. Foram amostradas 100 dessas peças obtendo-se a média de 500 horas. Deseja- se construir a verdadeira duração média da peça com um nível de 95%. Solução Do enunciado do problema se tem:  n = 100 X = 500 (1- α)100 = 95%

22 95% - Z α/2 = -1,96 Z α/2 = 1,96 2,5% Para se encontrar o valor de Z α/2 entrou- se na tabela com 0,475 X - Z α/2 ≤ μ ≤ X + Z α/2  √n  P [ ] = 1- α Substituindo os valores na fórmula abaixo Solução Do enunciado do problema se tem:  n = 100 X = 500 (1- α)100 = 95% P[ 500 – 1,96. 5/√100 ≤ μ ≤ ,96. 5/√100] = 95% P[ 499,02≤ μ ≤ 500,98] = 95% Intervalo de confiança

23 Estimativa de intervalo Ex.: O intervalo [ 1,60m; 1,64m] contém a altura média dos moradores do município X, com um nível de confiança de 95%. O risco do erro de inferência será de 5%, isto é, se tomarmos 100 amostras de tamanhos iguais, poderíamos esperar que 95 desses intervalos iriam conter o parâmetro populacional 

24 Amostragem Amostra é um subconjunto da população que deve de fato representar toda a população População Amostra N n n N = fração amostral

25 Tamanho da amostra para se estimar a média de uma população finita n = Z.  d [] 2 Amostragem Z = abscissa da distribuição normal padrão d = erro amostral, máxima diferença entre  e x admissível  = desvio padrão da população n = tamanho da amostra aleatória simples Z = 1,96 para um nível de confiança de 95% Z = 2,57 para um nível de confiança de 99% Z = 2,0 para um nível de confiança de 95,5%

26 Exemplos Suponha que a variável escolhida em um estudo seja o peso de uma certa peça, e que a população é infinita. O desvio padrão é de 10kg. Admitindo-se um nível de confiança de 95,5% e um erro amostral de 1,5 kg, qual deve ser o tamanho da amostra? n = Z.  d [] 2 Z = 2,0 d = 1,5 kg  = 10kg n = tamanho da amostra aleatória simples n = ,5 [] 2 = 178 Z = 2,0 para um nível de confiança de 95,5%


Carregar ppt "Estatística Inferencial (cap. 7 Martins) Estatística descritiva – trata da organização, sumarização e descrição dos dados Estatística inferencial – métodos."

Apresentações semelhantes


Anúncios Google