Intervalo de confiança

Slides:



Advertisements
Apresentações semelhantes
POLINÔMIOS. Polinômio ou função polinomial na variável complexa x é toda função P: ℂ → ℂ definida por P(x) = a n x n + a n–1 x n–1 + a n–2 x n–2 +...
Advertisements

O Processo de Poisson Série: Processos Estocásticos Disciplina: Métodos Matemáticos 1C Dennis S. Poisson, Sceaux, France.
Estatística Aula 16 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.
Com isto a variável (que geralmente é o X) terá um único valor!
1) Defina sequências numéricas.
RODOLFO SOARES TEIXEIRA OBMEP NA ESCOLA
Estatística aplicada a ensaios clínicos
Medições – parte I: Precisão.
ESTATÍSTICA AULA 15 Testes de hipóteses – Unidade 10
ESTATÍSTICA AULA 11 Modelos probabilísticos mais comuns – Unidade 7
Probabilidade e Estatística Aplicadas à Contabilidade II
Aprendizado de Máquina
DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO
Probabilidade e Estatística Aplicadas à Contabilidade I
Distribuições de Probabilidade
RODOLFO SOARES TEIXEIRA OBMEP NA ESCOLA
ESTATÍSTICA AULA 07 PROBABILIDADE – Unidade 5 Conceitos básicos
Estimação de Parâmetros – Unidade 9 Professor Marcelo Menezes Reis
Fundamentos de Eletricidade
Medidas de Dispersão.
Regressão com uma variável dependente Binária
Probabilidade e Estatística Aplicadas à Contabilidade I
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2017 Intervalo de Confiança Camilo Daleles Rennó
ESTATÍSTICA AULA 12 Inferência Estatística e Distribuição Amostral – Unidade 8 Professor Marcelo Menezes Reis.
EAL ESTATÍSTICA, PLANEJAMENTO E OTIMIZAÇÃO DE EXPERIMENTOS
Introdução à Integral Definida
Distribuições de Probabilidade
Curso de Medicina/Nutrição Ms.Rosebel Trindade Cunha Prates
A.L. 1.0│Medição em Química.
TESTES DE HIPÓTESES.
Laboratório 2 de Fundamentos de Física e Matemática Revisão das atividades do Lab anterior: Plot de Graficos – Maximos locais e globais.
LIMITE DE UMA FUNÇÃO Aula 01 – Matemática I – Engenharia de Aquicultura Prof. Danilene Donin Berticelli.
Prof. Eduardo Bezerra (CEFET/RJ)
Métodos Numéricos de Determinação de Raízes: Bisseção, Secante e Newton-Raphson Professor.: Heron Jr.
Intersecção e Reunião de Intervalos
Ms.Rosebel Trindade Cunha Prates
TEORIA DOS NÚMEROS Aluno: Mauricío George – Princípio da Boa Ordenação
A.L. 1.0│Medição em Química.
Introdução à Integral Definida
DISTRIBUIÇÕES AMOSTRAIS
AULA 5 ESTATÍSTICA DANIEL PÁDUA.
Prof. Elisson de Andrade
TEMA V Estatística.
Profa. Dra. Andreia Adami
INTEGRAL DEFINIDA APLICAÇÕES
Profa. Andréia Adami Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE0211 – Estatística Geral Profa.
Amostragem e estimadores
Estatística amintas paiva afonso.
Prof. Elisson de Andrade
Profa. Andréia Adami Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE0211 – Estatística Geral Profa.
Amostragem e estimadores
Revisão de inferência.
Unidade 6 – Desenho da amostra Aspectos técnicos
Variância e Desvio padrão
Métodos Quantitativos
INTEGRAÇÃO POR SUBSTITUIÇÃO
Profa. Andréia Adami Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE0211 – Estatística Geral Profa.
Prof. Antonio Lopo Martinez
...semana que vem: laboratório!
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2018 Intervalo de Confiança Camilo Daleles Rennó
Aula 05 Distribuição de freguência Prof. Diovani Milhorim
Metodologia da Pesquisa em Ensino de Ciências I
Probabilidade e Estatística Aplicadas à Contabilidade II
Técnicas de análise da conjuntura
Prof. Elisson de Andrade
Planejamento Financeiro e Orçamentário
Análise ESTÁTICA COMPARATIVA
Estatística descritiva: medidas DE dispersão
Distribuição Binomial
Análise de equilíbrio em economia
Transcrição da apresentação:

Intervalo de confiança Prof. Elisson de Andrade eapandra@uol.com.br

Relembrando onde paramos Quando falamos sobre ESTIMADORES, era dado um intervalo e calculávamos qual a probabilidade de a verdadeira média estar dentro dele.

Relembrando onde paramos Agora a questão se inverte Também vamos trabalhar com amostras e a questão é: calcular um INTERVALO que nos dê alguma % de confiança, de a média estar dentro dele Vamos melhorar essa compreensão, ao longo dos próximos slides...

Amostra POPULAÇÃO Parâmetros: μ e σ

Amostra POPULAÇÃO A partir dessa amostra vamos fazer inferências sobre a média da população μ Parâmetros: μ e σ

Intervalo de Confiança Com as amostras, podemos calcular o estimador de μ 𝑋 = 𝑥 𝑖 𝑛 Porém, agora faremos uma estimativa INTERVALAR

NOTA Estimativa Intervalar = Estimativa Pontual + − Margem de erro Estimativa Intervalar = 𝑋 + − Margem de erro

Intervalo de Confiança Nível de confiança representado pela letra grega Gama: 𝛾 Em geral, busca-se trabalhar com um nível de confiança entre 90% e 99% - mais comum é 𝛾 = 95% Outra forma de representá-lo: 𝛾=1−𝛼 Sendo que 𝛼 é o nível de significância – o “erro”

Interpretação Importante Se pegarmos uma amostra e definirmos um intervalo de confiança a 95%. Suponha que 𝑋 = 100 e intervalo 95 e 105. Não podemos dizer que existe 95% de chance de a verdadeira média estar entre 95 e 105 O que podemos dizer é que, ao repetirmos várias amostras de 𝑋 , 95% DOS INTERVALOS conteriam o valor de μ

Vamos para um exemplo

Fixe seu olhar num ponto da tabela e siga para baixou ou para a direita, 3 grupos de 5 números de 00 a 99 cada Agora, para cada grupo de 5 números, anote seu valor respectivo da tabela a seguir

Uma vez que anotou 3 grupos de 5 valores dentro deles, tire as médias de cada grupo Lembre-se: o objetivo é compreender o que significa INTERVALO DE CONFIANÇA de um conjunto de amostras

Intervalo de confiança para μ quando σ é conhecido Esse é o nosso caso. Anote o valor de σ = 948,31

Quando σ é conhecido Para desenvolver uma estimativa intervalar da média, vamos precisar do desvio padrão σ da população ou o amostral S Em muitas aplicações práticas, não temos σ Obs: quando se tem muitos dados históricos, é possível calcular o desvio padrão da população antes de fazer a amostra

Quando σ é conhecido 𝜎 𝑋 = 𝜎 𝑛 Já vimos em aulas passadas que: A distribuição de 𝑋 vai ter distribuição Normal se X tem distribuição normal, ou vai se aproximar de uma Normal quando n é grande 𝑋 é um estimador não-tendencioso de μ E que o desvio padrão de 𝑋 é: 𝜎 𝑋 = 𝜎 𝑛

Para o nosso exemplo 𝜎 𝑋 = 𝜎 𝑛 𝜎 𝑋 = 948,31 5 =424,097 𝜎 𝑋 = 𝜎 𝑛 𝜎 𝑋 = 948,31 5 =424,097 Guardemos esse valor...

Quando σ é conhecido Sesejamos, através de uma amostra, obter uma estimativa de μ Na verdade, queremos um indicador de PRECISÃO dessa estimativa Qual a variabilidade de 𝑋 ?

Formalização Matemática

Quando σ é conhecido 𝑍= 𝑋 −𝜇 𝜎 𝑋 𝑃 −𝑍 0 < 𝑋 −𝜇 𝜎 𝑋 < +𝑍 0 =𝐶 Para prosseguir, vamos trabalhar com a normal reduzida 𝑍= 𝑋 −𝜇 𝜎 𝑋 Qual a probabilidade (C) de Z estar entre 2 valores –Z0 e +Z0? Em termos matemáticos P(–Z0 < Z < +Z0) = C Substituindo: 𝑃 −𝑍 0 < 𝑋 −𝜇 𝜎 𝑋 < +𝑍 0 =𝐶

Quando σ é conhecido Continuando 𝑃 −𝑍 0 < 𝑋 −𝜇 𝜎 𝑋 < +𝑍 0 =𝐶 𝑃 −𝑍 0 < 𝑋 −𝜇 𝜎 𝑋 < +𝑍 0 =𝐶 Passando 𝜎 𝑋 multiplicando e 𝑋 subtraindo, temos: 𝑃 −𝑍 0 𝜎 𝑋 − 𝑋 <−𝜇< +𝑍 0 𝜎 𝑋 − 𝑋 =𝐶 Multiplicando todos os termos por -1, para μ ficar com sinal positivo: 𝑃 𝑍 0 𝜎 𝑋 + 𝑋 >𝜇> −𝑍 0 𝜎 𝑋 + 𝑋 =𝐶

Quando σ é conhecido Para facilitar, os livros preferem a expressão: 𝑃 𝑋 − 𝑍 0 𝜎 𝑋 <𝜇< 𝑋 + 𝑍 0 𝜎 𝑋 =𝐶 Vamos supor que desejamos uma probabilidade de 95% de μ estar nesse intervalo. Logo, na tabela, vemos que esse valor é Z = 1,96 Portanto, a expressão ficaria: 𝑃 𝑋 −1,96 𝜎 𝑋 <𝜇< 𝑋 +1,96 𝜎 𝑋 =0,95

No nosso Exemplo Substituindo o valor do desvio padrão de 𝑋 𝑃 𝑋 −1,96 . 424,097<𝜇< 𝑋 +1,96 . 424,097 =0,95 𝑃 𝑋 −831,23<𝜇< 𝑋 +831,23 =0,95

Quando σ é conhecido O que essa expressão significa? 𝑃 𝑋 −831,23<𝜇< 𝑋 +831,23 =0,95 Interpretação: Se considerarmos um grande número de amostras, os intervalos delimitado acima incluirão μ em 95% das amostras Veja que a interpretação NÃO deve ser feita para uma única amostra, de um único valor de 𝑋

Quando σ é conhecido Usando a expressão abaixo: 𝑃 𝑋 −831,23<𝜇< 𝑋 +831,23 =0,95 Calcule os intervalos, para cada uma de suas 3 amostras Agora vamos testar, sabendo que o valor do verdadeiro μ = 2473,72 A ideia é que 95% dos intervalos que calculamos tenham esse valor de μ dentro dele Vamos verificar isso com a classe POR FAVOR, GUARDEM ESSES VALORES CALCULADOS PARA A PRÓXIMA AULA

Conceitualmente: - CORRETO DIZER: 95% de probabilidade de o intervalo conter o μ - INCORRETO: 95% de probabilidade de o μ estar dentro do intervalo

Existe uma chance de 95% do meu intervalo calculado conter μ Eu sei o valor de μ Calculei um Intervalo

Qual a probabilidade de μ estar dentro do meu intervalo? 0% ou 100% Qual a probabilidade de μ estar dentro do meu intervalo? Eu sei o valor de μ Calculei um Intervalo

Matematicamente Estimação intervalar: 𝑃 𝑋 −831,23<𝜇< 𝑋 +831,23 =0,95 Interpretação: 95% dos intervalos construídos para cada 𝑋 conterão μ Em contraponto: 𝑃 15000<𝜇<25000 =0,95 → INCORRETO Pois 𝑃 15000<𝜇<25000 é igual a zero ou um, dado que μ é uma constante que pertence ou não ao intervalo

Exemplo Variável aleatória X com média desconhecida e σ = 25. Suponha que para estimar μ tomemos uma amostra simples de n=100 Logo, 𝜎 𝑋 = 𝜎 𝑛 =2,5 Substituindo na fórmula apresentada no slide anterior 𝑃 𝑋 −1,96 . 2,5<𝜇< 𝑋 +1,96 . 2,5 =0,95 𝑃 𝑋 −4,9<𝜇< 𝑋 +4,9 =0,95 Para um grande número de amostras, μ estará entre esse intervalo em 95% dos casos

Conclusões Preliminares Quando estimamos um intervalo de confiança para μ estamos fazendo uma estimativa por intervalo, que se opõe à estimativa por ponto (onde achamos apenas um valor de 𝑋 ) O tamanho do intervalo dá uma ideia de PRECISÃO da estimativa É certo que o próprio 𝜎 𝑋 já é por si uma medida de precisão de 𝑋 Porém, o valor de 𝜎 𝑋 em geral é desconhecido Para isso, precisamos estimar 𝜎 𝑋 através de 𝑆 𝑋

Intervalo de confiança para μ quando σ NÃO é conhecido

Quando σ é NÃO é conhecido Sabemos que o desvio padrão de uma amostra é: 𝑆= 𝑋 𝑖 − 𝑋 2 𝑛−1 Chamamos o denominador (n – 1) de GRAUS DE LIBERDADE Dá uma ideia de “quanta informação” estamos utilizando para estimar parâmetros populacionais desconhecidos Logo, a precisão de 𝑆 varia conforme o número de graus de liberdade À medida que n aumenta, aumenta o número de graus de liberdade, e a distribuição de 𝑆 tende a se concentrar em torno de σ

Quando σ é NÃO é conhecido Vimos também que a estimativa da variância de 𝑋 é dada por: 𝑆 𝑋 = 𝑆 𝑛 Como 𝑆 𝑋 depende diretamente de 𝑆, associamos a 𝑆 𝑋 o mesmo número de graus de liberdade Importante: quando σ é conhecido, se sabemos que 𝑍= 𝑋 −𝜇 𝜎 𝑋 tem distribuição normal reduzida Quando σ é desconhecido, teremos: 𝑡= 𝑋 −𝜇 𝑆 𝑋 em que a variável t possui distribuição t de Student, associada a n graus de liberdade

Quando σ é NÃO é conhecido Quando n é grande, a distribuição t é aproximadamente igual à distribuição normal reduzida. Ou seja, quando existe um número pequeno de graus de liberdade a distribuição t será bem diferente da distribuição normal Em geral, quando n>30 tende a distribuição t tende a ser próxima à distribuição da normal reduzida Z Temos uma Tabela (Hoffmann) que fornece valores críticos de t Distribuir aos alunos

Lembrando que α é o nível de significância, e representa o “erro” da estimativa

Exemplo de uso da Tabela Se desejamos saber o valor de t para 95% de confiança Lembrando: 𝛾=1−𝛼 Logo: 0,95=1−𝛼 𝛼=0,05 Pesquise o valor de t, para 𝛼=0,05 e 10 graus de liberdade Achamos um t = 2,228 Logo: P(t < -2,228) = P(t > 2,228) = 0,025 ou 2,5% Já P(-2,228 < t < 2,228) = 0,95 ou 95%

Fórmula Geral Consideremos uma distribuição genérica para (n-1) graus de liberdade 𝑃 −𝑡 0 <𝑡< +𝑡 0 =𝐶 𝑃 −𝑡 0 < 𝑋 −𝜇 𝑆 𝑋 < +𝑡 0 =𝐶 De onde sai que: 𝑃 𝑋 − 𝑡 0 𝑆 𝑋 <𝜇< 𝑋 + 𝑡 0 𝑆 𝑋 =𝐶 Cuja interpretação: são os limites de intervalo de confiança de C% para μ, considerando-se um grande número de amostras (em C% das vezes μ estaria dentro desse intervalo)

Exemplo Suponha que pegamos uma amostra de 9 elementos e calculamos o desvio S = 5. Logo, conseguimos calcular o desvio de 𝑋 𝑆 𝑋 = 5 9 =1,6666 Se queremos um intervalo de confiança de 95%, achamos o valor t para 8 graus de liberdade: t = 2,306. Logo: 𝑃 𝑋 −2,306 . 1,666<𝜇< 𝑋 +2,306 . 1,666 =0,95 𝑃 𝑋 −3,841<𝜇< 𝑋 +3,841 =0,95

Voltando aos 3 grupos de 5 elementos Calcule o desvio de cada uma das 3 amostras de 5 elementos 𝑆= 𝑋 𝑖 − 𝑋 2 𝑛−1 Agora, calcule o valor de 𝑆 𝑋 para cada um dos grupos: 𝑆 𝑋 = 𝑆 𝑛

Voltando aos 3 grupos de 5 elementos Calcule o intervalo de confiança para cada um dos 3 grupos, utilizando a expressão abaixo 𝑃 𝑋 −2,306 . 𝑆 𝑋 <𝜇< 𝑋 + 2,306 . 𝑆 𝑋 =0,95 Ao sabermos que a verdadeira média é μ = 2473,72, vamos ver qual percentual da classe tem tal valor dentro de seus intervalos, só que agora utilizando 𝑆 𝑋 e a distribuição t

Exercício 1 O diâmetro de 30 rolamentos apresentou 𝑋 = 151,9 mm e S = 9,7 mm Construa um intervalo de confiança a 95% dos rolamentos produzidos 𝑆 𝑋 = 9,7 30 =1,7709 Intervalor de confiança 95% e GL = 29, temos: t = 2,045. Logo: 𝑃 𝑋 −2,306 . 𝑆 𝑋 <𝜇< 𝑋 +2,306 . 𝑆 𝑋 =0,95 Intervalo: 148,27 < μ < 155,52

Ver esse mesmo exercício no Excel

Determinando n para obter estimativa com desvio máximo predeterminado, a um certo nível de confiança

Calculando n Considere e = t0 . 𝑆 𝑋 Portanto, a amplitude do intervalo, ao redor da média é 2e Como sabemos que 𝑆 𝑋 2 = 𝑆 2 𝑛 Substituindo a primeira equação na segunda, teremos 𝑛= 𝑡 0 2 𝑆 2 𝑒 2 Veja que precisamos de S: ou seja, precisaríamos de uma amostra preliminar antes de calcular n

Exemplo dos rolamentos Dados: 30 rolamentos; 𝑋 = 151,9; S = 9,7; 𝑆 𝑋 =1,7709, t95% = 2,045 Qual o tamanho da amostra para que a média da amostra diferisse da média da população em até 2 unidades, ao nível de 95% de confiança. Resolução: 𝑛= 𝑡 0 2 𝑆 2 𝑒 2 = 2,045 2 9,7 2 2 2 =98,37 Ou seja, deveria coletada uma amostra de, pelo menos, 99 rolamentos, para que a média da amostra não difira da média da população em até 2 unidades, a um nível de confiança de 95%.