Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Intervalo de Confiança Camilo Daleles Rennó
Intervalo de Confiança Um parâmetro pode ser estimado através de um único valor (estimador pontual): Ou então pode ser definido um intervalo de estimativas mais prováveis de acordo com a distribuição da estatística (estimador) f( ) 0 x f(x)f(x) 0 ? X 1, X 2,..., X n amostra X 1, X 2,..., X n x f(x)f(x) 0 ?
Intervalo de Confiança para distribuição desconhecida, desconhecido, mas 2 conhecido Se : Se n for grande (ou seja, adotando-se o TLC): mesmo não se conhecendo a distribuição de X
-- ++ 0 Intervalo de Confiança para (Normal Padrão) distribuição desconhecida, desconhecido, mas 2 conhecido valores mais freqüentes se X tiver distribuição normal ou n for grande (TLC)
-- ++ 0 Intervalo de Confiança para (Normal Padrão) z-z IC para nível de significância nível de confiança Z distribuição desconhecida, desconhecido, mas 2 conhecido se X tiver distribuição normal ou n for grande (TLC)
Intervalo de Confiança para Exemplo: uma v.a. qualquer tem uma distribuição desconhecida com média também desconhecida e variância 2 = 16. Retira-se uma amostra de 25 valores e calcula-se a média amostral. Construa um IC de 95% para supondo que -- ++ 0 95% z-z 2,5% ? 1,96 Como poderia obter intervalos de confiança mais estreitos, ou seja, com limites mais próximos da média verdadeira? - diminuindo-se o nível de confiança - aumentando-se o tamanho da amostra
Como Interpretar o IC para ? Sorteia-se 50 valores aleatoriamente e calcula-se. Em seguida determina-se o IC para com 95% de confiança, ou seja Interpretação: 95% dos possíveis IC obtidos a partir de uma amostra de tamanho 50, conterão de fato a verdadeira média Suponha uma v.a. X normalmente distribuída com = 10 e 2 = 4 (O IC varia para cada amostra!!!) (ver IC.xls)
Distribuição 2 (lê-se qui-quadrado) (lê-se: X tem distribuição qui-quadrado com g graus de liberdade) 0 ++ g 2 0 ++ g > 2 Propriedades: a) se, então b) se, então
Distribuição 2 0 ++
0 ++
Se Substituindo-se por tem-se que (perde-se 1 grau de liberdade) mas
Intervalo de Confiança para 2 IC para 2 0 ++ 22
Intervalo de Confiança para 2 Exemplo: uma v.a. qualquer tem uma distribuição desconhecida com média e variância 2 desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a variância amostral. Construa um IC de 95% para 2 supondo que s 2 = 2,34. ? 12,40 0 ++ ? 39,36
Distribuição t de student (lê-se: X tem distribuição t de student com g graus de liberdade) Propriedades: tgtg -- ++ 0 a) seeentão b) seentão
Distribuição t de student -- ++ 0t
Se
-- ++ 0 Intervalo de Confiança para t-t IC para e 2 desconhecidos T
Intervalo de Confiança para Exemplo: uma v.a. qualquer tem uma distribuição desconhecida com média e variância 2 também desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a média amostral e a variância amostral. Construa um IC de 95% para supondo que e s 2 = 16. -- ++ 0 95% t-t 2,5% ? 2,064
Inferência entre parâmetros de duas populações S1S1 S2S2 n1n1 n2n2 Mesmo não se conhecendo as médias 1 e 2, seria possível verificar se elas são iguais a partir de seus valores amostrais? Se 1 e 2 são iguais, então 1 - 2 = 0. Mas quanto vale ?
Intervalo de Confiança para 1 - 2 -- ++ 0 z-z IC para 1 - 2 Z desconhecidas, mas conhecidas
Intervalo de Confiança para 1 - 2 e desconhecidas (fazendo)
Intervalo de Confiança para 1 - 2 e desconhecidas
Intervalo de Confiança para 1 - 2 e desconhecidas
Intervalo de Confiança para 1 - 2 e desconhecidas -- ++ 0 t-t IC para 1 - 2 (atenção: t homocedástico)
-- ++ 0 t-t Intervalo de Confiança para 1 - 2 e desconhecidas IC para 1 - 2 (atenção: t heterocedástico) (considerando)
Distribuição F (de Snedecor) (lê-se: X tem distribuição F com g 1 e g 2 graus de liberdade) Propriedades: a) seeentão 0 ++ b) seentão 0 ++ 0 ++
Distribuição F 0 ++ F g1g1 g2g2
0 ++ F g1g1 g2g2
0 ++ F g1g1 g2g2
Se
F e desconhecidas 0 ++ Intervalo de Confiança para IC para OBS: por exemplo, se 1 - = 95%
Exemplo: duas v.a. quaisquer têm distribuições desconhecidas com médias e variâncias também desconhecidas. Retira-se uma amostra de cada população e calcula-se a média e a variância para cada amostra. Construa um IC de 95% para a razão entre variâncias e para a diferença entre médias supondo que IC para 1 - 2 e IC para 0 ++ ?? As variâncias podem ser iguais? R: não há razão para discordar disso. pode-se fazer o IC para 1 - 2 (homocedástico)
Exemplo: duas v.a. quaisquer têm distribuições desconhecidas com médias e variâncias também desconhecidas. Retira-se uma amostra de cada população e calcula-se a média e a variância para cada amostra. Construa um IC de 95% para a razão entre variâncias e para a diferença entre médias supondo que IC para 1 - 2 e IC para 1 - 2 -- ++ 0 95% t-t 2,5% ? 1,997 1 = 2 ? 1 < 2
Intervalo de Confiança para proporção p Numa urna, há N bolas, sendo K vermelhas e N – K azuis. Assim, pode-se dizer que K/N representa a proporção p de bolas vermelhas na urna (que por sua vez, representa a probabilidade de se selecionar uma bola vermelha desta urna). Mas se N e K são desconhecidos, como estimar p ? Considere que n bolas são escolhidas ao acaso (com reposição), definindo-se Y como o número de bolas vermelhas entre as n selecionadas, qual a distribuição de Y ? Y ~ Binomial Proporção Amostral X i ~ Bernoulli p = P(X i = 1) (se n é grande)
Intervalo de Confiança para proporção p IC para p Z -- ++ 0 z-z
Intervalo de Confiança para p 1 – p 2 IC para p 1 – p 2 -- ++ 0 z-z
Intervalos de Confiança (Resumo) para se 2 é conhecida se 2 é desconhecida para 2 para para p para p 1 – p 2 para 1 - 2 se e são conhecidas se e são desconhecidas, mas
Intervalos de Confiança (Resumo) para se 2 é conhecida se 2 é desconhecida para 2 para p