Estatística: Aplicação ao Sensoriamento Remoto SER 203 - ANO 2014 Intervalo de Confiança Camilo Daleles Rennó camilo@dpi.inpe.br http://www.dpi.inpe.br/~camilo/estatistica/
Intervalo de Confiança para distribuição desconhecida, desconhecido, mas 2 conhecido Se : Se n for grande (ou seja, adotando-se o TLC): mesmo não se conhecendo a distribuição de X
Intervalo de Confiança para distribuição desconhecida, desconhecido, mas 2 conhecido se X tiver distribuição normal ou n for grande (TLC) (Normal Padrão) - + valores mais freqüentes
Intervalo de Confiança para distribuição desconhecida, desconhecido, mas 2 conhecido se X tiver distribuição normal ou n for grande (TLC) Z (Normal Padrão) - + -z z nível de significância nível de confiança IC para m
Intervalo de Confiança para Exemplo: uma v.a. qualquer tem uma distribuição desconhecida com média m também desconhecida e variância s2 = 16. Retira-se uma amostra de 25 valores e calcula-se a média amostral. Construa um IC de 95% para m supondo que - + 95% z -z 2,5% ? Como poderia obter intervalos de confiança mais estreitos, ou seja, com limites mais próximos da média verdadeira? 1,96 diminuindo-se o nível de confiança aumentando-se o tamanho da amostra
Como Interpretar o IC para ? Suponha uma v.a. X normalmente distribuída com = 10 e 2 = 4 Sorteia-se 50 valores aleatoriamente e calcula-se . Em seguida determina-se o IC para com 95% de confiança, ou seja (O IC varia para cada amostra!!!) Interpretação: 95% dos possíveis IC obtidos a partir de uma amostra de tamanho 50, conterão de fato a verdadeira média (ver IC.xls)
Distribuição 2 + + (lê-se qui-quadrado) g > 2 g 2 + g > 2 + g 2 (lê-se: X tem distribuição qui-quadrado com g graus de liberdade) Propriedades: a) se , então b) se , então
Distribuição 2 +
Distribuição 2 +
Distribuição 2 Se Substituindo-se por tem-se que (perde-se 1 grau de liberdade) mas
Intervalo de Confiança para 2 2 + IC para 2
Intervalo de Confiança para 2 Exemplo: uma v.a. qualquer tem uma distribuição desconhecida com média m e variância s2 desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a variância amostral. Construa um IC de 95% para s2 supondo que s2 = 2,34. + ? ? 12,40 39,36
Distribuição t de student tg - + (lê-se: X tem distribuição t de student com g graus de liberdade) Propriedades: a) se e então b) se então
Distribuição t de student - t +
Distribuição t de student Se
Intervalo de Confiança para e 2 desconhecidos T - + -t t IC para m
Intervalo de Confiança para Exemplo: uma v.a. qualquer tem uma distribuição desconhecida com média m e variância s2 também desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a média amostral e a variância amostral. Construa um IC de 95% para m supondo que e s2 = 16. - + 95% t -t 2,5% ? 2,064
Inferência entre parâmetros de duas populações Mesmo não se conhecendo as médias 1 e 2, seria possível verificar se elas são iguais a partir de seus valores amostrais? Se 1 e 2 são iguais, então 1 - 2 = 0. Mas quanto vale ?
Intervalo de Confiança para 1 - 2 desconhecidas, mas conhecidas Z - + z -z IC para m1 - m2
Intervalo de Confiança para 1 - 2 e desconhecidas (fazendo )
Intervalo de Confiança para 1 - 2 e desconhecidas
Intervalo de Confiança para 1 - 2 e desconhecidas
Intervalo de Confiança para 1 - 2 e desconhecidas - + t -t IC para m1 - m2 (atenção: t homocedástico)
Intervalo de Confiança para 1 - 2 e desconhecidas (considerando ) - + t -t IC para m1 - m2 (atenção: t heterocedástico)
Distribuição F (de Snedecor) + (lê-se: X tem distribuição F com g1 e g2 graus de liberdade) Propriedades: + a) se e então b) se então +
Distribuição F + F g1 g2
Distribuição F + F g1 g2
Distribuição F + F g1 g2
Distribuição F Se
Intervalo de Confiança para e desconhecidas + F OBS: por exemplo, se 1 - = 95% IC para
IC para 1 - 2 e Exemplo: duas v.a. quaisquer têm distribuições desconhecidas com médias e variâncias também desconhecidas. Retira-se uma amostra de cada população e calcula-se a média e a variância para cada amostra. Construa um IC de 95% para a razão entre variâncias e para a diferença entre médias supondo que + IC para ? As variâncias podem ser iguais? R: não há razão para discordar disso. pode-se fazer o IC para m1 - m2 (homocedástico)
IC para 1 - 2 e Exemplo: duas v.a. quaisquer têm distribuições desconhecidas com médias e variâncias também desconhecidas. Retira-se uma amostra de cada população e calcula-se a média e a variância para cada amostra. Construa um IC de 95% para a razão entre variâncias e para a diferença entre médias supondo que - + 95% t -t 2,5% IC para m1 - m2 ? 1,997 m1 = m2? m1 < m2
Intervalo de Confiança para proporção p Numa urna, há N bolas, sendo K vermelhas e N – K azuis. Assim, pode-se dizer que K/N representa a proporção p de bolas vermelhas na urna (que por sua vez, representa a probabilidade de se selecionar uma bola vermelha desta urna). Mas se N e K são desconhecidos, como estimar p? Considere que n bolas são escolhidas ao acaso (com reposição), definindo-se Y como o número de bolas vermelhas entre as n selecionadas, qual a distribuição de Y? Y ~ Binomial Xi ~ Bernoulli p = P(Xi = 1) Proporção Amostral (se n é grande)
Intervalo de Confiança para proporção p Z - + z -z IC para p
Intervalo de Confiança para p1 – p2 - + z -z IC para p1 – p2
Intervalos de Confiança (Resumo) para se 2 é conhecida se 2 é desconhecida para 2 para 1 - 2 se e são conhecidas se e são desconhecidas, mas para para p para p1 – p2
Intervalos de Confiança (Resumo) para se 2 é conhecida se 2 é desconhecida para 2 para p