Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Inferência Estatística Camilo Daleles Rennó
Inferência Estatística DISTRIBUIÇÃO CONHECIDA PARÂMETRO(S) DESCONHECIDO(S) Considere o experimento: retiram-se 3 bolas de uma urna (com reposição). Define-se uma v.a. X cujo valor representa o número total de bolas vermelhas dentre as 3 escolhidas. Qual a média e variância de X ? Quais os valores possíveis de X ? X: {0, 1, 2, 3} Qual a distribuição de probabilidade de X ? Binomial Quais os parâmetros que definem uma Binomial? n e p n = 3 p = ? 2
Inferência Estatística Numa imagem, um pixel é selecionado ao acaso. Define-se uma v.a. X cujo valor representa seu valor digital. Qual a probabilidade deste pixel possuir valor entre 100 e 150? Quais os valores possíveis de X ? X: {0, 1,..., 255} (considerando uma imagem 8 bits) Qual a distribuição de probabilidade de X ? Desconhecida (discreta) Que parâmetros são necessários para definir esta distribuição? ??????? DISTRIBUIÇÃO DESCONHECIDA 3
Inferência Estatística S amostra inferir certas características da população distribuição desconhecida e/ou parâmetros desconhecidos n elementos (ou objetos) da população ex: sortear n pixels de uma imagem (com ou sem reposição) n realizações da v.a. ex: medir a reflectância de um objeto n vezes a amostra constitui um conjunto de n v.a. X 1, X 2,..., X n com mesma distribuição (desconhecida) Amostra Aleatória 4
Estimação de Parâmetros População Amostra Distribuição de Probabilidade (ou FDP) Parâmetros Distribuição Amostral (Frequências) Estatísticas (valor fixo) estimar (variável aleatória) pontual (estatísticas) por intervalo (intervalos de confiança) Estimação OBS:estatística:é a v.a. que estima (pontualmente) um parâmetro (populacional) as vezes é chamada simplesmente de estimador estimativa: é o valor do estimador obtido para uma amostra específica 5
método dos momentos método da máxima verossimilhança Estimação Pontual média populacional De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de ? Seja X uma v.a. normalmente distribuída com a média ( ) e a variância ( 2 ) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. 6
Estimação Pontual média populacional De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de ? é o k -ésimo estimador de Qual é o melhor estimador pontual? não tendencioso variância mínima Seja X uma v.a. normalmente distribuída com a média ( ) e a variância ( 2 ) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. Exato Impreciso Inexato Preciso Tiro ao alvo Suponha que seja possível produzir k diferentes estimadores para , sendo 7 (exatidão) (precisão)
Estimação Pontual média populacional De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de ? dados agrupados Seja X uma v.a. normalmente distribuída com a média ( ) e a variância ( 2 ) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. média amostral 8
Estimação Pontual Seja X uma v.a. normalmente distribuída com a média ( ) e a variância ( 2 ) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. média populacional De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de ? verificando a tendenciosidade de estimador não tendencioso 9
Estimação Pontual Seja X uma v.a. normalmente distribuída com a média ( ) e a variância ( 2 ) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. média populacional De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de ? calculando a variância de 10 Se as amostras forem independentes, ou seja, se elas não guardarem nenhuma relação entre si. 2 + 2
Estimação Pontual Seja X uma v.a. normalmente distribuída com a média ( ) e a variância ( 2 ) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. média populacional De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de ? 11 Quanto maior o tamanho da amostra ( n ), mais precisa será a estimativa de
Estimação Pontual Seja X uma v.a. normalmente distribuída com a média ( ) e a variância ( 2 ) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. variância populacional 2 De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de 2 ? Mas será um estimador tendencioso? 12
Estimação Pontual Seja X uma v.a. normalmente distribuída com a média ( ) e a variância ( 2 ) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. variância populacional 2 De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de 2 ? 13
Estimação Pontual Seja X uma v.a. normalmente distribuída com a média ( ) e a variância ( 2 ) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. variância populacional 2 De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de 2 ? 14
Estimação Pontual Seja X uma v.a. normalmente distribuída com a média ( ) e a variância ( 2 ) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. variância populacional 2 De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de 2 ? 15
Estimação Pontual Seja X uma v.a. normalmente distribuída com a média ( ) e a variância ( 2 ) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. variância populacional 2 De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de 2 ? estimador tendencioso! 16
Estimação Pontual Seja X uma v.a. normalmente distribuída com a média ( ) e a variância ( 2 ) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. variância populacional 2 De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de 2 ? estimador não tendencioso (ver Estimadores.xls) variância amostral 17
Estimação Pontual de e 2 média amostral Valor Freq. Absoluta Freq. Relativa 011/12 121/6 241/3 331/4 411/12 51 Total 121 Exemplo: uma amostra ( n = 12 ) é retirada de uma população e os seguintes valores são observados: 0, 2, 3, 5, 2, 1, 2, 1, 3, 3, 4, 2. Calcule a média e variância amostrais. distribuição amostral (usando FA) (usando FR) (dados brutos) (dados agrupados) 18
(dados agrupados) Estimação Pontual de e 2 variância amostral s 2 Exemplo: uma amostra ( n = 12 ) é retirada de uma população e os seguintes valores são observados: 0, 2, 3, 5, 2, 1, 2, 1, 3, 3, 4, 2. Calcule a média e variância amostrais. Valor Freq. Absoluta Freq. Relativa 011/12 121/6 241/3 331/4 411/12 51 Total 121 distribuição amostral (dados brutos) 19
Estimação Pontual de e 2 Observações: e 2 são parâmetros que representam a população e portanto são valores fixos sendo, em geral, desconhecidos e s 2 são estatísticas calculadas a partir da amostra e representam variáveis aleatórias (cada conjunto de amostras pode apresentar um valor diferente) Não confunda variância amostral ( s 2 ) com variância da média amostral ( Var( ) ) 20 De modo geral, as amostras devem ser obtidas de modo independente uma das outras, ou seja, o valor de uma amostra não deve ter relação com o(s) valor(es) das outras amostras (exceção em estudos de séries temporais, onde estuda-se exatamente esta relação)
Utilização de amostras não independentes 21 T1T1 T2T2 T3T3 T4T4 área de sobreposição
Utilização de amostras não independentes 22 T1T1 T2T2 T3T3 T4T4 X1X1 X2X2 X3X3 X4X4 X i : valor que representa a resposta do sensor no tempo T i ( elemento de resolução) Note que estes valores não são independentes (devido a sobreposição) Resolução Espacial Tamanho do Pixel
Utilização de amostras não independentes 23 X X representa um conjunto de amostras independentes de uma v.a. qualquer 3,2
Utilização de amostras não independentes 24 X ,3 5,9 2,5 3,2 5,3 2,8 6 9,2 6,3 5,3 6,2 2,2 6,5 7,6 5,7 X representa um conjunto de amostras independentes de uma v.a. qualquer 5
Utilização de amostras não independentes 25 X ,3 5,9 2,5 3,2 5,3 2,8 6 9,2 6,3 5,3 6,2 2,2 6,5 7,6 5,7 X representa um conjunto de amostras independentes de uma v.a. qualquer 9
Utilização de amostras não independentes 26 X ,37,66,67 5,95,85,67 2,533,67 3,23,43,67 5,34,63,67 2,83,64, ,28,47,33 6,36,67 5,35,66 6,25,44,33 2,23,45 6,565,33 7,67,26,67 5,76,47,33 X representa um conjunto de amostras independentes de uma v.a. qualquer
Utilização de amostras não independentes 27 X ,37,66,67 5,95,85,67 2,533,67 3,23,43,67 5,34,63,67 2,83,64, ,28,47,33 6,36,67 5,35,66 6,25,44,33 2,23,45 6,565,33 7,67,26,67 5,76,47,33 X representa um conjunto de amostras independentes de uma v.a. qualquer
Utilização de amostras não independentes 28 X ,37,66,67 5,95,85,67 2,533,67 3,23,43,67 5,34,63,67 2,83,64, ,28,47,33 6,36,67 5,35,66 6,25,44,33 2,23,45 6,565,33 7,67,26,67 5,76,47,33 X representa um conjunto de amostras independentes de uma v.a. qualquer
s2s2 X5,536,84 Utilização de amostras não independentes 29 X ,37,66,67 5,95,85,67 2,533,67 3,23,43,67 5,34,63,67 2,83,64, ,28,47,33 6,36,67 5,35,66 6,25,44,33 2,23,45 6,565,33 7,67,26,67 5,76,47,33 X representa um conjunto de amostras independentes de uma v.a. qualquer Conclusão: a utilização de amostras não independentes (autocorrelacionadas) afetam mais a estimação da variância do que a estimação da média s2s2 X5,536,84 5,53 s2s2 X 6,84 5,534,36 5,532,70 5,531,76