A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Modelos espaço-temporais: interpolando com incorporação de incerteza Dani Gamerman IM-UFRJ Trabalho em colaboração com: Marina.

Apresentações semelhantes


Apresentação em tema: "Modelos espaço-temporais: interpolando com incorporação de incerteza Dani Gamerman IM-UFRJ Trabalho em colaboração com: Marina."— Transcrição da apresentação:

1 Modelos espaço-temporais: interpolando com incorporação de incerteza Dani Gamerman IM-UFRJ Trabalho em colaboração com: Marina S. Paez (IM-UFRJ) Victor de Oliveira (Caracas) Flavia Landim (IM-UFRJ) 9 ª ESTE – 07 a 10 de agosto de 2001 Hotel Fazenda Tauá

2 Introdução Exemplos: 1) medições de poluentes ao longo do tempo em uma coleção de estações monitoradoras 2) contagens de ocorrências de eventos hospitalares ao longo do tempo em uma coleção de regiões geográficas Dados do tipo (1) são contínuos e modelados por normais após alguma transformação tipo log ou Ciências ambientais – dados na forma de várias séries temporais geograficamente referenciadas

3 1. Concentração de partículas PM10 ( g/m 3 ) ao longo do tempo Exemplo: Dados de poluição no Rio de Janeiro 16 postos de monitoramento; medições feitas de janeiro a dezembro, a cada seis dias, no ano de 1999; 59 períodos de tempo no total; grande quantidade de dados omissos;

4 1 - Bonsucesso 2 - Botafogo 3 - Caxias 4 - Centro 5 - Sumaré 6 - Copacabana 7 - Inhaúma 8 - Itaguaí 9 - Jacarepaguá 10 - Maracanã 11 - Nova Iguaçú 12 - Nilópolis 13 - Niterói 14 - São Cristóvão 15 - São Gonçalo 16 - São João de Meriti Localização dos postos de monitoramento no mapa do Rio de Janeiro

5 Temperatura ambiente com base horária obtida através das informações meteorológicas de superfície do Aeroporto do Galeão. 2. Temperatura máxima diária Trabalhamos com a temperatura máxima diária

6 De acordo com a Conama, Br padrão primário - média anual: 50 padrão primário - média diária: 150 nível de atenção: 250 nível de alerta: 420 nível de emergência: 500 Estatísticas descritivas Análise exploratória no espaço Média por estação

7 Objetivos desse tipo de estudo 1) compreender o fenômeno de dependência no tempo e no espaço, se possível através de variáveis explicativas 2) fazer afirmações probabilísticas para novos valores: no tempo (previsão) no espaço (interpolação)

8 Processo Gaussiano (PG) (ou campo aleatório Gaussiano) S uma região de R p (em geral, p=2) { X (s) : s S } é um PG se m, s 1,..., s m S ( X(s 1 ),..., X(s m ) ) ~ N m (, ) Simplificações comuns: onde = ( (s 1 ),..., (s m ) ) e = ( (s i ) (s j ) (s i, s j ) ) i,j 2) Homoscedasticidade (s) =, s Notação: X(.) ~ PG( (.), 2 (.)) 1) Isotropia (s i,s j )= (h) com h=|s i – s j |

9 Análise estatística Ponto de partida: modelos de regressão Y(s,t) = (s,t) + e(s,t) onde (s,t) = X 1 (s,t) p X p (s,t) e e(s,t) ~ N(0, e 2 ) indep. Supõe-se que X j (s,t) removem autocorrelação temporal Caso contrário, pode-se incluir componente temporal (t) Usualmente e(s,t) permanecem correlacionados espacialmente Nesse caso, e(s,t) = e 0 (s) + e 1 (s,t) e 0 (s) erros correl. espacialmente e 1 (s,t) resíduo puro (ruído branco) 0 (s) = 0 + e 0 (s)

10 Inferência 1. nos primórdios (3 etapas) Como estimar 0 (s) ? Abordagem tradicional: geoestatística 0 (.) ~ PG( 0, (.)) ou e 0 (.) = 0 (.) 0 ~ PG(0, (.)) (b) 0 estimado a partir de r 0 (s,t) (c) inferência feita com base em (a) 0, 1,..., p estimados no modelo de regressão e resíduos r 0 (s,t) = Y(s,t) (s,t) construídos Logo, 0 obs ~ N( 0 1, 0 2 R) 0 obs = ( 0 (s 1 ),..., 0 (s m ) ) O vetor de hiperparâmetros 0 contém e 2 e os parâmetros de 0 2 e 0

11 Problemas: (a) r 0 (s,t) e(s,t) (b) 0 2) depois... 0, 1,..., p e 0 estimados juntos resolve (a) mas incorporar incerteza de é complicado 3) Solução natural (Kitanidis, 1986; Handcock & Stein, 1993): especificar distr. para 0 fazer inferência Bayesiana

12 Interpolação Espacial m = número de observações g = número de postos da grade s 1,...,s m = postos observados s 1 n,...,s g n = postos da grade (de interpolação) Y 1 n,...,Y g n = observações nos postos da grade

13 - todos os parâmetros do modelo Y mis - dados omissos, tratado como parâmetro 1. Inferência Frequentista: gera Y n de Obtemos P(Y n |Y obs ) via simulação. Passos para a geração de Y n |Y obs : Interpolação Se (0) com probabilidade 1 então 2. Inferência Bayesiana i ) gera de ii ) gera Y n de

14 Modelando os dados de poluição no Rio Y(s,t) = (s,t) + (s,t) (s,t) = 0 (s) + TEMP(t) X(t) (t) (s,t) independentes N(0, 2 ) 0 ~ N( 0, 2 (. (h exp(- h função de correlação exponencial (t ~ AR(1) Y(s,t) = raiz quadrada de PM10 no site s e tempo t X (t) = (TEMP, SEG, TER, QUA, QUI, SEX, SÁB)

15 Médias interpoladas do nível de PM10

16

17 Prob ( PM10 > 100 g/m 3 | Y obs )

18 Até aqui, Y(s,t)= (s,t) + e(s,t) onde (s,t)= 0 (s) + 1 X 1 (s,t) p X p (s,t) e e(s,t) ~ N(0, e 2 ) independentes Heterogeneidade espacial não precisa estar restrita a 0 Generalizações Priori: 0 (.) ~ PG( 0, (.)) 0 ~ p( 0 ) Na análise dos dados do Rio, temp depende do local Podemos acomodar variações espaciais dos outros coeficientes j, j=1,..., p.

19 modelo anterior Y(s,t) = (s,t) + e(s,t) onde (s,t) = 0 (s) + 1 X 1 (s,t) p X p (s,t) e(s,t) ~ N(0, e 2 ) independentes Extensão do modelo anterior Y(s,t) = (s,t) + e(s,t) onde (s,t) = 0 (s) + 1 (s)X 1 (s,t) p (s)X p (s,t) e(s,t) ~ N(0, e 2 ) independentes Outras possibilidades para os j (.)´s: a) mesma corr. espacial j =, j b) correlação a priori entre os PG´s Novamente, abordagem usual é assumir j (.) ~ PG( j, j 2 j (.)), ind j=0,...,p

20 Como estimar j (s), j=0,1,...,p ? Problemas (os mesmos de antes): (a) b j (s) j (s) (b) j 2) solução natural: especificar distr. a priori ~ p( ) onde = ( 0,..., p ) j ~ p( j ), ind j = 0,...,p Em geral, priori vaga para 1) solução clássica (Oehlert, 1993; Solna & Switzer, 1996): (a) 0 (s), 1 (s),..., p (s) estimados por b 0 (s), b 1 (s),..., b p (s) no modelo de regressão (local) (b) j estimado a partir de b j (s) (c) inferência feita com base em ´s

21 Modelo Parâmetros: = ( obs,,, e 2 ) j obs = ( j (s 1 ),..., j (s m ) ), j=0, 1,..., p obs = ( 0 obs,..., p obs ) = ( 0, 1,..., p ) Dados: Y obs = (Y(s 1,1),..., Y(s m,T)) X obs = (X(s 1,1),..., X(s m,T))

22 Dados simulados Y(s,t) = (s,t) (s,t), t=1,...,30 (s,t) = 0 (s)+ 1 (s) X(s,t) (s,t) ~ N(0, e 2 ) independentes com e 2 =1 0 ~ N(, 2 ( 1 ~ N(, 2 ( X(s,t) ~ N(, 2 (, para todo tempo t j ( são funções de correlação exponencial 0 = = 5 2 = 0 0 = = = = = = 0.333

23 + = X Y

24 Amostras observadas (b) amostra aleatória de tamanho 25 (a) amostra regular de tamanho 25 (c) amostra regular de tamanho 100 (d) amostra aleatória de tamanho 100

25 Exemplo: amostra regular de tamanho X(., 30)Y(., 30)

26 Inferência Relembrando, = ( obs,,, e 2 ) Verossimilhança: L( ) = p(Y obs | obs, e 2 ) Priori: p( )= j p( j obs | j, j ) p( ) j p( j ) p( e 2 ) Posteriori: ( ) L ( ) p( ) Muitos parâmetros Forma funcional complicada Solução via MCMC

27 usam j obs como se fossem dados = ( obs,,, e 2 ) (c) [ e 2 | resto ] ~ [ e 2 | Y obs, obs ] ~ Gama inversa Condicionais completas (a) [ obs | resto ] ~ Normal (b) [ | resto] ~ j [ j | j obs, j ] ~ j Normal (d) | resto ~ j p( j | j obs ) usam j obs como se fossem dados difíceis de amostrar Metropolis - Hastings

28 Análise dos dados simulados Histograma da amostra dos parâmetros i = i -2

29 Interpolação espacial Grade de interpolação: s 1 n,..., s g n j n = ( j (s 1 n ),..., j (s g n ) ), j=0, 1,..., p n = ( 0 n,..., p n ) Precisamos obter interpolações dos j ´s para poder fazer interpolação dos Y n

30 Interpolação dos Y´s (Y n, n, | Y obs ) = (Y n | n,, Y obs ) ( n, | Y obs ) = (Y n | n, ) ( n, | Y obs ) Simulação de [Y n |Y obs ] tb em 2 etapas: (a) [ n, | Y obs ] MCMC e IntEsp (b) [ Y n | n, ] usando NM Interpolação dos j ´s ( n, obs, | Y obs ) = ( n | obs,, Y obs ) ( obs, | Y obs ) = ( n | obs, ) ( obs, | Y obs ) Simulação de [ n | Y obs ] em 2 etapas: (a)[ obs, | Y obs ] usando MCMC (b)[ n | obs, ] usando NM

31 Dados simulados: Interpolação 1 valores reais valores interpolados

32 Dados simulados: Interpolação Y(.,30) valores reais valores interpolados

33 Interpolação dos X´s Essas interpolações pressupõe que dispomos dos valores interpolados das covariáveis X j, j=1,..., p Caso contrário, é preciso interpola-las.

34 Modelo completado com X(.) | x ~ PG( x, x 2 x (.)) Simulação de [X n |Y obs,X obs ] em 2 etapas: (a) [ x | X obs ] MCMC (b) [X n | x, X obs ] usando NM (X n, x | Y obs, X obs ) = (X n, x | X obs ) = (X n | x, X obs ) ( x | X obs )

35 Dados Simulados - Resultados obtidos interpolando X Histograma da amostra dos parâmetros menos disperso que quando X é conhecido

36 Interpolação de X(., 30) valores reais valores interpolados

37 Interpolação de Y(., 30) X conhecido X desconhecido

38 Antes, o modelo era dado por: Y(s,t) = 0 (s) + 1 TEMP(t) + ´ X(t) (s,t) Aplicação para os dados de poluição (s,t) independentes N(0, 2 ) 0 ~ N(, 2 (. 1 ~ N(, 2 (. i (., i=1,2 são funções de correlação exponenciais Y(s,t) = raiz quadrada de PM10 no site s e tempo t X(t) = (SEG, TER, QUA, QUI, SEX, SÁB) Y(s,t) = 0 (s) + 1 (s)TEMP(t) + ´ X(t) (s,t) Agora, coeficiente da temperatura varia no espaço

39 Resultados obtidos para os dados de poluição no Rio Histograma da amostra dos hiperparâmetros onde i = i -2

40 Interpolação do coeficiente

41 Médias interpoladas do nível de PM10

42 Y(s,t)= (s,t) + e(s,t) onde (s,t)= 0 (s,t)+ 1 (s,t)X 1 (s,t)+...+ p (s,t)X p (s,t) e(s,t) ~ N(0, e 2 ) independentes extensão do modelo anterior Y(s,t)= (s,t) + e(s,t) onde (s,t)= 0 (s )+ 1 (s )X 1 (s,t)+...+ p (s )X p (s,t) e(s,t) ~ N(0, e 2 ) independentes modelo anterior Outra extensão: A extensão natural é assumir j (.,t) ~ PG( j (t), j 2 j (.)), ind j=0,...,p Modelo deve ser completado com: (a) priori para como antes (b) especificação da evolução temporal dos j ´s Podemos também acomodar variações temporais dos coeficientes j, j=0,...,p.

43 Sugestão é usar modelos dinâmicos (Landim & Gamerman, 2000) (t) | (t-1) ~ N( G t (t-1), W t ) = parâmetros desconhecidos da evolução de Agora, os parâmetros do modelo são = ( g,,,, e 2 ) onde = ( (1),..., (T) ) e (t) = ( 0 (t), 1 (t),..., p (t) ), t=1,..., T Ciclo de simulação tem 2 mudanças: I) etapa adicional para II) etapa modificada para

44 Aplicação a dados simulados Y(s,t) = 0 (s,t) + 1 (s,t)X 1 (s,t) + (s,t) j (.,t) ~PG ( j (t), j 2 (.)) j (t) = j (t-1) + j (t-1) (. função de correlação exponencial com = 1. Histograma a posteriori de

45 Trajetória de (t) - média e limites de credibilidade

46 Comentários finais Temos maior flexibilidade para acomodar variações no espaço e no tempo. Todas as amostras da posteriori foram geradas no software BUGS, com interpolações feitas no Fortran. Podemos estender para acomodar processos anisotrópicos para algumas componentes do modelo. Palestra disponível em Podemos estender para observações na família exponencial e estimação da transf. normalizadora.


Carregar ppt "Modelos espaço-temporais: interpolando com incorporação de incerteza Dani Gamerman IM-UFRJ Trabalho em colaboração com: Marina."

Apresentações semelhantes


Anúncios Google