A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Modelos espaço-temporais:

Apresentações semelhantes


Apresentação em tema: "Modelos espaço-temporais:"— Transcrição da apresentação:

1 Modelos espaço-temporais:
interpolando com incorporação de incerteza Dani Gamerman IM-UFRJ Trabalho em colaboração com: Marina S. Paez (IM-UFRJ) Victor de Oliveira (Caracas) Flavia Landim (IM-UFRJ) 9ª ESTE – 07 a 10 de agosto de 2001 Hotel Fazenda Tauá

2 Introdução Ciências ambientais – dados na forma de várias séries temporais geograficamente referenciadas Exemplos: 1) medições de poluentes ao longo do tempo em uma coleção de estações monitoradoras 2) contagens de ocorrências de eventos hospitalares ao longo do tempo em uma coleção de regiões geográficas Dados do tipo (1) são contínuos e modelados por normais após alguma transformação tipo log ou 

3 Exemplo: Dados de poluição no Rio de Janeiro
1. Concentração de partículas PM10 (g/m3) ao longo do tempo 16 postos de monitoramento; medições feitas de janeiro a dezembro, a cada seis dias, no ano de 1999; 59 períodos de tempo no total; grande quantidade de dados omissos;

4 Localização dos postos de monitoramento no mapa do Rio de Janeiro
1 - Bonsucesso 2 - Botafogo 3 - Caxias 4 - Centro 5 - Sumaré 6 - Copacabana 7 - Inhaúma 8 - Itaguaí 9 - Jacarepaguá 10 - Maracanã 11 - Nova Iguaçú 12 - Nilópolis 13 - Niterói 14 - São Cristóvão 15 - São Gonçalo 16 - São João de Meriti

5 2. Temperatura máxima diária
Temperatura ambiente com base horária obtida através das informações meteorológicas de superfície do Aeroporto do Galeão. Trabalhamos com a temperatura máxima diária

6 Análise exploratória no espaço
Estatísticas descritivas Média por estação De acordo com a Conama, Br padrão primário - média anual: 50 padrão primário - média diária: 150 nível de atenção: 250 nível de alerta: 420 nível de emergência: 500

7 Objetivos desse tipo de estudo
1) compreender o fenômeno de dependência no tempo e no espaço, se possível através de variáveis explicativas 2) fazer afirmações probabilísticas para novos valores: no tempo (previsão) no espaço (interpolação)

8 Processo Gaussiano (PG)
(ou campo aleatório Gaussiano) S uma região de Rp (em geral, p=2) { X (s) : s S } é um PG se m, s1 , ... , sm  S ( X(s1) , ... , X(sm) ) ~ Nm (, ) onde  = ( (s1) , ... , (sm) ) e  = ((si) (sj) (si, sj) )i,j Simplificações comuns: 1) Isotropia (si,sj)=(h) com h=|si– sj | 2) Homoscedasticidade (s) = , s Notação: X(.) ~ PG((.),2(.))

9 Análise estatística Ponto de partida: modelos de regressão
Y(s,t) = (s,t) + e(s,t) onde (s,t) = 0 + 1 X1(s,t) pXp(s,t) e e(s,t) ~ N(0, e2) indep. Supõe-se que Xj(s,t) removem autocorrelação temporal Caso contrário, pode-se incluir componente temporal (t) Usualmente e(s,t) permanecem correlacionados espacialmente Nesse caso, e(s,t) = e0(s) + e1(s,t) e0(s)  erros correl. espacialmente e1(s,t)  resíduo puro (ruído branco)  0(s) = 0 + e0(s)

10 Como estimar 0(s) ? Abordagem tradicional: geoestatística 0(.) ~ PG(0,020(.)) ou e0(.) = 0(.)  0 ~ PG(0,020(.)) Logo, 0obs ~ N(0 1, 02 R) 0obs = (0(s1) , ... , 0(sm) ) O vetor de hiperparâmetros 0 contém e2 e os parâmetros de 02 e 0 Inferência 1. nos primórdios (3 etapas) (a) 0 , 1 , ... , p estimados no modelo de regressão e resíduos r0(s,t) = Y(s,t)  m(s,t) construídos (b) 0 estimado a partir de r0(s,t) (c) inferência feita com base em

11 Problemas: (a) r0(s,t)  e(s,t) (b)  0 2) depois... 0 , 1 , ... , p e 0 estimados juntos  resolve (a) mas incorporar incerteza de é complicado 3) Solução natural (Kitanidis, 1986; Handcock & Stein, 1993): especificar distr. para 0 fazer inferência Bayesiana

12 Interpolação Espacial
m = número de observações g = número de postos da grade s1, ... ,sm = postos observados s1n,...,sgn = postos da grade (de interpolação) Y1n,...,Ygn = observações nos postos da grade

13 Interpolação 1. Inferência Frequentista: gera Yn de
y todos os parâmetros do modelo Ymis - dados omissos, tratado como parâmetro Se y = y(0) com probabilidade 1 então Obtemos P(Yn|Yobs) via simulação. Passos para a geração de Yn|Yobs : 1. Inferência Frequentista: gera Yn de 2. Inferência Bayesiana i ) gera y de ii ) gera Yn de

14 Modelando os dados de poluição no Rio
Y(s,t) = m(s,t) + e (s,t) m(s,t) = b0 (s) + b1TEMP(t) + b’X(t) + f (t) e (s,t) independentes N(0,se2) Y(s,t) = raiz quadrada de PM10 no site s e tempo t X (t) = (TEMP, SEG, TER, QUA, QUI, SEX, SÁB) b0 ~ N(g0, s12r (.)) r (h) = exp(-q h )  função de correlação exponencial f (t) ~ AR(1)

15 Médias interpoladas do nível de PM10

16 Médias interpoladas do nível de PM10

17 Prob ( PM10 > 100 mg/m3 | Yobs )

18 Y(s,t)= (s,t) + e(s,t) onde
Generalizações Até aqui, Y(s,t)= (s,t) + e(s,t) onde (s,t)=0(s) + 1X1(s,t) pXp(s,t) e e(s,t) ~ N(0, e2) independentes Priori: 0(.) ~ PG(0,020(.)) 0 ~ p(0) Heterogeneidade espacial não precisa estar restrita a 0 Na análise dos dados do Rio, temp depende do local Podemos acomodar variações espaciais dos outros coeficientes j, j=1, ... , p.

19 modelo anterior Y(s,t) = (s,t) + e(s,t) onde (s,t) = 0(s) +  X1(s,t) p Xp(s,t) e(s,t) ~ N(0, e2) independentes Extensão do modelo anterior Y(s,t) = (s,t) + e(s,t) onde (s,t) = 0(s) + 1(s)X1(s,t) p(s)Xp(s,t) e(s,t) ~ N(0, e2) independentes Novamente, abordagem usual é assumir j(.) ~ PG(j,j2j(.)), ind j=0,...,p Outras possibilidades para os j(.)´s: a) mesma corr. espacial rj = r, j b) correlação a priori entre os PG´s

20 Problemas (os mesmos de antes): (a) bj(s)  j(s) (b)  j
Como estimar j(s), j=0,1,...,p ? 1) solução clássica (Oehlert, 1993; Solna & Switzer, 1996): (a) 0 (s), 1 (s), ... , p (s) estimados por b0(s), b1(s), ... , bp (s) no modelo de regressão (local) (b) j estimado a partir de bj(s) (c) inferência feita com base em ´s Problemas (os mesmos de antes): (a) bj(s)  j(s) (b)  j 2) solução natural: especificar distr. a priori  ~ p() onde  = (0,...,p) j ~ p(j), ind j = 0,...,p Em geral, priori vaga para 

21 Modelo Parâmetros: = ( obs ,  ,  , e2 ) jobs = (j(s1) , ... , j(sm) ), j=0, 1, ... , p obs = (0obs , ... , pobs ) = ( 0 , 1 , ... , p ) Dados: Yobs = (Y(s1,1) , ... , Y(sm,T)) Xobs = (X(s1,1) , ... , X(sm,T))

22 Dados simulados Y(s,t) = m(s,t) + e(s,t), t=1,...,30 m(s,t) = b0(s)+ b1(s) X(s,t) e(s,t) ~ N(0, e2) independentes com e2=1 b ~ N(g0, s02r0 (.)) b ~ N(g1, s12r1 (.)) X(s,t) ~ N(g2, s22r2 (.)), para todo tempo t rj (.) são funções de correlação exponencial g0 = g1 = 5 g2 = 0 q0 = q1 = q2 = 1.5 s02 = s12 = s22 = 0.333

23 Y b0 + b1X = + e

24 Amostras “observadas”
(b) amostra aleatória de tamanho 25 (a) amostra regular de tamanho 25 (c) amostra regular de tamanho 100 (d) amostra aleatória de tamanho 100

25 Exemplo: amostra regular de tamanho 25
b0 b1 X( . , 30) Y( . , 30)

26 Inferência Relembrando,  = ( obs ,  ,  , e2 ) Verossimilhança: L() = p(Yobs | obs , e2 ) Priori: p()=j p( jobs | j,j ) p() j p(j) p(e2) Posteriori: (  )  L (  )  p(  ) Muitos parâmetros Forma funcional complicada Solução via MCMC

27 Condicionais completas
 = ( obs ,  ,  , e2 ) (a) [ obs | resto ] ~ Normal (b) [  | resto] ~ j [ j | jobs , j ] ~ j Normal  usam jobs como se fossem dados (c) [ e2 | resto ] ~ [ e2 | Yobs , obs ] ~ Gama inversa (d)  | resto ~ j p(j | jobs )  usam jobs como se fossem dados  difíceis de amostrar  Metropolis - Hastings

28 Análise dos dados simulados
Histograma da amostra dos parâmetros g0 g1 q0 q1 te t0 t1 ti = si-2

29 Interpolação espacial
Grade de interpolação: s1n , ... , sgn jn = (j(s1n) , ... , j(sgn) ), j=0, 1, ... , p n = (0n , ... , pn ) Precisamos obter interpolações dos j´s para poder fazer interpolação dos Yn

30 Interpolação dos j´s (n,obs,| Yobs) = ( n | obs, , Yobs) ( obs, | Yobs) = ( n | obs ,) ( obs, | Yobs) Simulação de [ n | Yobs ] em 2 etapas: (a)[ obs, | Yobs ]  usando MCMC (b)[ n | obs ,]  usando NM Interpolação dos Y´s (Yn,n,| Yobs) = (Yn|n, , Yobs) (n,| Yobs) = (Yn| n ,) (n,| Yobs) Simulação de [Yn |Yobs] tb em 2 etapas: (a) [ n, | Yobs ]  MCMC e IntEsp (b) [ Yn| n ,]  usando NM

31 Dados simulados: Interpolação b1
valores reais valores interpolados

32 Dados simulados: Interpolação Y( . ,30)
valores reais valores interpolados

33 Interpolação dos X´s Essas interpolações pressupõe que dispomos dos valores interpolados das covariáveis Xj , j=1, ... , p Caso contrário, é preciso interpola-las.

34 Modelo completado com X(.) | x ~ PG(x,x2x(.)) Simulação de [Xn|Yobs,Xobs] em 2 etapas: (a) [x | Xobs ]  MCMC (b) [Xn| x, Xobs ]  usando NM (Xn, x | Yobs , Xobs) = (Xn , x| Xobs ) = (Xn| x, Xobs) (x | Xobs )

35 Dados Simulados - Resultados obtidos interpolando X
Histograma da amostra dos parâmetros g0 g1 q0 q1 te t0 q2 t1 t2 menos disperso que quando X é conhecido

36 Interpolação de X( . , 30) valores reais valores interpolados

37 Interpolação de Y( . , 30) X conhecido X desconhecido

38 Aplicação para os dados de poluição
Y(s,t) = b0 (s) + b1 (s)TEMP(t) + b´ X(t) + e (s,t) Agora, coeficiente da temperatura varia no espaço Antes, o modelo era dado por: Y(s,t) = b0 (s) + b TEMP(t) + b´ X(t) + e (s,t) Y(s,t) = raiz quadrada de PM10 no site s e tempo t X(t) = (SEG, TER, QUA, QUI, SEX, SÁB) e (s,t) independentes N(0,se2) b0 ~ N(g0, s02r0 (.)) b1 ~ N(g1, s12r1 (.)) ri (.), i=1,2 são funções de correlação exponenciais

39 Resultados obtidos para os dados de poluição no Rio
q0 q1 te t0 t1 Histograma da amostra dos hiperparâmetros onde ti = si -2

40 Interpolação do coeficiente b1

41 Médias interpoladas do nível de PM10

42 Outra extensão: Podemos também acomodar variações temporais dos coeficientes j, j=0,...,p. Y(s,t)= (s,t) + e(s,t) onde (s,t)=0(s )+1(s )X1(s,t)+...+p(s )Xp(s,t) e(s,t) ~ N(0, e2) independentes modelo anterior Y(s,t)= (s,t) + e(s,t) onde (s,t)=0(s,t)+1(s,t)X1(s,t)+...+p(s,t)Xp(s,t) e(s,t) ~ N(0, e2) independentes extensão do modelo anterior A extensão natural é assumir j(.,t) ~ PG(j(t) , j2j(.)), ind j=0,...,p Modelo deve ser completado com: (a) priori para  como antes (b) especificação da evolução temporal dos j´s

43 Sugestão é usar modelos dinâmicos
(Landim & Gamerman, 2000) (t) | (t-1) ~ N( Gt (t-1) , Wt )  = parâmetros desconhecidos da evolução de  Agora, os parâmetros do modelo são  = ( g ,  ,  ,  , e2 ) onde  = (  (1) , ... ,  (T) ) e (t) = ( 0(t), 1(t), ... , p(t) ), t=1, ... , T Ciclo de simulação tem 2 mudanças: I) etapa adicional para  II) etapa modificada para 

44 Aplicação a dados simulados
Y(s,t) = b0(s,t) + b1(s,t)X1(s,t) + e(s,t) bj(.,t) ~PG (gj(t), sj2r(.)) gj(t) = gj(t-1) + wj(t-1) r(.) - função de correlação exponencial com q = 1. Histograma a posteriori de q

45 Trajetória de g (t) - média e limites de credibilidade

46 Comentários finais Temos maior flexibilidade para acomodar variações no espaço e no tempo. Todas as amostras da posteriori foram geradas no software BUGS, com interpolações feitas no Fortran. Podemos estender para observações na família exponencial e estimação da transf. normalizadora. Podemos estender para acomodar processos anisotrópicos para algumas componentes do modelo. Palestra disponível em


Carregar ppt "Modelos espaço-temporais:"

Apresentações semelhantes


Anúncios Google