Carregar apresentação
A apresentação está carregando. Por favor, espere
PublicouVitória Garro Alterado mais de 10 anos atrás
1
Taxas em pequenas áreas : uma abordagem bayesiana
Ilka Afonso Reis Análise Espacial - INPE
2
Taxas em pequenas áreas
yi é o número de casos da “doença” na área i ; ei é o número esperado de casos da “doença” na área i ; ρi é o risco relativo (desconhecido) da “doença” em relação à taxa de referência ; (padronização) Taxa bruta : Quanto menor o no. esperado de casos, maior a variabilidade na estimação
3
Qual é o problema com taxas brutas ?
Suponha uma “doença” com r = 0,10 e acontece um caso em cada área (y = 1) Se Pop1 = 10000, e1 = 0,10 x = 1000 Se Pop2 = 1000, e2 = 0,10 x = 100 Se Pop3 = 100, e3 = 0,10 x 100 = 10 p1=1/10000 = 0, e Var(p1) = 1/ = 1 x 10-8 p2=1/1000 = 0, e Var(p2) = 1/10002 = 1 x 10-6 p3=1/100 = 0,01 e Var(p3) = 1/1002 = 1 x 10-4
4
Qual é o problema com taxas brutas ?
Taxa bruta Taxa suavizada
5
Solução para o problema das taxas brutas
Suavizar as taxas Como ? Estimadores Bayesianos Empíricos Completos
6
Uma Breve Introdução à Inferência Bayesiana
Probabilidade Condicional Teorema de Bayes Verossimilhança Probabilidade a priori Probabilidade a posteriori
7
Um exemplo : medidas de qualidade de testes diagnósticos
Doente (D) Positivo (+|D) Negativo (-|D) Sadio (S) Positivo (+|S) Negativo (-|S)
8
Avaliação da qualidade do teste
Acertos : Entre os doentes Sensibilidade (s) Especificidade (e) Entre os sadios
9
Avaliação da qualidade do teste
Resultado do teste Padrão-ouro Total Doente Não Doente Positivo 265 47 312 Negativo 11 50 61 276 97 373
10
Avaliação da qualidade do diagnóstico
Acertos : Entre os positivos Valor de Predição Positiva (VPP) Valor de Predição Negativa (VPN) Entre os negativos
11
Avaliação da qualidade do diagnóstico
Regra de Bayes
12
Enfim ... Probabilidade a priori “Verossimilhança”
Probabilidade a posteriori
13
Conceitos Básicos e Notação
Dados : provenientes de uma amostra da população de interesse y = (y1, y2, ..., yn) P(y), distribuição de probabilidade conjunta de y. Parâmetros: quantidades, em geral desconhecidas, que estão presentes nos modelos probabilísticos para y e serão representadas por . P(y|), função de verossimilhança de y.
14
Exemplo : estimação de taxas
yi , casos da “doença” na área i ei , número de casos esperados na área i segunda a taxa de referência Parâmetros a serem estimados ρi : o risco relativo (desconhecido) da “doença” em relação à taxa de referência eiρi representa o número de casos esperados (média) na área i Na inferência clássica, boas estimativas para ρi são os valores que maximizam a função de verossimilhança P(y|ρi ). Estes valores são a estimativa de máxima verossimilhança O modelo para os dados é a função de verossimilhança P(y|). Modelo : yi ∼ Poisson(eiρi)
15
O Método da Máxima Verossimilhança
Na inferência clássica, os parâmetros de um modelo são tratados como quantidades fixas (não aleatórias), porém desconhecidas. O método da máxima verossimilhança é considerado bom em muitos casos. Porém, quando a forma de P(y|) é complexa e/ou quando o número de parâmetros envolvidos é grande, este método torna-se difícil de implementar.
16
A abordagem Bayesiana Na inferência Bayesiana, os parâmetros são tratados como quantidades aleatórias. O modelo estatístico não é mais somente P(y|) e sim P(y,), a distribuição conjunta dos dados y e dos parâmetros . As estimativas para não serão somente valores, mas sim uma distribuição de probabilidades. P(|y) é a distribuição de probabilidades dos parâmetros “ à luz” dos dados y.
17
A abordagem Bayesiana Como obter P(|y) ? Pela Regra de Bayes
Probabilidade a priori Probabilidade a posteriori Verossimilhança
18
A abordagem Bayesiana P() expressa a incerteza sobre antes de observarmos os dados y que dependem dele (a priori) . P(|y) expressa a incerteza sobre depois de observarmos os dados y que dependem dele (a posteriori). De posse de P(|y), podemos examinar qualquer aspecto de (média, variância, percentis, probabilidade de assumir determinados valores, etc.) (“Full Posterior Distribution”)
19
Passos para obtenção de P(|y)
Escolher um modelo probabilístico para P(y|) – a função de verossimilhança; Escolher um modelo probabilístico para P() – a distribuição a priori ; Aplicar a regra de Bayes e calcular P(|y).
20
Exemplo : modelo Gamma-Poisson
y é o número de casos da “doença” em certa área ; e é o número esperado de casos da “doença” em certa área; ρ é o risco relativo (desconhecido) da “doença” em relação à taxa de referência nesta área; Modelo para P(y|) : y ~ Poisson (e )
21
Exemplo : modelo Gamma-Poisson
Modelo para P() : ~ Gamma (,) hiperparâmetros Cálculo da posteriori P(|y) |y ~ Gamma ( + y , + e )
22
Exemplo : modelo Gamma-Poisson
Suponha que y = 4 e e = 6.5 Priori´s : Gamma (0.5 , 0.5), Gamma (1,1) e Gamma (10,10) Posteriori´s : Gamma (4.5 , 7.0), Gamma (5,7.5) e Gamma(14,16.5)
23
Exemplo : modelo Gamma-Poisson
Priori Quantis a posteriori Média a posteriori 0.025 0.500 0.975 Gamma (0.5,0.5) 0.421 0.596 0.813 0.643 Gamma (1 , 1) 0.449 0.623 0.837 0.673 Gamma (10 , 10) 0.687 0.828 0.988 0.855 Intervalo de Credibilidade de 95%
24
Modelo espacial bayesiano para taxas em pequenas áreas
25
Modelo espacial bayesiano para taxas em pequenas áreas
Modelo geral yi ∼ Poisson(µi) = Poisson(eiρi) yi é o número de casos da “doença” na área i ; ei é o número esperado de casos da “doença” na área i ; ρi é o risco relativo (desconhecido) da “doença” em relação à taxa de referência ; (padronização) log µi = log ei + θi ; θi denota o log do risco relativo (θi = log ρi , ou seja, ρi = exp(θi) ) Modelo de efeitos fixos (máxima verossimilhança) Quanto menor o no. esperado de casos, maior a variabilidade na estimação
26
Qual é o problema com taxas brutas ?
Taxa bruta Taxa suavizada
27
Qual é o problema com taxas brutas ?
Taxa bruta Taxa suavizada
28
Qual é o problema com taxas brutas ?
Taxa bruta Taxa suavizada
29
Modelo espacial bayesiano para taxas em pequenas áreas
Modelo de efeitos aleatórios ρi ∼ Gamma(ψi, fi) µρ = ψi/fi e σ2ρ = ψi/fi2 ; Gamma “+” Poisson “=” Gamma ; P(ρi|y) ∼ Gamma(ψi + yi, fi + ei). Quanto maior o número de dados, mais próximo de yi/ei estará a estimativa do risco relativo ; Quanto menor o número de dados, mais próximo de ψi/fi estará a estimativa de risco relativo.
30
Modelo espacial bayesiano para taxas em pequenas áreas
Os parâmetros ψi e fi são os hiperparâmetros. Como saber quem ψi e fi ? Podem ser estimados (Bayes empírico) ; Pode-se estabelecer uma distribuição a priori para ψ e φ (hiperprioris). Exemplo: Mersey priori hiperprioris P(ρ, ψ, f|y) ∝ P(y|ρ)P(ρ|ψ, f)P(ψ)P(f)
31
Modelo espacial bayesiano para taxas em pequenas áreas
Modelo espacialmente estruturado (abordagem completa) yi ∼ Poisson(µi) = Poisson(eiρi) log µi = log ei + θi ; θi = log ρi θi = α + fi + i , onde α é o log do risco relativo médio sobre todas as áreas ; fi é a parte não-espacialmente estruturada do log do risco relativo da área i ; (média zero) i é a parte espacialmente estruturada do log do risco relativo da área i;
32
Modelo espacial bayesiano para taxas em pequenas áreas
Prioris : α ~ Uniforme [- ; ] (“flat”) fi ~ Normal (0 ; 2f) A priori para νi é um modelo autoregressivo condicional Gaussiano (CAR) wij são pesos representando a adjacência das áreas. A definição mais comum para wij são valores binários : wij = 1, se as áreas i e j são adjacentes; wij = 0, caso contrário.
33
Modelo espacial bayesiano para taxas em pequenas áreas
Modelo completo yi ∼ Poisson(µi) = Poisson(eiρi) log µi = log ei + α + i + i α ~ Uniforme [- ; ] i ~ Normal (0 ; 2) νi ~ CAR(2) Hiperprioris Gamma para τ = 1/ 2 e para τ = 1/2 (τ e τ representam a precisão) Exemplo: leishmaniose visceral (leish_inpe_spatial)
34
Modelo espacial bayesiano para taxas em pequenas áreas
Leishmaniose Visceral Humana (BH – 1994/95) Taxa bruta Taxa bruta Taxa bruta Taxa suavizada Taxa suavizada Taxa suavizada
35
Modelo espacial bayesiano para taxas em pequenas áreas
36
Modelo espacial bayesiano para taxas em pequenas áreas
Modelo espaço-temporal yi ∼ Poisson(µi) = Poisson(eiρi) log µi = log ei + θi ; θi = log ρi θi = α + i + i + 0t + it, onde α , i e i são definidos como antes ; 0 ~ Uniforme [- ; ] e i ~ CAR(2) representam a parte temporal do modelo Exemplo: leishmaniose visceral (leish_inpe_spatial_temporal)
37
Modelo espacial bayesiano para taxas em pequenas áreas
Previsão para o quarto período Modelo: No. de parâmetros : 365 Tempo de simulação de iterações: 112 segundos AMD Athlon XP GHz 512 Mb RAM
38
Modelo espacial bayesiano para taxas em pequenas áreas
Modelo espaço-temporal (alternativo) yi ∼ Poisson(µi) = Poisson(eiρi) log µi = log ei + θi ; θi = log ρi Modelo linear para θi θi = α0 + αi + i (t-1), onde α0 ~ Uniforme [- ; ] αi ~ CAR(2α) e i ~ CAR(2β) são parâmetros de uma equação de regressão ; Exemplo: leishmaniose visceral (leish_inpe_dissert)
39
Modelo espacial bayesiano para taxas em pequenas áreas
Previsão para o quarto período Modelo linear No. de parâmetros : 243 Tempo de simulação de iterações: 51 segundos
40
Modelo espacial bayesiano para taxas em pequenas áreas
Modelo espaço-temporal (alternativo) yi ∼ Poisson(µi) = Poisson(eiρi) log µi = log ei + θi ; θi = log ρi θi = α0 + αi + i (t-1) + i (t-1)2 , onde α0 , αi e i são definidos como antes ; i ~ CAR(2) ; Exemplo: leishmaniose visceral (leish_inpe_dissert)
41
Modelo espacial bayesiano para taxas em pequenas áreas
Previsão para o quarto período Modelo quadrático No. de parâmetros : 364 Tempo de simulação de iterações: 69 segundos
42
Referências Bibliográficas
Assunção, R. M. ; Reis, I. A. ; Oliveira, C. L. Diffusion and Prediction of Leishmaniasis in a Large Metropolitan Area in Brasil with a Space-Time Model. Statistics in Medicine (2001), 20 : pp Spiegelhalter, D. ; Thomas, A. ;Best, N. ;Lunn, D. WinBUGS User Manual , (References), version 1.4, (2003)
43
Back-up slides
44
Bayes Empírico yi ∼ Poisson(µi) = Poisson(eiρi)
ρi ∼ Gamma(ψi, i) E[ρi] = ψi/i e Var[ρi] = ψi/i2 E[yi] = Eρ[Ey[yi| ρi]] = Eρ[eiρi] = ei ψi/i Var [yi] = Eρ[Vary[yi| ρi]] + Varρ[Ey[ yi| ρi]] = ei ψi/i + (ei)2 ψi/i2 Pelo Método dos Momentos Então
45
Bayes Empírico O que nos leva a Igualando (1) e (2), temos
46
Padronização direta das taxas
r é taxa de referência da “doença”; Popi é a população sob risco da área i ; ei = r x Popi , é o número esperado de casos na área i ; i é o risco da “doença” na área i ; ρi = i / r é o risco relativo (desconhecido) da “doença” em relação à taxa de referência ; ei x ρi = (r x Popi) x (i / r) = Popi x i ;
47
Cálculo da posteriori P(|y)
48
Distribuição Gaussiana (Normal)
- < yi < , - < < > 0 , y = (y1, y2, ..., yn) y1, y2, ..., yn i.i.d
49
Distribuição Beta
50
Distribuição Gamma (, )
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.