Taxas em pequenas áreas : uma abordagem bayesiana

Slides:



Advertisements
Apresentações semelhantes
DISTRIBUIÇÕES AMOSTRAIS
Advertisements

Agrupamentos Baseados em Probabilidade Marcílio Souto DIMAp/UFRN.
Estatística: Aplicação ao Sensoriamento Remoto ANO 2010
Estatística Dados valores (amostras) de variáveis aleatórias X1, X2, ..., Xn, cuja distribuição conjunta é desconhecida, inferir propriedades desta distribuição.
Probabilidade e Esperança Condicional
Prof. André Laurindo Maitelli DCA-UFRN
Geração de Tráfego Auto-Similar e Estimação do Parâmetro de Hurst através do método R/S Thiago Souto Maior.
Estatística amintas paiva afonso.
Intervalos de Confiança
ANÁLISE DISCRIMINANTE
ANÁLISE DISCRIMINANTE
Cássio Luís Fernandes de Oliveira
ESTIMAÇÃO.
Gestão e Tecnologia da Informação Extensão Continuada – FA7
Estatística 8 - Distribuições Amostrais
Reconhecimento de Padrões Revisão de Probabilidade e Estatística
MB-711 Fundamentos de Tratamento de Incertezas
MB-711 Fundamentos de Tratamento de Incertezas 3º Encontro de 4 Previstos (+ Avaliação) MPEP – Mestrado Profissional em Produção Prof. Armando Z. Milioni.
Métodos estatísticos em aprendizagem
Testes de Hipóteses Forma mais clássica de inferência estatística
Estatística Aplicada (Aula 4)
Objetivo Definições Cálculo do teste Exemplo Comentários Bibliografia
ANOVA Prof. Herondino.
ME623A Planejamento e Pesquisa
UNIVERSIDADE FEDERAL DO PARANÁ
Módulo 5 – Introdução à Teoria Estatística da Medição
Programação Avançada Simulação – Conceitos básicos
C OMPARAÇÃO DO COMPORTAMENTO DO BIC EM ALGUNS MODELOS PROBABILÍSTICOS Diogo Taurinho Prado Orientadora: Denise Duarte.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2014 Técnicas de Reamostragem Camilo Daleles Rennó
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2014 Inferência Estatística Camilo Daleles Rennó
TESTES DE HIPÓTESES Spencer Barbosa da Silva
VALORES ESPERADOS.
Exponential Random Graph Models
Estatística e Probabilidade
Apêndice.
DISTRIBUIÇÕES AMOSTRAIS
Estatística Para um dado conjunto de dados, podemos calcular as seguintes grandezas: 1) Medidas de posição 2) Medidas de dispersão 3) Parâmetros de simetria.
Econometria Propriedades assintóticas dos estimadores MQO
Distribuição T - Student
O que é Estatística, afinal de contas?
Modelos de distribuição de erros
ESTATÍSTICA.
Aprendizado de Máquina Prof.: Dino R. C. Franklin Aluno.: Thiago Fialho Q. L.
Amostragem Pontos mais importantes:
Site: Estatística Prof. Edson Nemer Site:
Estatística Inferencial (cap. 7 Martins)
Introdução ao Stata 05 de julho de 2013
Inferência Estatística
Teste de Hipótese.
Clique para editar o estilo do título mestre Clique para editar o estilo do subtítulo mestre 1 Seminário: Disciplina: Probabilidade e Inferência Professor:
Probabilidade e Estatística Exemplo da Moeda Balanceada
Noções de Inferência Estatística
Matemática e suas Tecnologias - Matemática PROBABILIDADE CONDICIONAL
EME709 – PLANEJAMENTO DO EXPERIMENTO Profa. Sachiko A. Lira.
DISTRIBUIÇÃO NORMAL.
Probabilidade e Estatística para Avaliação de Desempenho
Raciocínio Bayesiano Ruy Luiz Milidiú.
Universidade Federal Fluminense Faculdade de Medicina Mestrado Profissional em Saúde Materno-Infantil 2011 BIOESTATÍSTICA-aula 2 Prof. Cristina Ortiz Valete.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Inferência Estatística Camilo Daleles Rennó
ERROS E TRATAMENTO DE DADOS ANALÍTICOS
GESTÃO E GARANTIA DA QUALIDADE
DETEÇÃO E ESTIMAÇÃO Aula 20: Estimação Paramétrica Clássica.
NOÇÕES DE INFERÊNCIA ESTATÍSTICA
Camilo Daleles Rennó Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Técnicas.
Distribuição Amostral 3 Miguel Angel Uribe Opazo.
DETEÇÃO E ESTIMAÇÃO Aula 18: Simulação de Monte Carlo – Parte 2.
DETEÇÃO E ESTIMAÇÃO Aula X+1: Simulação de Monte Carlo.
Métodos Probabilísticos
INTERVALO DE CONFIANÇA PARA A MEDIA POPULACIONAL (σ 2 desconhecido ) Sabemos que se o tamanho da amostra for superior a 30 a distribuição amostral das.
Análise de Dados de Área: Suavização de Taxas e Proporções
Transcrição da apresentação:

Taxas em pequenas áreas : uma abordagem bayesiana Ilka Afonso Reis Análise Espacial - INPE

Taxas em pequenas áreas yi é o número de casos da “doença” na área i ; ei é o número esperado de casos da “doença” na área i ; ρi é o risco relativo (desconhecido) da “doença” em relação à taxa de referência ; (padronização) Taxa bruta : Quanto menor o no. esperado de casos, maior a variabilidade na estimação

Qual é o problema com taxas brutas ? Suponha uma “doença” com r = 0,10 e acontece um caso em cada área (y = 1) Se Pop1 = 10000, e1 = 0,10 x 10000 = 1000 Se Pop2 = 1000, e2 = 0,10 x 1000 = 100 Se Pop3 = 100, e3 = 0,10 x 100 = 10 p1=1/10000 = 0,0001 e Var(p1) = 1/100002 = 1 x 10-8 p2=1/1000 = 0,001 e Var(p2) = 1/10002 = 1 x 10-6 p3=1/100 = 0,01 e Var(p3) = 1/1002 = 1 x 10-4

Qual é o problema com taxas brutas ? Taxa bruta Taxa suavizada

Solução para o problema das taxas brutas Suavizar as taxas Como ? Estimadores Bayesianos Empíricos Completos

Uma Breve Introdução à Inferência Bayesiana Probabilidade Condicional Teorema de Bayes Verossimilhança Probabilidade a priori Probabilidade a posteriori

Um exemplo : medidas de qualidade de testes diagnósticos Doente (D) Positivo (+|D) Negativo (-|D) Sadio (S) Positivo (+|S) Negativo (-|S)

Avaliação da qualidade do teste Acertos : Entre os doentes Sensibilidade (s) Especificidade (e) Entre os sadios

Avaliação da qualidade do teste Resultado do teste Padrão-ouro Total Doente Não Doente Positivo 265 47 312 Negativo 11 50 61 276 97 373

Avaliação da qualidade do diagnóstico Acertos : Entre os positivos Valor de Predição Positiva (VPP) Valor de Predição Negativa (VPN) Entre os negativos

Avaliação da qualidade do diagnóstico Regra de Bayes

Enfim ... Probabilidade a priori “Verossimilhança” Probabilidade a posteriori

Conceitos Básicos e Notação Dados : provenientes de uma amostra da população de interesse y = (y1, y2, ..., yn) P(y), distribuição de probabilidade conjunta de y. Parâmetros: quantidades, em geral desconhecidas, que estão presentes nos modelos probabilísticos para y e serão representadas por . P(y|), função de verossimilhança de y.

Exemplo : estimação de taxas yi , casos da “doença” na área i ei , número de casos esperados na área i segunda a taxa de referência Parâmetros a serem estimados ρi : o risco relativo (desconhecido) da “doença” em relação à taxa de referência eiρi representa o número de casos esperados (média) na área i Na inferência clássica, boas estimativas para ρi são os valores que maximizam a função de verossimilhança P(y|ρi ). Estes valores são a estimativa de máxima verossimilhança O modelo para os dados é a função de verossimilhança P(y|). Modelo : yi ∼ Poisson(eiρi)

O Método da Máxima Verossimilhança Na inferência clássica, os parâmetros de um modelo são tratados como quantidades fixas (não aleatórias), porém desconhecidas. O método da máxima verossimilhança é considerado bom em muitos casos. Porém, quando a forma de P(y|) é complexa e/ou quando o número de parâmetros  envolvidos é grande, este método torna-se difícil de implementar.

A abordagem Bayesiana Na inferência Bayesiana, os parâmetros  são tratados como quantidades aleatórias. O modelo estatístico não é mais somente P(y|) e sim P(y,), a distribuição conjunta dos dados y e dos parâmetros  . As estimativas para  não serão somente valores, mas sim uma distribuição de probabilidades. P(|y) é a distribuição de probabilidades dos parâmetros  “ à luz” dos dados y.

A abordagem Bayesiana Como obter P(|y) ? Pela Regra de Bayes Probabilidade a priori Probabilidade a posteriori Verossimilhança

A abordagem Bayesiana P() expressa a incerteza sobre  antes de observarmos os dados y que dependem dele (a priori) . P(|y) expressa a incerteza sobre  depois de observarmos os dados y que dependem dele (a posteriori). De posse de P(|y), podemos examinar qualquer aspecto de  (média, variância, percentis, probabilidade de assumir determinados valores, etc.) (“Full Posterior Distribution”)

Passos para obtenção de P(|y) Escolher um modelo probabilístico para P(y|) – a função de verossimilhança; Escolher um modelo probabilístico para P() – a distribuição a priori ; Aplicar a regra de Bayes e calcular P(|y).

Exemplo : modelo Gamma-Poisson y é o número de casos da “doença” em certa área ; e é o número esperado de casos da “doença” em certa área; ρ é o risco relativo (desconhecido) da “doença” em relação à taxa de referência nesta área; Modelo para P(y|) : y ~ Poisson (e )

Exemplo : modelo Gamma-Poisson Modelo para P() :  ~ Gamma (,) hiperparâmetros Cálculo da posteriori P(|y) |y ~ Gamma ( + y ,  + e )

Exemplo : modelo Gamma-Poisson Suponha que y = 4 e e = 6.5 Priori´s : Gamma (0.5 , 0.5), Gamma (1,1) e Gamma (10,10) Posteriori´s : Gamma (4.5 , 7.0), Gamma (5,7.5) e Gamma(14,16.5)

Exemplo : modelo Gamma-Poisson Priori Quantis a posteriori Média a posteriori 0.025 0.500 0.975 Gamma (0.5,0.5) 0.421 0.596 0.813 0.643 Gamma (1 , 1) 0.449 0.623 0.837 0.673 Gamma (10 , 10) 0.687 0.828 0.988 0.855 Intervalo de Credibilidade de 95%

Modelo espacial bayesiano para taxas em pequenas áreas

Modelo espacial bayesiano para taxas em pequenas áreas Modelo geral yi ∼ Poisson(µi) = Poisson(eiρi) yi é o número de casos da “doença” na área i ; ei é o número esperado de casos da “doença” na área i ; ρi é o risco relativo (desconhecido) da “doença” em relação à taxa de referência ; (padronização) log µi = log ei + θi ; θi denota o log do risco relativo (θi = log ρi , ou seja, ρi = exp(θi) ) Modelo de efeitos fixos (máxima verossimilhança) Quanto menor o no. esperado de casos, maior a variabilidade na estimação

Qual é o problema com taxas brutas ? Taxa bruta Taxa suavizada

Qual é o problema com taxas brutas ? Taxa bruta Taxa suavizada

Qual é o problema com taxas brutas ? Taxa bruta Taxa suavizada

Modelo espacial bayesiano para taxas em pequenas áreas Modelo de efeitos aleatórios ρi ∼ Gamma(ψi, fi)  µρ = ψi/fi e σ2ρ = ψi/fi2 ; Gamma “+” Poisson “=” Gamma ; P(ρi|y) ∼ Gamma(ψi + yi, fi + ei). Quanto maior o número de dados, mais próximo de yi/ei estará a estimativa do risco relativo ; Quanto menor o número de dados, mais próximo de ψi/fi estará a estimativa de risco relativo.

Modelo espacial bayesiano para taxas em pequenas áreas Os parâmetros ψi e fi são os hiperparâmetros. Como saber quem ψi e fi ? Podem ser estimados (Bayes empírico) ; Pode-se estabelecer uma distribuição a priori para ψ e φ (hiperprioris). Exemplo: Mersey priori hiperprioris P(ρ, ψ, f|y) ∝ P(y|ρ)P(ρ|ψ, f)P(ψ)P(f)

Modelo espacial bayesiano para taxas em pequenas áreas Modelo espacialmente estruturado (abordagem completa) yi ∼ Poisson(µi) = Poisson(eiρi) log µi = log ei + θi ; θi = log ρi θi = α + fi + i , onde α é o log do risco relativo médio sobre todas as áreas ; fi é a parte não-espacialmente estruturada do log do risco relativo da área i ; (média zero) i é a parte espacialmente estruturada do log do risco relativo da área i;

Modelo espacial bayesiano para taxas em pequenas áreas Prioris : α ~ Uniforme [- ;  ] (“flat”) fi ~ Normal (0 ; 2f) A priori para νi é um modelo autoregressivo condicional Gaussiano (CAR) wij são pesos representando a adjacência das áreas. A definição mais comum para wij são valores binários : wij = 1, se as áreas i e j são adjacentes; wij = 0, caso contrário.

Modelo espacial bayesiano para taxas em pequenas áreas Modelo completo yi ∼ Poisson(µi) = Poisson(eiρi) log µi = log ei + α + i + i α ~ Uniforme [- ;  ] i ~ Normal (0 ; 2) νi ~ CAR(2) Hiperprioris Gamma para τ = 1/ 2 e para τ = 1/2 (τ e τ representam a precisão) Exemplo: leishmaniose visceral (leish_inpe_spatial)

Modelo espacial bayesiano para taxas em pequenas áreas Leishmaniose Visceral Humana (BH – 1994/95) Taxa bruta Taxa bruta Taxa bruta Taxa suavizada Taxa suavizada Taxa suavizada

Modelo espacial bayesiano para taxas em pequenas áreas

Modelo espacial bayesiano para taxas em pequenas áreas Modelo espaço-temporal yi ∼ Poisson(µi) = Poisson(eiρi) log µi = log ei + θi ; θi = log ρi θi = α + i + i + 0t + it, onde α , i e i são definidos como antes ; 0 ~ Uniforme [- ;  ] e i ~ CAR(2) representam a parte temporal do modelo Exemplo: leishmaniose visceral (leish_inpe_spatial_temporal)

Modelo espacial bayesiano para taxas em pequenas áreas Previsão para o quarto período Modelo: No. de parâmetros : 365 Tempo de simulação de 10000 iterações: 112 segundos AMD Athlon XP2000 1.67 GHz 512 Mb RAM

Modelo espacial bayesiano para taxas em pequenas áreas Modelo espaço-temporal (alternativo) yi ∼ Poisson(µi) = Poisson(eiρi) log µi = log ei + θi ; θi = log ρi Modelo linear para θi θi = α0 + αi + i (t-1), onde α0 ~ Uniforme [- ; ] αi ~ CAR(2α) e i ~ CAR(2β) são parâmetros de uma equação de regressão ; Exemplo: leishmaniose visceral (leish_inpe_dissert)

Modelo espacial bayesiano para taxas em pequenas áreas Previsão para o quarto período Modelo linear No. de parâmetros : 243 Tempo de simulação de 10000 iterações: 51 segundos

Modelo espacial bayesiano para taxas em pequenas áreas Modelo espaço-temporal (alternativo) yi ∼ Poisson(µi) = Poisson(eiρi) log µi = log ei + θi ; θi = log ρi θi = α0 + αi + i (t-1) + i (t-1)2 , onde α0 , αi e i são definidos como antes ; i ~ CAR(2) ; Exemplo: leishmaniose visceral (leish_inpe_dissert)

Modelo espacial bayesiano para taxas em pequenas áreas Previsão para o quarto período Modelo quadrático No. de parâmetros : 364 Tempo de simulação de 10000 iterações: 69 segundos

Referências Bibliográficas Assunção, R. M. ; Reis, I. A. ; Oliveira, C. L. Diffusion and Prediction of Leishmaniasis in a Large Metropolitan Area in Brasil with a Space-Time Model. Statistics in Medicine (2001), 20 : pp. 2319- 2335 Spiegelhalter, D. ; Thomas, A. ;Best, N. ;Lunn, D. WinBUGS User Manual , (References), version 1.4, (2003)

Back-up slides

Bayes Empírico yi ∼ Poisson(µi) = Poisson(eiρi) ρi ∼ Gamma(ψi, i) E[ρi] = ψi/i e Var[ρi] = ψi/i2 E[yi] = Eρ[Ey[yi| ρi]] = Eρ[eiρi] = ei ψi/i Var [yi] = Eρ[Vary[yi| ρi]] + Varρ[Ey[ yi| ρi]] = ei ψi/i + (ei)2 ψi/i2 Pelo Método dos Momentos Então

Bayes Empírico O que nos leva a Igualando (1) e (2), temos

Padronização direta das taxas r é taxa de referência da “doença”; Popi é a população sob risco da área i ; ei = r x Popi , é o número esperado de casos na área i ; i é o risco da “doença” na área i ; ρi = i / r é o risco relativo (desconhecido) da “doença” em relação à taxa de referência ; ei x ρi = (r x Popi) x (i / r) = Popi x i ;

Cálculo da posteriori P(|y)

Distribuição Gaussiana (Normal) - < yi <  , - <  <   > 0 , y = (y1, y2, ..., yn) y1, y2, ..., yn i.i.d

Distribuição Beta                            

Distribuição Gamma (, )