Taxas em pequenas áreas : uma abordagem bayesiana

Slides:

Advertisements

Apresentações semelhantes

DISTRIBUIÇÕES AMOSTRAIS

Advertisements

Agrupamentos Baseados em Probabilidade Marcílio Souto DIMAp/UFRN.

Estatística: Aplicação ao Sensoriamento Remoto ANO 2010

Estatística Dados valores (amostras) de variáveis aleatórias X1, X2, ..., Xn, cuja distribuição conjunta é desconhecida, inferir propriedades desta distribuição.

Probabilidade e Esperança Condicional

Prof. André Laurindo Maitelli DCA-UFRN

Geração de Tráfego Auto-Similar e Estimação do Parâmetro de Hurst através do método R/S Thiago Souto Maior.

Estatística amintas paiva afonso.

Intervalos de Confiança

ANÁLISE DISCRIMINANTE

ANÁLISE DISCRIMINANTE

Cássio Luís Fernandes de Oliveira

Gestão e Tecnologia da Informação Extensão Continuada – FA7

Estatística 8 - Distribuições Amostrais

Reconhecimento de Padrões Revisão de Probabilidade e Estatística

MB-711 Fundamentos de Tratamento de Incertezas

MB-711 Fundamentos de Tratamento de Incertezas 3º Encontro de 4 Previstos (+ Avaliação) MPEP – Mestrado Profissional em Produção Prof. Armando Z. Milioni.

Métodos estatísticos em aprendizagem

Testes de Hipóteses Forma mais clássica de inferência estatística

Estatística Aplicada (Aula 4)

Objetivo Definições Cálculo do teste Exemplo Comentários Bibliografia

ANOVA Prof. Herondino.

ME623A Planejamento e Pesquisa

UNIVERSIDADE FEDERAL DO PARANÁ

Módulo 5 – Introdução à Teoria Estatística da Medição

Programação Avançada Simulação – Conceitos básicos

C OMPARAÇÃO DO COMPORTAMENTO DO BIC EM ALGUNS MODELOS PROBABILÍSTICOS Diogo Taurinho Prado Orientadora: Denise Duarte.

Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2014 Técnicas de Reamostragem Camilo Daleles Rennó

Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2014 Inferência Estatística Camilo Daleles Rennó

TESTES DE HIPÓTESES Spencer Barbosa da Silva

VALORES ESPERADOS.

Exponential Random Graph Models

Estatística e Probabilidade

DISTRIBUIÇÕES AMOSTRAIS

Estatística Para um dado conjunto de dados, podemos calcular as seguintes grandezas: 1) Medidas de posição 2) Medidas de dispersão 3) Parâmetros de simetria.

Econometria Propriedades assintóticas dos estimadores MQO

Distribuição T - Student

O que é Estatística, afinal de contas?

Modelos de distribuição de erros

Aprendizado de Máquina Prof.: Dino R. C. Franklin Aluno.: Thiago Fialho Q. L.

Amostragem Pontos mais importantes:

Site: Estatística Prof. Edson Nemer Site:

Estatística Inferencial (cap. 7 Martins)

Introdução ao Stata 05 de julho de 2013

Inferência Estatística

Teste de Hipótese.

Clique para editar o estilo do título mestre Clique para editar o estilo do subtítulo mestre 1 Seminário: Disciplina: Probabilidade e Inferência Professor:

Probabilidade e Estatística Exemplo da Moeda Balanceada

Noções de Inferência Estatística

Matemática e suas Tecnologias - Matemática PROBABILIDADE CONDICIONAL

EME709 – PLANEJAMENTO DO EXPERIMENTO Profa. Sachiko A. Lira.

DISTRIBUIÇÃO NORMAL.

Probabilidade e Estatística para Avaliação de Desempenho

Raciocínio Bayesiano Ruy Luiz Milidiú.

Universidade Federal Fluminense Faculdade de Medicina Mestrado Profissional em Saúde Materno-Infantil 2011 BIOESTATÍSTICA-aula 2 Prof. Cristina Ortiz Valete.

Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Inferência Estatística Camilo Daleles Rennó

ERROS E TRATAMENTO DE DADOS ANALÍTICOS

GESTÃO E GARANTIA DA QUALIDADE

DETEÇÃO E ESTIMAÇÃO Aula 20: Estimação Paramétrica Clássica.

NOÇÕES DE INFERÊNCIA ESTATÍSTICA

Camilo Daleles Rennó Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Técnicas.

Distribuição Amostral 3 Miguel Angel Uribe Opazo.

DETEÇÃO E ESTIMAÇÃO Aula 18: Simulação de Monte Carlo – Parte 2.

DETEÇÃO E ESTIMAÇÃO Aula X+1: Simulação de Monte Carlo.

Métodos Probabilísticos

INTERVALO DE CONFIANÇA PARA A MEDIA POPULACIONAL (σ 2 desconhecido ) Sabemos que se o tamanho da amostra for superior a 30 a distribuição amostral das.

Análise de Dados de Área: Suavização de Taxas e Proporções

Transcrição da apresentação:

Taxas em pequenas áreas : uma abordagem bayesiana Ilka Afonso Reis Análise Espacial - INPE

Taxas em pequenas áreas yi é o número de casos da “doença” na área i ; ei é o número esperado de casos da “doença” na área i ; ρi é o risco relativo (desconhecido) da “doença” em relação à taxa de referência ; (padronização) Taxa bruta : Quanto menor o no. esperado de casos, maior a variabilidade na estimação

Qual é o problema com taxas brutas ? Suponha uma “doença” com r = 0,10 e acontece um caso em cada área (y = 1) Se Pop1 = 10000, e1 = 0,10 x 10000 = 1000 Se Pop2 = 1000, e2 = 0,10 x 1000 = 100 Se Pop3 = 100, e3 = 0,10 x 100 = 10 p1=1/10000 = 0,0001 e Var(p1) = 1/100002 = 1 x 10-8 p2=1/1000 = 0,001 e Var(p2) = 1/10002 = 1 x 10-6 p3=1/100 = 0,01 e Var(p3) = 1/1002 = 1 x 10-4

Qual é o problema com taxas brutas ? Taxa bruta Taxa suavizada

Solução para o problema das taxas brutas Suavizar as taxas Como ? Estimadores Bayesianos Empíricos Completos

Uma Breve Introdução à Inferência Bayesiana Probabilidade Condicional Teorema de Bayes Verossimilhança Probabilidade a priori Probabilidade a posteriori

Um exemplo : medidas de qualidade de testes diagnósticos Doente (D) Positivo (+|D) Negativo (-|D) Sadio (S) Positivo (+|S) Negativo (-|S)

Avaliação da qualidade do teste Acertos : Entre os doentes Sensibilidade (s) Especificidade (e) Entre os sadios

Avaliação da qualidade do teste Resultado do teste Padrão-ouro Total Doente Não Doente Positivo 265 47 312 Negativo 11 50 61 276 97 373

Avaliação da qualidade do diagnóstico Acertos : Entre os positivos Valor de Predição Positiva (VPP) Valor de Predição Negativa (VPN) Entre os negativos

Avaliação da qualidade do diagnóstico Regra de Bayes

Enfim ... Probabilidade a priori “Verossimilhança” Probabilidade a posteriori

Conceitos Básicos e Notação Dados : provenientes de uma amostra da população de interesse y = (y1, y2, ..., yn) P(y), distribuição de probabilidade conjunta de y. Parâmetros: quantidades, em geral desconhecidas, que estão presentes nos modelos probabilísticos para y e serão representadas por . P(y|), função de verossimilhança de y.

Exemplo : estimação de taxas yi , casos da “doença” na área i ei , número de casos esperados na área i segunda a taxa de referência Parâmetros a serem estimados ρi : o risco relativo (desconhecido) da “doença” em relação à taxa de referência eiρi representa o número de casos esperados (média) na área i Na inferência clássica, boas estimativas para ρi são os valores que maximizam a função de verossimilhança P(y|ρi ). Estes valores são a estimativa de máxima verossimilhança O modelo para os dados é a função de verossimilhança P(y|). Modelo : yi ∼ Poisson(eiρi)

O Método da Máxima Verossimilhança Na inferência clássica, os parâmetros de um modelo são tratados como quantidades fixas (não aleatórias), porém desconhecidas. O método da máxima verossimilhança é considerado bom em muitos casos. Porém, quando a forma de P(y|) é complexa e/ou quando o número de parâmetros  envolvidos é grande, este método torna-se difícil de implementar.

A abordagem Bayesiana Na inferência Bayesiana, os parâmetros  são tratados como quantidades aleatórias. O modelo estatístico não é mais somente P(y|) e sim P(y,), a distribuição conjunta dos dados y e dos parâmetros  . As estimativas para  não serão somente valores, mas sim uma distribuição de probabilidades. P(|y) é a distribuição de probabilidades dos parâmetros  “ à luz” dos dados y.

A abordagem Bayesiana Como obter P(|y) ? Pela Regra de Bayes Probabilidade a priori Probabilidade a posteriori Verossimilhança

A abordagem Bayesiana P() expressa a incerteza sobre  antes de observarmos os dados y que dependem dele (a priori) . P(|y) expressa a incerteza sobre  depois de observarmos os dados y que dependem dele (a posteriori). De posse de P(|y), podemos examinar qualquer aspecto de  (média, variância, percentis, probabilidade de assumir determinados valores, etc.) (“Full Posterior Distribution”)

Passos para obtenção de P(|y) Escolher um modelo probabilístico para P(y|) – a função de verossimilhança; Escolher um modelo probabilístico para P() – a distribuição a priori ; Aplicar a regra de Bayes e calcular P(|y).

Exemplo : modelo Gamma-Poisson y é o número de casos da “doença” em certa área ; e é o número esperado de casos da “doença” em certa área; ρ é o risco relativo (desconhecido) da “doença” em relação à taxa de referência nesta área; Modelo para P(y|) : y ~ Poisson (e )

Exemplo : modelo Gamma-Poisson Modelo para P() :  ~ Gamma (,) hiperparâmetros Cálculo da posteriori P(|y) |y ~ Gamma ( + y ,  + e )

Exemplo : modelo Gamma-Poisson Suponha que y = 4 e e = 6.5 Priori´s : Gamma (0.5 , 0.5), Gamma (1,1) e Gamma (10,10) Posteriori´s : Gamma (4.5 , 7.0), Gamma (5,7.5) e Gamma(14,16.5)

Exemplo : modelo Gamma-Poisson Priori Quantis a posteriori Média a posteriori 0.025 0.500 0.975 Gamma (0.5,0.5) 0.421 0.596 0.813 0.643 Gamma (1 , 1) 0.449 0.623 0.837 0.673 Gamma (10 , 10) 0.687 0.828 0.988 0.855 Intervalo de Credibilidade de 95%

Modelo espacial bayesiano para taxas em pequenas áreas

Modelo espacial bayesiano para taxas em pequenas áreas Modelo geral yi ∼ Poisson(µi) = Poisson(eiρi) yi é o número de casos da “doença” na área i ; ei é o número esperado de casos da “doença” na área i ; ρi é o risco relativo (desconhecido) da “doença” em relação à taxa de referência ; (padronização) log µi = log ei + θi ; θi denota o log do risco relativo (θi = log ρi , ou seja, ρi = exp(θi) ) Modelo de efeitos fixos (máxima verossimilhança) Quanto menor o no. esperado de casos, maior a variabilidade na estimação

Qual é o problema com taxas brutas ? Taxa bruta Taxa suavizada

Qual é o problema com taxas brutas ? Taxa bruta Taxa suavizada

Qual é o problema com taxas brutas ? Taxa bruta Taxa suavizada

Modelo espacial bayesiano para taxas em pequenas áreas Modelo de efeitos aleatórios ρi ∼ Gamma(ψi, fi)  µρ = ψi/fi e σ2ρ = ψi/fi2 ; Gamma “+” Poisson “=” Gamma ; P(ρi|y) ∼ Gamma(ψi + yi, fi + ei). Quanto maior o número de dados, mais próximo de yi/ei estará a estimativa do risco relativo ; Quanto menor o número de dados, mais próximo de ψi/fi estará a estimativa de risco relativo.

Modelo espacial bayesiano para taxas em pequenas áreas Os parâmetros ψi e fi são os hiperparâmetros. Como saber quem ψi e fi ? Podem ser estimados (Bayes empírico) ; Pode-se estabelecer uma distribuição a priori para ψ e φ (hiperprioris). Exemplo: Mersey priori hiperprioris P(ρ, ψ, f|y) ∝ P(y|ρ)P(ρ|ψ, f)P(ψ)P(f)

Modelo espacial bayesiano para taxas em pequenas áreas Modelo espacialmente estruturado (abordagem completa) yi ∼ Poisson(µi) = Poisson(eiρi) log µi = log ei + θi ; θi = log ρi θi = α + fi + i , onde α é o log do risco relativo médio sobre todas as áreas ; fi é a parte não-espacialmente estruturada do log do risco relativo da área i ; (média zero) i é a parte espacialmente estruturada do log do risco relativo da área i;

Modelo espacial bayesiano para taxas em pequenas áreas Prioris : α ~ Uniforme [- ;  ] (“flat”) fi ~ Normal (0 ; 2f) A priori para νi é um modelo autoregressivo condicional Gaussiano (CAR) wij são pesos representando a adjacência das áreas. A definição mais comum para wij são valores binários : wij = 1, se as áreas i e j são adjacentes; wij = 0, caso contrário.

Modelo espacial bayesiano para taxas em pequenas áreas Modelo completo yi ∼ Poisson(µi) = Poisson(eiρi) log µi = log ei + α + i + i α ~ Uniforme [- ;  ] i ~ Normal (0 ; 2) νi ~ CAR(2) Hiperprioris Gamma para τ = 1/ 2 e para τ = 1/2 (τ e τ representam a precisão) Exemplo: leishmaniose visceral (leish_inpe_spatial)

Modelo espacial bayesiano para taxas em pequenas áreas Leishmaniose Visceral Humana (BH – 1994/95) Taxa bruta Taxa bruta Taxa bruta Taxa suavizada Taxa suavizada Taxa suavizada

Modelo espacial bayesiano para taxas em pequenas áreas

Modelo espacial bayesiano para taxas em pequenas áreas Modelo espaço-temporal yi ∼ Poisson(µi) = Poisson(eiρi) log µi = log ei + θi ; θi = log ρi θi = α + i + i + 0t + it, onde α , i e i são definidos como antes ; 0 ~ Uniforme [- ;  ] e i ~ CAR(2) representam a parte temporal do modelo Exemplo: leishmaniose visceral (leish_inpe_spatial_temporal)

Modelo espacial bayesiano para taxas em pequenas áreas Previsão para o quarto período Modelo: No. de parâmetros : 365 Tempo de simulação de 10000 iterações: 112 segundos AMD Athlon XP2000 1.67 GHz 512 Mb RAM

Modelo espacial bayesiano para taxas em pequenas áreas Modelo espaço-temporal (alternativo) yi ∼ Poisson(µi) = Poisson(eiρi) log µi = log ei + θi ; θi = log ρi Modelo linear para θi θi = α0 + αi + i (t-1), onde α0 ~ Uniforme [- ; ] αi ~ CAR(2α) e i ~ CAR(2β) são parâmetros de uma equação de regressão ; Exemplo: leishmaniose visceral (leish_inpe_dissert)

Modelo espacial bayesiano para taxas em pequenas áreas Previsão para o quarto período Modelo linear No. de parâmetros : 243 Tempo de simulação de 10000 iterações: 51 segundos

Modelo espacial bayesiano para taxas em pequenas áreas Modelo espaço-temporal (alternativo) yi ∼ Poisson(µi) = Poisson(eiρi) log µi = log ei + θi ; θi = log ρi θi = α0 + αi + i (t-1) + i (t-1)2 , onde α0 , αi e i são definidos como antes ; i ~ CAR(2) ; Exemplo: leishmaniose visceral (leish_inpe_dissert)

Modelo espacial bayesiano para taxas em pequenas áreas Previsão para o quarto período Modelo quadrático No. de parâmetros : 364 Tempo de simulação de 10000 iterações: 69 segundos

Referências Bibliográficas Assunção, R. M. ; Reis, I. A. ; Oliveira, C. L. Diffusion and Prediction of Leishmaniasis in a Large Metropolitan Area in Brasil with a Space-Time Model. Statistics in Medicine (2001), 20 : pp. 2319- 2335 Spiegelhalter, D. ; Thomas, A. ;Best, N. ;Lunn, D. WinBUGS User Manual , (References), version 1.4, (2003)

Back-up slides

Bayes Empírico yi ∼ Poisson(µi) = Poisson(eiρi) ρi ∼ Gamma(ψi, i) E[ρi] = ψi/i e Var[ρi] = ψi/i2 E[yi] = Eρ[Ey[yi| ρi]] = Eρ[eiρi] = ei ψi/i Var [yi] = Eρ[Vary[yi| ρi]] + Varρ[Ey[ yi| ρi]] = ei ψi/i + (ei)2 ψi/i2 Pelo Método dos Momentos Então

Bayes Empírico O que nos leva a Igualando (1) e (2), temos

Padronização direta das taxas r é taxa de referência da “doença”; Popi é a população sob risco da área i ; ei = r x Popi , é o número esperado de casos na área i ; i é o risco da “doença” na área i ; ρi = i / r é o risco relativo (desconhecido) da “doença” em relação à taxa de referência ; ei x ρi = (r x Popi) x (i / r) = Popi x i ;

Cálculo da posteriori P(|y)

Distribuição Gaussiana (Normal) - < yi <  , - <  <   > 0 , y = (y1, y2, ..., yn) y1, y2, ..., yn i.i.d

Distribuição Beta

Distribuição Gamma (, )