Modelo de Estimativa de Risco de Incidência de Tuberculose em Municípios Brasileiros Mineração de Dados Cleiton Lima (cleiton.marcio@gmail.com) Eric Ferreira.

Slides:



Advertisements
Apresentações semelhantes
DESENVOLVIMENTO TECNOLÓGICO E PRODUÇÃO DE VACINAS NO BRASIL
Advertisements

CENÁRIO DO CÂNCER - MORTALIDADE ESTADUAL - ESTADO DE MINAS GERAIS
Co-Infecção TB/HIV Fábio Moherdaui Programa Nacional de DST/Aids
A integração das agendas da Tuberculose e da Aids
Aids no Brasil 1980 – 2007 Novembro, 2007
Jacqueline de Aguiar Barros
Transmissão do HIV e Tratamento da Aids
ESTADO DE SANTA CATARINA SECRETARIA DE ESTADO DA SAÚDE DIRETORIA DE VIGILÂNCIA EPIDEMIOLÓGICA AVALIAÇÃO DAS AÇÕES PACTUADAS NA PPI/ECD NO ESTADO DE SANTA.
SITUAÇÃO EPIDEMIOLOGICA DAS DOENÇAS EXANTAMÁTICAS NO ESTADO DE GOIAS
Secretaria de Vigilância em Saúde
Morbidade, hospitalizações e letalidade por dengue:
PLANO INTEGRADO DE AÇÕES ESTRATÉGICAS PARA DOENÇAS EM ELIMINAÇÃO
SISTEMA DE INFORMAÇÃO E INTRODUÇÃO À ANÁLISE DE DADOS
PROGRAMA ESTADUAL DE DST/HIV/AIDS
Cadastro Nacional de Estabelecimento de Saúde
Outros Sistemas de Informações em Saúde
Programas de Controle do Câncer do Colo do Útero e Mama
2.3 O Brasil em números 187,7 milhões de habitantes (estimativa IBGE,07/2008) Quinto maior contingente populacional do planeta. 1º China 2º Índia 3º.
Estudos retrospectivos de zoonoses no Estado do Paraná e municípios da Região Metropolitana de Curitiba Nathalia Terra Ferreira e Souza Iniciação Científica.
O processo de desconcentração industrial da Região Metropolitana de São Paulo Sueli Schiffer / 1.
Lógica Epidemiológica
ESTRUTURA E FUNÇÃO SOCIAL.
I Encontro Nacional sobre Tuberculose em Hospitais
1.
Basiléia II - Risco de Crédito Implementação e Diagramação
MÚSICA DA CIRANDA Um sorriso negro Um abraço negro Traz felicidade Negro sem emprego Fica sem sossego Negro é a raiz de liberdade.
MONITORIZAÇÃO DA DOENÇA DIARRÉICA AGUDA
EPIDEMIOLOGIA DA TUBERCULOSE EM ARACAJU/SE NO PERÍODO DE 1984 A 2006
Mario E. Piscoya Díaz Helder dos Santos Augusto CEDEPLAR - UFMG
Tendência da incidência da tuberculose. Paraná, 2001 a 2010*.
MONITORAMENTO E AVALIAÇÃO DAS AÇÕES NO CONTROLE DA TUBERCULOSE - TDO
Epidemiologia e Saúde Ambiental
Boletim Epidemiológico
Longevidade.
Instituto de Pesquisa Econômica Aplicada
PLANO INTEGRADO DE AÇÕES ESTRATÉGICAS de eliminação da hanseníase, filariose e oncocercose como problema de saúde pública, tracoma como causa de cegueira.
MARIA SUELI M. NOGUEIRA SECRETARIA MUNICIPAL DE SAÚDE PÚBLICA –
Projeto de Pesquisa Fatores Associados aos Desfechos do Tratamento da Tuberculose em um Centro de Atenção Básica de Saúde: Uma Análise Sob a Ótica Antropológica.
Farmacêutico Fórum de Tendências Aliança do Brasil Bruno de Paula Rocha São Paulo, 06 de dezembro de 2006.
CÂNCER DE COLO DO ÚTERO RODRIGO CÉSAR BERBEL.
Saúde Mental População Outubro/ 2007.
PROGRAMA DE CONTROLE DA TUBERCULOSE DO PARANÁ
SINAN O Sistema de Informação de Agravos de Notificação – SINAN é alimentado, principalmente, pela notificação e investigação de casos de doenças e agravos.
CONTROLE DA TUBERCULOSE RESISTENTE
Diretoria de Pesquisas COPIS Básicas Municipais Pesquisa de Informações.
PLANO DE ENFRENTAMENTO DAS DCNT DE PALMAS-TO
Slide 2/17 Etapas do PLHIS PLHIS POTIM METODOLOGIA METODOLOGIA DIAGNÓSTICO PLANO DE AÇÃO AGO/SET 2011 SET/NOV 2011 NOV/DEZ 2011.
Uma visão sócio-espacial para o planejamento das redes de distribuição de energia elétrica I Encontro Nacional sobre Geoprocessamento no Setor Elétrico.
Unidade 2: Impacto da Epidemia de HIV/SIDA na África Subsahariana
3º Congresso Internacional de Jornalismo Investigativo
 2007 Johns Hopkins Bloomberg School of Public Health Seção B Rastreamento das mortes e doenças relacionadas ao tabaco.
PLANO NACIONAL SOBRE ABORDAGEM E TRATAMENTO DO TABAGISMO
Raquel Adriana M. Salinas S. Takeguma Orientador: Dr. Jefferson A. P. Pinheiro Brasília, 06 de dezembro de ARTIGO DE MONOGRAFIA.
SAÚDE E SEGURANÇA DO TRABALHADOR NA BAHIA: UMA ANÁLISE SETORIAL E OCUPACIONAL
Vigilância Epidemiológica do Câncer e de seus Fatores FUNASA Universidade Federal Fluminense Instituto de Saúde da Comunidade Departamento de Epidemiologia.
CONCEITOS PARA ELABORAÇÃO DE INDICADORES DE SAÚDE
Vigilância das Doenças Crônicas Não-Transmissíveis
VIGILÂNCIA EM SAÚDE.
SEMINÁRIO SINAN – Sistema de informação,de agravo e de notificação.
População Brasileira A população brasileira atual é de habitantes (dados do IBGE – Censo 2010). Segundo as estimativas, no ano de 2025, a população.
Vigilância Epidemiológica
Crescimento populacional no mundo e no Brasil
Medida da Saúde Coletiva Prof. Claudia Curbani V. Manola.
A população brasileira Prof.º Jeferson. Medido através do censo (contagem da população realizada de dez em dez anos no Brasil); 1500 a 1872: Período sem.
“ Crianças nesse mundo hoje passam fome, sofrem com o frio e por faltar um teto choram então a terra também choram o céu quando uma criança fica em silêncio”
VIGILÂNCIA DE AIDS NO ESTADO DO RIO DE JANEIRO. Entre 1982 e 2014, o ERJ registrou : casos de Aids, sendo: casos (SINAN) SISCEL/SICLOM.
Jarbas Barbosa da Silva Jr. Secretaria de Vigilância em Saúde Ministério da Saúde Tuberculose e HIV/aids 19/08/2013.
OFICINA DE PLANEJAMENO DAS AÇÕES DO PROGRAMA DE CONTROLE DA TUBERCULOSE PARANÁ CURITIBA, 30 DE MARÇO DE 2011.
Transcrição da apresentação:

Modelo de Estimativa de Risco de Incidência de Tuberculose em Municípios Brasileiros Mineração de Dados Cleiton Lima (cleiton.marcio@gmail.com) Eric Ferreira (efo@cin.ufpe.br) Rossini Bezerra (rambezerra@gmail.com)

Roteiro Motivação Introdução e Caracterização do Problema Objetivo Parametrização do Problema Dados Disponíveis Pré-processamento dos Dados Modelagem Resultados Conclusões Referências

1. Motivação A Tuberculose (TB) é um problema de saúde tão grave hoje quanto no início do século passado. Suas taxas de incidência permaneceram altas nas duas últimas décadas Estima-se a existência de mais de 42 milhões de infectados no Brasil 112.000 óbitos no período

2. Introdução e Caracterização do Problema (Mundo)

3. Introdução e Caracterização do Problema (Mercado) A Tuberculose é uma doença que estar diretamente relacionada com fator sócio-econômico. A prevenção, tratamento e erradicação da Tuberculose não tem sido alvo das grandes Transnacionais da Área de Saúde

4. Introdução e Caracterização do Problema (Brasil)

5. Introdução e Caracterização do Problema (PNCT) Diante do cenário atual de Tuberculose, o Ministério da Saúde elaborou o Plano Nacional de Controle da Tuberculose (PNCT). As principais metas são: Integrar ações de controle em 100% do território brasileiro Diagnosticar (até 2001) 90% dos casos de Tuberculose Curar 85% dos casos já diagnosticados Reduzir (até 2007) a Incidência de Tuberculose em no mínimo 50%. Reduzir (até 2007) em 66%, a Taxa de Mortalidade

6. Introdução e Caracterização do Problema (PNCT) Não existem, na atualidade, Mecanismos de Monitoramento das Ações e de Verificação da Eficácia das Metas aos Determinantes do Problema. O Problema do Controle de Tuberculose no Brasil demanda Ações de Pesquisa, Monitoramento e Controle Coordenados.

7. Objetivo do Trabalho Integrar Ação de Pesquisa de Tuberculose (Instituto Ageu Magalhães - Prof Wayner Souza) com Pesquisadores do Grupo de Inteligência Computacional (CIN-UFPE) Parametrizar o Problema da Tuberculose Propor um Modelo para Estimar o Risco de Epidemia da Tuberculose em Áreas Urbanas (Municípios) no Brasil

8. Objetivo do Trabalho Extração de Regras para Avaliação das Variáveis de Impacto no Risco da Tuberculose Estudo inicial de uma Ferramenta de Suporte às Instituições e Gestores de Saúde na Investigação e Controle de Tuberculose

9. Parametrização do Problema Na Parametrização dos Fatores de Risco de Epidemia da Tuberculose, selecionaram-se como determinantes: Fatores Populacionais e Sócio-econômicos e Fatores de Saúde Os Dados foram selecionados para os 5.564 Municípios Brasileiros. Vetor de 42 Características ou Variáveis (inicial)

10. Dados Disponíveis – Descrição e Fontes Dados Populacionais e Sócio-econômicos: Extraídos do Censo Demográfico do ano de 2000 do IBGE, compreendendo População e caracterização Sócio-econômica. Para períodos superiores utilizou-se Método de Projeção do próprio IBGE. Dados de Saúde: Os dados da Tuberculose, BCG (Vacinas) e Desnutrição foram extraídos no Sistema de Informações sobre Agravos de Notificação - SINAN, para o cálculo dos coeficientes anuais de (detecção de casos)/(setor censitário), entre 2000 a 2006.

10. Dados Disponíveis – Descrição e Fontes A Ferramenta TabWin: Foi utilizada para concatenar as duas bases de dados em uma única base A ferramenta TabWin é disponibilizada no próprio site do DATASUS); Após concatenar as duas bases de dados do DATASUS e IBGE foi criado uma única base de dados No formato de planilha eletrônica( Excel) A massa de dados é correspondente aos anos de 2001-2006

11. Dados Disponíveis - Descrição

12. Pré-Processamento dos Dados (Novo Conjunto de Variáveis) Normalização das variáveis numéricas: Para as variáveis numéricas, a normalização foi realizada tendo como referência a variável População, ou seja: = (Variável / População) Por Exemplo, utilizando a variável BCG2001, o valor normalizado desta variável irá informar a porcentagem da população da cidade que foram vacinadas (BCG) no ano de 2001.

12. Pré-Processamento dos Dados (Novo Conjunto de Variáveis) Definição da variável Alvo A = Média de Casos confirmados de Tuberculose nos anos 2004,2005 e 2006. B = Média da População nos anos de 2004, 2005 e 2006 Índice-Real nos anos de 2004, 2005 e 2006 (A/B) Índice Brasileiro – Índice do PNCT: meta de redução de 50% da média nacional: (25 casos)/ (100.000 habitantes). Alvo ou Classe (Binária): 1 (S) : Se Índice Município > Índice do PNCT 0 (N): Se Índice Município <= Índice do PNCT

13. Modelagem – Classificador Bayesiano Para o Problema proposto de Estimar o Risco de Epidemia da Tuberculose nos Municípios Brasileiros propomos um Classificador Binário baseado em Redes Bayesianas. Como Ferramenta de Simulação utilizamos o Weka para obtenção da Melhor Configuração para Rede Bayesiana. Critério de Desempenho da Rede: Poder de Generalização ou Menor Erro na Fase de Teste.

13. Dados Disponíveis – Variáveis selecionadas para modelo da rede Municipio, TamanhoMunicipio, PIB-00, PIB-01, PIB-02, pib_pcap-00, pib_pcap-01, pib_pcap-02, InstalSanitarias- 2000, Óbitos2001, Óbitos2002, Óbitos2003, Óbitos2004, Óbitos2005, Lixo, BCG2001, BCG2002, BCG2003, BCG2004, BCG2005, BCG2006, AbastAgua, Alvo

14. Modelagem - Classificador Estratégia de Treinamento: Estratificado Treinamento (50%), Validação (25%) e Testes (25%). Normalização dos Parâmetros: Realizada pelo Weka e Normalização das variáveis numéricas (citada anteriormente) Avaliação de Desempenho do Classificador: Curvas ROC e KS.

15. Modelagem – Extração de Regras Foram realizados dezenas de Experimentos para Extração do Conhecimento do Domínio do Problema Para Extração de Regras Foi utilizada a ferramenta Weka Algoritmo PART Configuração padrão

16. Resultados - Classificador Foram realizados dezenas de experimentos utilizando a ferramenta Weka para encontrar: O Melhor classificador Os parâmetros ótimos do classificador Conjunto de regras Entre as dezenas de configurações, a rede neural que obteve a maior taxa de acerto (66%) foi: BayesNet Estimador: SimpleEstimator – A 0.5 SearchAlgoritm: K2 – P 1-s Bayes

16. Resultados – Curva ROC

16. Resultados – Distribuição das Classes - BayesNet

16. Resultados – Classificador Curva KS (Pr(Alta - Baixa))

16. Resultados - Classificador Total de Instâncias: 1391 S=Alto Risco com 690 Municípios N=Baixo Risco com 701municípios) Instâncias Classificadas Corretamente : 918 – 66.00% S = 456 (32,78%) N = 462 (33,22%) Instâncias Classificadas Incorretamente : 473 – 34.00% S = 239 (17,18%) N = 234 (16,82%)

16. Resultados - Classificador Matriz Confusão: S N Classificador/Alvo 456 234 239 462

16. Resultados - Regras Modelo do Classificador do conjunto de treinamento Lista de Decisão PART Número de regras obtidas: 25 regras condicionais, do tipo: Se Condicão i and Condição j ... Então Alvo := (S/N)

16. Resultados – Regras (exemplo) BCG2006 > 0.020375 AND Óbitos2004 > 0.000016 AND Óbitos2003 > 0.000276 AND Óbitos2004 > 0.000135 Então S (20.0) Apesar de 2% da população está vacinada, se os óbitos por desnutrição excederem 0,02% da mesma, temos alto risco de incidência de tuberculose.

16. Resultados – Regras (exemplo) BCG2006 <= 0.02258 AND Óbitos2003 <= 0.000297 AND Óbitos2005 <= 0.000238 AND InstalSanitarias-2000 > 0.874822 AND BCG2006 <= 0.017122 Então N (742.0/231.0) Se menos de 2% da população foi vacinada, mas os óbitos por desnutrição no período não excedem 0,02% e 87,4% possuir algum tipo de instalação sanitária, temos baixo risco de incidência de tuberculose

16. Resultados – Regras (exemplo) TamanhoMunicipio <= 6771 AND Óbitos2003 <= 0.000074 AND Óbitos2002 <= 0.000074 Então N (737.0/318.0) Para municípios com menos de 6771 habitantes e óbitos por desnutrição menor que 0,0074% da população, temos baixo risco de tuberculose.

16. Resultados – Regras (exemplo) Óbitos2004 > 0.000268 AND Óbitos2003 <= 0.00038 AND BCG2006 > 0.018103 Então N (9.0) Se a quantidade de óbitos por desnutrição em um município excede 0,026% da população em 2004 e for menor que 0,0038% em 2003 e ter mais de 1,8% da população vacinada, temos baixa probabilidade de incidência de tuberculose.

17. Conclusões Utilizando a Metodologia de Mineração de Dados em conjunto com Conhecimento do Negócio foi possível obter uma Ferramenta de Suporte a Decisão no Diagnóstico de TB em Municípios. Utilização de Extração de Conhecimento usando Regras permitiu interpretar o Impacto das Variáveis no Risco de TB. Constatamos através da Extração das Regras, que as Variáveis Sócio-econômicas estão diretamente relacionadas ao Risco de TB.

18. Referências Referências Bibliográficas [1] Ministério da Saúde. Guia para tratamento da tuberculose para o Programa de Saúde da Família. Brasília (DF); 2002. [2] Ximenes RA de A , Martelli CMT, Souza W V de, Lapa TM, Albuquerque M de FM de, Andrade ALSS de et al. Vigilância de doenças endêmicas em áreas urbanas: a interface entre mapas digitais censitários e indicadores epidemiológicos. Cad Saúde Pública 1999;15:53-61. [3] Instituto Brasileiro de Geografia e Estatística [IBGE]. Censos demográficos. Disponível em: <URL:http:// www.ibge.gov.br/ censos> [4] Ministério da Saúde. Sistema de Informações sobre Mortalidade. Disponível em: <URL: http://www.datasus.gov.br> [5] Ximenes RA de A , Martelli CMT, Souza W V de, Lapa TM, Albuquerque M de FM de, Andrade ALSS de et al. Tuberculosis in Brazil: construction of a territorially based surveillance system Rev Saúde Pública 2005;39(1):82-9 [6] S. Haykin, “Neural Networks a Compreensive Foundation”, 2end ed, Tom Robbins, Ed. USA, New Jersey: Prentice-Hall, Inc, 1999.