Carregar apresentação
A apresentação está carregando. Por favor, espere
PublicouRaphaella Guimaraes Alterado mais de 10 anos atrás
1
Projeto de um Data Warehouse para a Saúde Pública
Ricardo S. Santos DIS/Unifesp Marco Antônio Gutierrez - INCOR Sérgio Furuie - INCOR Umberto Tachinardi - SES-SP
2
AGENDA Introdução A proposta do projeto Metodologia e Estratégia de Desenvolvimento A carga dos Dados A exibição da Informação Resultados e Discussão Conclusões
3
Introdução
4
OBJETIVO O objetivo deste trabalho é apresentar um projeto de implementação de um Data Warehouse (DW) destinado à gestão da saúde pública. O DW pretende suprir a Secretaria de Estado de Saúde de São Paulo (SES-SP) com informação gerencial obtida através da integração de dados provenientes de diversas fontes isoladas. KDD – Knowledge Discovering in Databases
5
DEFINIÇÕES Plataforma que contém os dados da organização, centralizados e organizados de forma que usuários, de maneira muito simples, possam extrair relatórios analíticos, complexos, contendo informações gerenciais para apoio à decisão. (Shams, 2001).
6
Contexto do DW Data Sources Analysis Query Reports Data mining
Operational DBs other sources Analysis Query Reports Data mining Front-End Tools OLAP Engine Serve OLAP Server Data Warehouse Extract Transform Load Refresh Metadata Data Marts Data Storage
7
DEFINIÇÕES Metadados: Dados a respeito de dados
Descrevem completamente os dados (bases) que representam, permitindo ao usuário decidir sobre a utilização desses dados da melhor forma possível. Um item de um metadado pode dizer do que se trata aquele dado, geralmente uma informação inteligível por um computador. Os metadados facilitam o entendimento dos relacionamentos e a utilidade das informações dos dados.
8
DEFINIÇÕES Ferramentas ETL
ETL - Extração, Transformação e Carga de Dados O ETL ou ETT (Extração, Transformação e Transporte) Parte do Data Warehouse responsável por ler os dados do sistema origem, Tratar, Limpar, Transformar e Carregar esses dados no Data Warehouse. Uma das fases mais criticas de um Data Warehouse: envolve a movimentação dos dados. Poderosa fonte de geração de metadados, e que contribuem muito para a produtividade da equipe de TI. 1. definir fontes de dados e fazer a extração deles 2. transformar e limpar os dados, padronizar (reduzir inconsistência e lixo) 3. integrar todas fontes de dados num único banco (garantir integridade dos dados)
9
DEFINIÇÕES Ferramentas OLAP - On-line Analytical Processing
Voltadas para o suporte à decisão. para acesso e manipulação de grandes depósitos de dados; integração de informações provenientes de fontes diversas software que permite analisar e visualizar dados corporativos de forma rápida, consistente e principalmente interativa permitem análises estatísticas sofisticadas e simulação eficiente de novas associações entre os dados. espaço multidimensional, onde cada eixo representa uma dimensão e os pontos neste espaço com um valor medido correspondente a interseção dos elementos correspondentes em dada dimensão . ferramenta de Business Inteligente utilizada para apoiar as empresas na análise ad-hoc de suas informações, visando obter novos conhecimentos que são empregados na tomada de decisão.
10
Termos do Olap Membros Hierarquia: Geografia País Estado Cidade Cubo
Etc... Dimensões Cubo Produto Florianópolis Lages Geografia Medidas: É representada por uma dimensão especial utilizada para realizar comparações. Inclui membros como: custos, lucros ou taxas. Trombudo Central Curitibanos 1999 Membros Leite 2000 Pão 2001 Chá Tempo 2002 Água
11
DEFINIÇÕES Data mining estudo comportamental dos dados
vinculado à disciplinas como redes neurais, inteligência artificial e lógica nebulosa Objetivo: fazer modelos de previsão e apresentar tendências e relações ocultas entre os dados
12
EXEMPLOS DE FERRAMENTAS COMERCIAIS
Ferramentas ETL DTS (Data Transformation Service) Data Stage, ETI, Acta e Sagent Cognos Business Intelligence Platform MicroStrategy; 7i Platform; Aplix Ferramentas OLAP OLAP Option, da Oracle Analysis Services, da Microsoft. DSS MicroStrategy Maestro Ferramentas Data mining SAS Enterprise Miner IBM Intelligent Miner Oracle Darwin Data Mining Software
13
A Proposta do Projeto
14
ESCOPO DO PROJETO As fontes de dados correspondem às bases de dados provenientes dos sistemas do DATASUS, além de planilhas e documentos internos. As informações produzidas devem atender aos gestores municipais, diretores regionais e os coordenadores.
15
Metodologia e Estratégia de Desenvolvimento
16
METODOLOGIA INMON
17
METODOLOGIA PROPOSTA
18
ESTRATÉGIA PROPOSTA A estratégia adotada é a criação de um banco de dados relacional (operacional) além do dimensional. O principal motivo é manter os dados fontes em um meio mais seguro.
19
FERRAMENTAS UTILIZADAS
20
O processo de Carga
21
ETAPAS DA CARGA Na primeira fase os dados dos sistemas fontes (DATASUS) são carregados em um banco relacional, e posteriormente, são transportados para o banco dimensional. Oracle Warehouse Buider Ferramenta Desenvolvida
22
FERRAMENTA DESENVOLVIDA
Efetua Download, compara e atualiza a estrutura, verifica conteúdo e unifica movimentos.
23
A exibição da Informação
24
FERRAMENTA OLAP - Cadastramento das descrições dos dados e das regras de negócio no metadados. - Desenvolvimento de relatórios e consultas pré-definidos para atender os principais requisitos.
25
Resultados e Discussão
26
STATUS DO PROJETO Fase final de implementação do primeiro módulo (SAI - Sistemas de Informações Ambulatoriais). Considerando apenas o módulo SIA, o volume mensal de dados para serem carregados no DW é de registros, que corresponde a aproximadamente a 211 Mb. Acrescentando as tabelas auxiliares, este número aproxima-se de 250 Mb. Isto corresponde a 2,9 Gb por ano. Os tempos para o processo de carga estão plenamente satisfatórios, mesmo sendo realizados os testes de performance em um ambiente muito inferior ao ambiente de produção. (Primeira fase = 2 Horas, Segunda fase = 10 Minutos)
27
DESAFIOS E AÇOES ADOTADAS
28
Conclusões
29
O estágio atual do projeto, mostra um resultado positivo que supera as expectativas iniciais e encoraja a implementação dos demais módulos. O projeto foi desenvolvido utilizando um conjunto de ferramentas robustas e adotando metodologia adequada para garantir o sucesso do empreendimento. Os fatores mensuráveis apresentaram números positivos. O volume de dados é razoável, comparado a outros projetos, e o desempenho dos procedimentos de carga está plenamente satisfatório. Os próximos passos, já em andamento, são a avaliação da satisfação dos usuários para o módulo desenvolvido e a implementação dos demais módulos.
30
Projeto de um Data Warehouse para a Saúde Pública
Contato:
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.