The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009
Roteiro Definição de Data Warehouse Objetivos de um DW Componentes de um DW Modelagem dimensional Passos para a criação de um modelo dimensional Modelagem do estudo de caso de vendas a varejo
Definição de Data Warehouse Segundo, Ralph Kimball: Data warehouse é um conjunto de todos os data marts da organização, onde a informação é sempre armazenada em um modelo dimensional.
Objetivos de um Data Warehouse O DW deve: permitir o acesso fácil às informações de uma organização Apresentar as informações de forma consistente Ser adaptável e flexível a mudanças Proteger as informações de forma segura Oferecer dados que suportem a tomada de decisões Ser aceito pela comunidade de negócio
Componentes de um Data Warehouse
Componentes de Um Data Warehouse
Componentes de Um Data Warehouse
Componentes de Um Data Warehouse
Componentes de Um Data Warehouse
Terminologia da Modelagem Dimensional Tabela Fato 3 Tipos de Fatos Aditivos Semi-aditivos Não-aditivo Grão
Dimensional Modeling Vocabulary Tabela Dimensional
Exemplo de Modelo Dimensional
Mitos sobre a Modelagem Dimensional Modelos dimensionais e data marts são apenas para dados resumidos Modelos dimensionais e data marts são soluções departamentais e não corporativas Modelos dimensionais e data marts não são escalonáveis Modelos dimensionais e data marts são apropriados apenas quando existe um padrão de utilização previsível Modelos dimensionais e os data marts não podem ser integrados e, portanto, levam a soluções isoladas
Processo de Criação Dimensional em 4 Etapas Selecione o processo do negócio Declare o grão do processo do negócio Escolha as dimensões que aplicam a cada linha da tabela fato Identifique os fatos numéricos que preencherão cada linha da tabela de fatos
Estudo de Caso sobre o Varejo Empresa do ramo de alimentos 100 supermercados em 5 estados Todas as lojas têm os mesmos deptos. 60.000 produtos individuais, as SKU´s 55.000 SKU têm código de barras, os UPC´s 5.000 SKU são internas à rede (produtos a granel) Coleta de dados no POS e na entrada de mercadorias
Modelando esse Caso Selecione o processo do negócio Declare o grão POS de vendas a varejo Declare o grão Item individual de venda no POS Escolha as dimensões Loja, Produto, Data, Promoção, nro. de transação POS Identifique os fatos .....
Analisando os Fatos Fatos Aditivos Fato NAO-Aditivo Margem de lucro Porcentagens e proporções são não-aditivas. É possível calculá-las armazenando numerador e denominador, e depois a proporção das somas
Dimensão Data
Dimensão Produto
Dimensão Loja
Dimensão Promoção Divisão em 4 dimensões Prós Contras Mais intelegíveis para a comunidade de negócios Administração mais simples Contras Tamanho praticamente o mesmo nos dois casos Possível ver como os 4 aspectos são correlacionados
Extensão do Modelo
Normalização das Dimensões X Snowflaking
Excesso de Dimensões X
Outras Considerações Dimensão de Degeneração – nro. da transação no POS Chaves substitutas Sem “inteligência” Possivelmente menor que chave operacional Registram condições para dimensões em que não há valor operacional Seu uso evita complicações com as chaves operacionais reutilizadas Ao usá-las, evite a composição de chaves unindo chaves de uma dimensão