Desenvolvimento de Sistemas OLAP Cláudia Tomaz
Modelagem Multidimensional É uma técnica de concepção e visualização de um modelo de dados de um conjunto de medidas que descrevem aspectos comuns de negócios. Formado por três elementos básicos Fatos Dimensões Medidas
Modelagem Multidimensional Fatos É uma coleção de itens de dados , composta de dados de medidas e de contexto. Cada fato representa um item, uma transação ou um evento de negócio e é utilizado para analisar o processo de negócio de uma empresa. Tudo aquilo que reflete a evolução dos negócios do dia a dia de uma organização. A característica básica de um fato é que ele é representado por valores numéricos.
Modelagem Multidimensional Dimensões Conceitualmente são os elementos que participam de um fato, assuntos de negócio. São as possíveis formas de visualizar os dados, ou seja, são os “por” dos dados: “por mês”, “por país”, “por produto”, “por região”, etc. As dimensões determinam o contexto de um assunto de negócios, por exemplo, um banco de dados que, que analise vendas de produtos...
Modelagem Multidimensional Dimensões As dimensões deste banco comumente serão: Tempo, Localização Clientes, Vendedores Cenários (realizado, projetado) Dimensões normalmente não possuem atributos numéricos, pois são somente descritivas e classificatórias dos elementos que participam de um fato.
Modelagem Multidimensional Membros de uma dimensão Uma dimensão pode conter muitos membros. Um membro de dimensão é um nome diferente utilizado para determinar a posição de um item de dado. Por exemplo, todas as ocorrências de ano, trimestre e mês fazem a dimensão tempo e todas as cidades, estados e regiões fazem a dimensão geográfica.
Modelagem Multidimensional Membros de uma dimensão Hierarquia de uma dimensão é uma classificação de dados dentro de uma dimensão. Nós arranjamos os membros de uma dimensão em uma ou mais hierarquias. Hierarquia 1 Hierarquia 2 Ano Semestre Bimestre Trimestre Mês Dia
Modelagem Multidimensional Medidas Medidas são os atributos numéricos que representam um fato, a performance de um indicador de negócios relativo às dimensões que participam deste fato. Os números atuais são denominados de variáveis. Por exemplo, medidas são o valor em reais das vendas, o número de unidades de produtos vendidas, a quantidade em estoque, o custo de venda, etc. Uma medida é determinada pela combinação das dimensões que participam de um fato, e estão localizadas como atributos de um fato.
Modelagem Multidimensional Pontos de Decisão – segundo Kimball – nove pontos fundamentais no projeto da estrutura de um Datawarehouse: Os processos e, por consequência, a identidade das tabelas de fatos; A granularidade das tabelas de fatos; As dimensões de cada tabela de fatos; Os fatos, incluindo fatos pré-calculados; Os atributos das dimensões; Como acompanhar mudanças graduais em dimensões; As agregações, dimensões heterogêneas, minidimensões e outra decisões de projeto físico; Duração histórica do banco de dados do Datawarehouse; A frequência com que se dão a extração e carga para do Datawarehouse. Kimball recomenda que estas definições se façam na ordem citada. (Metodologia Top Down)
Modelagem Multidimensional O caminho mais popular para visualização de um modelo multidimensional é o desenho de um cubo.
Modelagem Multidimensional
Modelagem Multidimensional Modelo Star ou Estrela É a estrutura básica de um modelo de dados multidimensional Sua composição típica possui uma grande entidade central denominada fato (fact table) e um conjunto de entidades menores denominadas dimensões (dimension tables), arranjadas ao redor dessa entidade central, formando uma estrela, como mostra a figura a seguir.
Modelagem Multidimensional Dimensão Tempo Dimensão Região Dimensão Cliente Fatos de Vendas Dimensão Vendedor Dimensão Produto
Modelagem Multidimensional FATOS: Na figura, o centro da estrela é o fato Vendas, e ao seu redor dispostas estão as dimensões que participam deste fato: vendedor, cliente, produto, região e tempo. O que são fatos? É tudo aquilo que pode ser representado por um valor aditivo, ou melhor, por meio de valores numéricos. Este conjunto de valores numéricos é denominado de métricas ou medidas. Outra característica importante, é que os fatos são evolutivos. Mudam suas medidas com o tempo, podendo ser sempre questionado sobre essa evolução ao longo de um espaço de tempo. “ O consumo de bebidas alcoólicas aumentou no Brasil de 1998 a 1999” “Os índices de criminalidade aumentaram no ano atual de 50% sobre os últimos anos”. Participação Performance Evolução Índice de
Modelagem Multidimensional DIMENSÕES: O que são Dimensões? São os elementos, as entidades que participam de algum fato, o “por” dos dados. Vamos apresentar algumas situações envolvendo a aplicação dos quatro pontos cardeais de um fato. Quando? Onde? Compra Quem? O que?
Modelagem Multidimensional DIMENSÕES: Toda ocorrência de uma compra envolve no mínimo quatro elementos participantes: Quando a compra foi realizada; Onde foi realizada a compra; Quem realizou a compra; O que foi comprado. Logo, temos quatro dimensões envolvidas neste fato.
Modelagem Multidimensional DIMENSÕES: Exemplos: Quanto comprou em setembro de 1999 nas lojas Tamancão de Ouro, o comprador Felipe, em produtos de calçados? Temos neste caso uma análise de quatro dimensões: Onde: Tamancão de Ouro Quando: Setembro de 1999 Quem: Felipe O que: Calçados
Modelagem Multidimensional DIMENSÕES: A Dimensão Tempo Possui importância acentuada em todo modelo de dados de um Data Mart. É a única dimensão presente em qualquer tipo de Data Mart. A dimensão tempo estabelece os limites das chamadas janelas de tempo de existência de dados. É uma hierarquia de espaços de tempo. Por exemplo Ano, trimestre, mês, semana, dia.
Modelagem Multidimensional
Modelagem Multidimensional