Carregar apresentação
A apresentação está carregando. Por favor, espere
PublicouAlice Serpe Alterado mais de 9 anos atrás
1
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 1
2
2 IN1008 – Projeto Conceitual de BD Modelagem Conceitual para Bases de Dados Multidimensionais Por: Daniel Menezes Cardoso dmc2@cin.ufpe.br
3
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 3 Roteiro Motivação Conceitos básicos Objetivo Características do modelo Estudo de caso Modelos propostos / estado da arte Referências
4
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 4 Motivação Capacidade de representar informação de forma abstrata e independente da implementação é crucial Do design à operação de um sistema de informação Mas... Qual a relevância disso no nosso contexto??? Complexidade Dificuldades com gerenciamento e implementação Possibilidade de erros
5
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 5 Motivação Estamos estudando modelagem conceitual... ...que serve justamente para nos dar o ferramental de que precisamos. Contexto Aplicações multidimensionais De Data warehouse OLAP São complexas! ...Mas, o que são mesmo???
6
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 6 Conceitos básicos Data warehouse Uma coleção de dados integrada e orientada a um tema, desenhada para suportar tomada de decisão. OLAP Online Analytical Processing Análise multidimensional
7
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 7 Motivação Voltando... Precisamos fazer modelagem nesse contexto ...Podemos usar o que já sabemos!!! Tradicionalmente, se usa um modelo relacional Problemas: Um modelo conceitual tradicional como o ER não é expressivo o suficiente para as características multidimensionais Tradicionalmente, a modelagem de aplicações multidimensionais acaba se aproximando da implementação correspondente (modelo lógico) Necessidade de se preocupar com detalhes tediosos referentes à distribuição da informação entre as várias estruturas de armazenamento
8
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 8 Motivação Modelos para dados multidimensionais foram propostos Não há ainda consenso ou terminologia comum
9
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 9 Objetivo Avaliar os requisitos que um modelo de dados conceitual para aplicações multidimensionais deve ter Partindo de um estudo de caso Conhecer um modelo proposto de referência com base nos requisitos necessários Características Exemplos com base no estudo de caso Estado da Arte – Avaliar os modelos propostos existentes
10
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 10 Conceitos básicos Modelo de dados “Data modeling is an art” (R. Hull) “As opções de cores do artista” Conceitual Conceitos do mundo real / contexto, não o modo de representação Conceitual Multidimensional Recursos para representar o objetivo final de uma data warehouse: suporte à análise de dados para tomada de decisão. 2 conceitos que devem ser suportados: Fact Dimension
11
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 11 Conceitos básicos Fact “Entidade de uma aplicação que é o alvo de uma análise para tomada de decisão” Representado por um cubo de dados Dimension Perspectiva sob a qual os facts podem ser analisados. Exemplo Fact: Uma venda. Dimensions: Local, tipo de produto, hora.
12
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 12 Conceitos básicos Uma representação (esquema estrela): O que vocês acham?
13
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 13 Conceitos básicos Representação por tabelas e relacionamentos Esquema lógico cheio de detalhes de implementação Os aspectos conceituais sobre como os dados são analisados são difíceis de inferir Nesse contexto, mesmo no nível conceitual a representação dos dados é influenciada fortemente pela forma como os usuários precisam visualizar a informação!!! Quais seriam os usos/vantagens de uma representação conceitual multidimensional aqui???
14
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 14 Conceitos básicos Em resumo: Visão mais focada no contexto / conteúdo Facilita análise de queries Documentação Entendimento por não-especialistas
15
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 15 Características do modelo Um modelo conceitual multidimensional deve suportar a descrição de dados fatuais de acordo com as dimensions - perspectivas sob as quais eles podem ser analisados. Para o nosso exemplo: Organizar dados em dimensions Produtos comercializados, Lojas vendendo os produtos, Dias em que há vendas Organizar dimensions em Levels Produtos -> Marcas, Categorias Dias -> Meses, Anos
16
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 16 Características do modelo Esquema:
17
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 17 Estudo de caso Toys4All Objetivo: Entender o impacto das promoções nas vendas. Influência na venda de produtos e qual o retorno das promoções? Objetivo: Analisar o processo de estocagem Medir o inventário mensalmente para cada produto? Dimensions: Product, Store, Warehouse, Time, and Promotion. Product dimension Levels: Item (produtos como Disney’s Dinosaur and Duplo Pooh) Descriptions podem ser nome e código, por exemplo Product-line (Mattel’s Disney, Lego Duplo), Brand (Mattel e Lego), Category (Personagens populares e Blocos), Department (Action Figures e Blocos). Time dimension Day, month, quarter, year, and season. Um membro do level Day pode ser: Feb 27, 2001. Membros do level Day podem ser agrupados a membros do level month e também a membros de season (Carnival).
18
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 18 Estudo de caso
19
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 19 Estudo de caso Fact: Daily sale (venda diária) Pode ser analisado quanto ao dia da venda, o produto vendido, a loja e a promoção aplicada no dia. Measurements: quantidade vendida, receita, custo. Um cubo de dados Sales pode ser usado para descrever a venda diária de itens em cada loja. Exemplo: on Feb 27, 2001 the store Colosseum has sold 2 pieces of Duplo Pooh, applying a Carnival 2001 Promotion, for a corresponding gross income of 19.98 Euros against a cost of 14.98 Euros. Quanto ao Warehouse (estoque): Quantidade em estoque, no final do mês, para cada produto por estoque. Outras informações: Quantidade vendida durante o mês Valor a preço de custo da quantidade em estoque.
20
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 20 Estudo de caso
21
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 21 Características do modelo Conforme alguns autores*, são características básicas de um modelo multidimensional: Separação explícita entre estrutura e conteúdo Básico dos modelos conceituais. Permite definir um esquema. Noção explícita de Dimensions e Data Cube Hierarquia explícita de Levels Refletir as possibilidades de agrupamento dos dados. Hierarquia múltipla em cada Dimension Com vários caminhos possíveis. Ordem parcial em MD (setas) Suporte a atributos de Levels Suporte a “measure sets” Conjunto de valores para um mesmo Fact. Tratamento simétrico de Dimensions e Measures * Pedersen; Blaschka et al.)
22
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 22 Características do modelo Outras características recomendadas: Suporte a semântica de agregação Identificar agregações que não fazem sentido no contexto para o usuário. Por exemplo, somar os níveis de estoque de produtos diferentes pode não fazer sentido, mas a média pode. Suporte para agregações “non-standard” Por exemplo, “non-covering hierarchies” Cidade -> Estado Suporte a dados temporais Mudanças no tempo Qual o impacto da mudança de categoria de um produto nas vendas?
23
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 23 Modelos propostos / Estado da arte Os modelos para data warehousing podem ser classificados em 3 grupos: Cube models Multidimensional models Statistical models
24
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 24 Modelos propostos / Estado da arte Cube Models Tratam os dados como cubos n-dimensionais Possuem noção de fact, measure e dimension O modelo não permite inferir os níveis de agregação (levels) por dimension. Exemplos: Star Scheme, Snowflake Scheme Maioria dos modelos comerciais ROLAP, MOLAP
25
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 25 Modelos propostos / Estado da arte Multidimensional Models Possuem os níveis de agregação (levels) por dimension explicitamente definidos no modelo. Os modelos representam Dimensions de forma bem diferentes Modelos extenderam modelos conceituais tradicionais (como o M-ER) ou basearam-se em paradigmas tradicionais, como OO. Maior parte dos modelos foi definida tendo como alvo casos de estudo específicos, como eficiência, queries temporais, etc.
26
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 26 Modelos propostos / Estado da arte Exemplo do M-ER:
27
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 27 Modelos propostos / Estado da arte Statistical models Têm muito em comum com multidimensional models Conceitos distintos, porém com grande sobreposição Foco em dados estatísticos versus data warehouse Exemplos: STORM, Mefisto
28
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 28 Conclusão Modelos conceituais multidimensionais trazem vantagens na modelagem conceitual de data warehouses Existem algumas alternativas, mas não há um padrão. Muito trabalho a ser feito na área para sofisticar os modelos.
29
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 29 Referências RICCARDO TORLONE. Multidimensional Databases, Maurizio Rafanelli Ed. R. Agrawal, A. Gupta, and S. Sarawagi. Modeling multidimensional databases. C. Batini, S. Ceri, and S. Navathe. Conceptual Database Design: an Entity-Relationship Approach. Benjamin/Cummings, 1992 M. Blaschka, C. Sapia, G. Höfling, and B. Dinter. Finding your way through multidimensional data models. S. Chaudhuri and U. Dayal. An overview of Data Warehousing and OLAP technology. E. Franconi and U Sattler. A data warehouse conceptual data model for multidimensional aggregation. A. O. Mendelzon. Data warehousing and OLAP: a research-oriented bibliography. Carsten Sapia, Markus Blaschka, Gabriele Höfling, Barbara Dinter. Extending the E/R Model for the Multidimensional Paradigm Matteo Golfarelli, Dario Maio, Stefano Rizzi. Conceptual Design of Data Warehouses from E/R Schemes.
30
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo 30
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.