Banco de Dados II Prof. Dra. Carla Lanzotti

Slides:



Advertisements
Apresentações semelhantes
SISTEMAS DE SUPORTE À DECISÃO
Advertisements

Ferramentas OLAP: MicroStrategy OLAP Services
Introdução aos Sistemas de Informação Gerencial
Banco de Dados Prof. Antonio.
SIM- Sistemas de Informação de Marketing
Introdução a Banco de Dados
Introdução a Banco de Dados Prof.: Bruno Rafael de Oliveira Rodrigues.
Planejamento Estratégico de TI
Data Warehouse Tuning O que é um Data Warehouse? Índices Bitmap
SAD - SISTEMA DE APOIO À DECISÃO Prof. Wagner Andrade
Modelo Dimensional Professor Edson Emílio Scalabrin telefone: 0xx download:
Modelo de Dados Professores Edson E. Scalabrin Marcos A. H. Shmeil telefone: 0xx {scalabrin, download:
Apresentação SOE Assunto DATA WAREHOUSE Professor TANAKA
Mineração de Dados ou Descoberta de conhecimento em BDs
Aula 4 – Inteligência de Negócios (Business Intellingence)
Data Warehouse Um Data Warehouse é um armazém de dados, contendo dados extraídos do ambiente de produção da empresa. De acordo com INMON (1997), um.
PLANOS DE NEGÓCIOS ESTRUTURA E ESTRATÉGIA DE ELABORAÇÃO
Projeto Final - APGS Adriana P. de Medeiros
Disciplina: Sistemas de Informação para Planejamento Estratégico
FORMAS DE REPRESENTAÇÃO QUE SERVEM PARA DESCREVER AS ESTRUTURAS DAS INFORMAÇÕES CONTIDAS EM UM BD. Modelos de Dados.
Modelagem Dimensional do Data Warehouse
Data Mining, Data Warehousing e OLAP
Tomada de Decisão e Sistemas de Informação
Data Warehouse & Data Mining
Desenvolvimento de Sistemas OLAP
Desenvolvimento de Sistemas OLAP
Metolodogia de Desenvolvimento de Data Warehouse
Gerenciamento de Dados
DATA MART: UM APOIO À TOMADA DE DECISÕES NO SETOR DE QUALIDADE DE UMA EMPRESA DE FUNDIÇÃO Orientador: Prof. Ms. Leopoldo Edgardo Messenger Parada INTRODUÇÃO.
É um conjunto de registos dispostos numa estrutura regular que possibilita a reorganização dos mesmos e a produção de informação com a menor redundância.
Tuning Lílian Simão Oliveira.
Tecnologia da informação e estado
ACESSO A BASE DE DADOS.
Tecnologia da Informação
Business Intelligence:
Tecnologia da informação
4. Decisões Estruturadas 4.1. Data Warehouse (DW)
BI - Conceito É o conjunto de conceitos e metodologias que, fazendo uso de acontecimentos (fatos) e sistemas baseados nos mesmos, apóia a tomada de decisões.
Nomes: Alice C.Cazalli Allison Willian Everton Costa Denis A. Araujo
J OÃO C ARVALHO Data Warehouses. D EFINIÇÃO Um Data Warehouse é um sistema de computação utilizado para armazenar informações relativas às actividades.
Curso Técnico em Mineração
Volume de dados / filtragem – auxiliar na tomada de decisão Tempo x dinheiro / uso de informações Otimização e organização / investimento.
Banco de Dados Aplicado ao Desenvolvimento de Software
Kamila T. Lyra Karina C. S. Nishimura Thiago P. Colonhezi William S. Soares.
Capítulo 1 O marketing e a comunicação integrada de marketing (CIM)
Objetivos do Capítulo Explicar a importância da implementação de processos e tecnologias de gerenciamento de dados numa organização. Explicar as vantagens.
Sistemas de Informação
Campus de Caraguatatuba Aula 2: Introdução a Tecnologia de BD
ASSUNTO Facilitando a Tomada de Decisão em um Ambiente Móvel Mohamed A. Sharaf Panos K. Chrysanthis Felipe Menezes Cardoso COPIN – UFCG Banco de Dados.
Dados e Informações são considerados os maiores ativos de uma organização. Muito importantes para o correto planejamento, desenvolvimento e operação de.
Uma proposta para OLAP ontológica Adriana Ribeiro.
Gestão da Tecnologia da Informação
Sistemas de Informações em Recursos Humanos
Prof. Ana Martins – UCB Unidade 02 Aula 03
Data Warehouse Bruno Estevão Rosa Emerson Barbosa Gonçalves
Unidade IV Data Warehouse
Logística Integrada Engenharia de Produção
Banco de Dados Representa o arquivo físico de dados, armazenado em dispositivos periféricos, para consulta e atualização pelo usuário. Possui uma série.
Planejamento da Movimentação de Mercadorias: Estratégia Logística
B. I., DATAMINING e OLAP Henrique Liduario Joab Esequiel
Modelagem Dimensional do Data Warehouse
UCSal – Bacharelado em Informática
Janeiro/2013 Ceça Moraes Data Warehouse Janeiro/2013 Ceça Moraes
Data Warehouse Introdução ao Data Warehouse Introdução ao Data Warehouse Sistemas de Apoio à Decisão Sistemas de Apoio à Decisão Conceituação de Data Warehouse.
Fases Metodológicas do Planejamento Social
INTELIGÊNCIA EMPRESARIAL Aula 9 - Modelagem de Data Warehouse.
Controladoria.
INTELIGÊNCIA EMPRESARIAL Aula 8 - Metadados e Operações OLAP.
INTELIGÊNCIA EMPRESARIAL Aula 7 - Data Warehouse.
INTELIGÊNCIA EMPRESARIAL
Transcrição da apresentação:

Banco de Dados II Prof. Dra. Carla Lanzotti Data Warehouse Banco de Dados II Prof. Dra. Carla Lanzotti

Data Warehouse Representa uma base de dados capaz de integrar as informações de interesse da empresa, armazenadas em fontes externas ou em BD operacionais, para serem utilizadas nos sistemas de apoio à decisão, determinando padrões de comportamento, cenários e estratégias de negócio. Geralmente os dados não estão padronizados, e é necessário integrar antes de dar carga o DW. A utilização de DW nas empresas está relacionada à necessidade do domínio de informações estratégicas para garantir respostas e ações que assegurem a concorrência em um mercado competitivo e mutável. Esta possibilidade faz com que haja uma crescente aplicação de data warehouse em empresas de atividades distintas.

Data Warehouse Willian Inmon (1992): Data Warehouse é uma coleção de dados orientada por assunto, integrada, variante no tempo e não volátil, que tem por objetivo dar suporte aos processos de tomada de decisão.

Data Warehouse Orientada por assunto: os dados são organizados em temas específicos, importantes aos tomadores de decisão. A orientação por assunto nada mais é do que o direcionamento que se dá da visão que será disponibilizada, do negócio da empresa. Exemplo: Vendas, Produtos, Compras. Integrada: integra dados oriundos de sistemas distintos e os converte em dados para uma base única. Responsável por sincronizar os dados de todos os sistemas existentes na empresa, e colocá-los no mesmo padrão. Exemplo: Campo sexo, tamanho. Na fase de ETL (Extração, Transformação e Carga), todos os formatos são convertidos num único padrão, que é decidido com o usuário final e então carregado no DW.

Data Warehouse Variante no tempo: os dados são temporais, ou seja, referem-se a um determinado período ou intervalo de tempo, não sendo modificados. É uma característica ímpar no DW. Ele sempre retrata a situação que estamos analisando, em um determinado ponto do tempo, e com isso é possível traçar uma análise histórica e comparativa entre os fatos. Não volátil: após a carga inicial dos dados no ambiente de data warehouse, os dados não são atualizados, ou seja, não podem ser alterados durante a execução do banco de dados. Novas informações podem ser inseridas no banco de dados apenas com uma nova carga. No DW acontecem somente cargas de dados e consultas, ou seja, há somente selects e inserts, e não há updates.

Algumas diferenças DW BD Operacional Dados históricos - exibem tendência de comportamento Dados operacionais Dados integrados Dados dispersos Número Reduzido de Transações Grande número de Transações (frequentemente atualizado) Grande número de registros Número de registros variável Usuário: gerentes e executivos para tomada de decisões. Mas não há um padrão. Usuário: profissional operacional da empresa e está preocupado em executar as operações de modo eficiente. Analisa os dados Armazena dados

Algumas Aplicações Uma das maiores redes de varejo dos Estados Unidos descobriu, que a venda de fraldas descartáveis estava associada à de cerveja. Em geral, os compradores eram homens, que saíam à noite para comprar fraldas e aproveitavam para levar algumas latinhas para casa. Os produtos foram postos lado a lado. Resultado: a venda de fraldas e cervejas disparou. O banco Itaú, pioneiro no uso de DW no Brasil, costumava enviar mais de 1 milhão de malas diretas para todos os correntistas. No máximo 2% deles respondiam às promoções. Hoje, o banco tem armazenada toda a movimentação financeira de seus 3 milhões de clientes nos últimos 18 meses. A análise desses dados permite que cartas sejam enviadas apenas a quem tem maior chance de responder. A taxa de retorno subiu para 30%. A conta do correio foi reduzida a 1/5.

Algumas Aplicações • Uma empresa de telefonia detectou que quatro grandes clientes empresariais eram responsáveis por mais da metade das chamadas de manutenção. Um deles estava prestes a abandonar os serviços. A empresa fez reparos imediatos, convenceu o cliente a ficar e manteve uma receita anual de 150 milhões de dólares. • No Brasil, o Serpro, órgão responsável pelo processamento dos dados do governo federal, investiu 2 milhões no seu projeto de DW, desenvolvido com a Oracle. Só consolidou 5% de suas informações, possível fazer em cinco minutos cruzamentos de dados que antes demandavam quinze dias de trabalho.

Granularidade A granularidade em um DW determina o nível de detalhamento das informações armazenadas. Quanto mais detalhadas as informações, menor é a granularidade do DW. A granularidade afeta o volume de informações armazenadas e os tipos de consultas que podem ser respondidas aos usuários: Quanto menor o nível de granularidade, mais informações serão armazenadas e, portanto, maior o detalhamento possível das consultas dos usuários; Quanto maior o nível de granularidade, menos informações serão armazenadas, permitindo maior rapidez nas respostas das consultas, porém limitando ao detalhamento das consultas;

Exemplo de granularidade diferentes em um mesmo assunto

Granularidade A definição da granularidade de dados é a etapa mais importante do projeto de um DW, porque ela afeta profundamente o volume de dados que reside no DW e, ao mesmo tempo, afeta o tipo de consulta que pode ser atendida. Devem-se definir níveis adequados de granularidade, de acordo com as necessidades do usuário (MACHADO, 2000).

Abordagem Top down

Abordagem Botton-up

Modelo dimensional

Modelo dimensional A modelagem dimensional é a técnica utilizada para se ter uma visão multidimensional dos dados. DW representado por um modelo multidimensional de dados, apresentando as informações na forma de cubos de dados; A modelagem é utilizada para sumarizar e reestruturar os dados e apresentá-los em visões que suportem a análise de seus valores. O modelo multidimensional possui três elementos básicos: fatos, dimensão e medidas;

Fatos A tabela de fatos é a principal tabela de um modelo dimensional, na qual as medições numéricas de interesse da empresa estão armazenadas. A palavra fato é usada para representar uma medição de negócio, como quantidades, valores e indicadores.

Fatos Chaves de Dimensão Medidas de Quantidade

Dimensão A tabela de dimensão contém as descrições textuais do negócio. Seus atributos são fonte das restrições das consultas, agrupamento dos resultados, e cabeçalhos para relatórios. As dimensões são os aspectos pelos quais se pretende observar as métricas relativas ao processo que está sendo modelado.

Dimensão

Dimensões Contextos de um fato, ou seja, os elementos que participam da tabela fato; Tabelas periféricas com pouco volume de dados; Armazenam as descrições do negócio; Atributos: organizados em hierarquias Produto (Categoria  Marca  Descrição) Tempo (Ano  Mês  Dia_Do_Mês)

Aspectos temporais Presença da dimensão tempo é obrigatória: análise das tendências Diferentes granularidades: ano, mês, semana, dia, hora.

Exemplo: assunto “Vendas” Fato: venda; Dimensões: tempo (quando foi feita a venda), cliente, local, produto, vendedor; Medidas: quantidade de itens vendidos, valor total.

Exemplos de consultas típicas de OLAP: Quais os produtos mais bem vendidos no mês passado? Quais os 10 piores vendedores dos departamentos da filial X? Qual a média salarial dos funcionários de informática na região sul nos últimos cinco anos?

Esquema Estrela Esquema Snow Flake Técnicas de modelagem Esquema Estrela Esquema Snow Flake

Esquema Estrela (Star Scheme) É a estrutura básica de um modelo de dados multidimensional Composta por uma tabela central, denominada fato, e um conjunto de tabelas de dimensões, arranjadas ao redor da tabela central, formando uma estrela. A tabela de fatos é ligada às demais tabelas por múltiplas junções, enquanto as tabelas de dimensões se ligam à tabela central por uma única junção.

Esquema Estrela (Star Scheme) Dimensão Produto Tempo Revenda Cliente Fato Venda

Esquema Estrela (Star Scheme)

Esquema Floco de Neve (SnowFlake Scheme) Extensão do Esquema Estrela. Este modelo é o resultado da decomposição de uma ou mais dimensões que possuem hierarquias entre seus membros Neste esquema, uma dimensão pode ser composta por mais de uma tabela de dimensão.

Esquema Floco de Neve (SnowFlake Scheme)

Esquema Floco de Neve (SnowFlake Scheme)

Cubo de dados

Cubo Multidimensional Cubo de dados é uma estrutura multidimensional que expressa a forma na qual os tipos de informações se relacionam entre si. É formado pela tabela de fatos e pelas tabelas de dimensão que a circundam e representam possíveis formas de visualizar e consultar os dados. O cubo armazena todas as informações relacionadas a um determinado assunto, de maneira a permitir que sejam montadas várias combinações entre elas, resultando na extração de várias visões sobre o mesmo tema (HOKAMA et al. 2004, p. 49).

Cubo Multidimensional A visualização do modelo multidimensional é feita através de um cubo com cada uma das dimensões representadas como uma face. Várias dimensões podem ser usadas simultaneamente; Dados são manipulados mais rapidamente e facilmente (agregação em níveis de hierarquia); Uma unidade de dados é representada em cada célula do cubo, localizada através da interseção das dimensões.

Cubo Multidimensional

Cubo Multidimensional Uma unidade de dados é representada em cada célula do cubo, localizada através da interseção das dimensões.

Como representar as dimensões no cubo?

Qual o total de vendas do produto AAAA?

Qual o total de vendas do em 1999?

Qual o total de vendas do produto BBBB no ano de 1999 e na loja F2?

Operações que podem ser realizadas com o cubo Drill-down e roll-up: técnicas que possibilitam caminhar pela estrutura multidimensional (hierarquias), permitindo ver diferentes níveis de dados. Drill-down: aumenta o nível de detalhamento de uma dimensão; Roll-up: diminui o nível de detalhamento de uma dimensão;

Operações que podem ser realizadas com o cubo Slice e Dice: técnicas que fatiam o cubo, permitindo restringir a análise aos dados, sem inversão de eixos. “Semelhante” a cláusula WHERE de SQL. Slice: fatia o cubo

Operações que podem ser realizadas com o cubo Rotação Técnica que gira o cubo, permitindo ter diferentes visões dos dados