Data Warehouse Tuning O que é um Data Warehouse? Índices Bitmap

Slides:



Advertisements
Apresentações semelhantes
Álgebra Relacional Marcelo Mendes Manaus
Advertisements

Banco de Dados Prof. Antonio.
Engenharia de Software
SQL Avançado Continuação
SQL Structured Query Language (continuação)
Evolução dos SGBD’s (2ª Parte).
SQL Structured Query Language (continuação)
Tabela de Banco de Dados Relacional
SISTEMAS DE INFORMAÇÃO
SISTEMAS DE INFORMAÇÃO Sistemas de Bancos de Dados 2º Semestre – 2010 Pedro Antonio Galvão Junior Fone:
Sistemas de Apoio à Decisão (SAD) Helena Galhardas
Linguagens relacionais
1 LEIC, LBD 2002, Gabriel David, Ana Paiva, Luis Paulo Reis Geração da base de dados lógica n A ferramenta de transformação do modelo EA para o modelo.
Trabalho de Desenvolvimento
Daniel J. Abadi – Yale - New Haven, USA Samuel R. Madden – MIT – Cambrigde, USA Nabil Hachem – Avantgarde Consulting – Shrewbury, USA SIGMOD '08 Apresentado.
SQL – Noções Gerais Por Márcia Jacyntha N. Rodrigues Lucena
SCC Bancos de Dados e Suas Aplicações
Otimização de Consultas em Data Warehouse (DW)
Estrutura de Dados Espaciais
Data Warehouse Um Data Warehouse é um armazém de dados, contendo dados extraídos do ambiente de produção da empresa. De acordo com INMON (1997), um.
Query Tuning Lílian Simão Oliveira.
Colégio da Imaculada Curso Técnico em Informática Álgebra Relacional
Comandos de SQL Excel VBA II.
Geração de Planos de Execução Planos para Consultas Aninhadas
Metolodogia de Desenvolvimento de Data Warehouse
BANCO DE DADOS UNIVERSIDADE ESTADUAL DE SANTA CRUZ
Sociedade da Informação: Ambiente de TI nas Organizações
Design Patterns / Acesso ao banco de dados (java.sql)
Tuning Lílian Simão Oliveira.
Tecnologia da Informação
INTRODUÇÃO ÁS BASES DE DADOS
Business Intelligence:
BI - Conceito É o conjunto de conceitos e metodologias que, fazendo uso de acontecimentos (fatos) e sistemas baseados nos mesmos, apóia a tomada de decisões.
sintonia de banco de dados
Algoritmos de Processamento e Otimização de Consultas
VIEW - VISÕES Professor Esp. Diego André Sant’Ana
Conceitos Programas Programação Linguagens de Programação SQL.
A abordagem de banco de dados para gerenciamento de dados
REVISÃO Comandos SQL - DML SELECT * FROM ?.
PRINCÍPIOS BÁSICOS DOS SISTEMAS DE INFORMAÇÃO
Linguagem de Manipulação de Dados. 2 Conteúdos Introdução ao SQL Comando SELECT – Extracção de Dados  Pesquisas Simples  Restrições na pesquisa de dados.
ASSUNTO Facilitando a Tomada de Decisão em um Ambiente Móvel Mohamed A. Sharaf Panos K. Chrysanthis Felipe Menezes Cardoso COPIN – UFCG Banco de Dados.
Uma proposta para OLAP ontológica Adriana Ribeiro.
Estatísticas SQL Server 2012/2014 September 2014.
AULA DE DÚVIDAS 9 de Abril de Especialização  Simplifica-se quando:  especialização é disjunta e  especialização é total e  não há relações.
Prof. Ana Martins – UCB Unidade 02 Aula 03
Linguagem SQL Prof. Juliano.
IEC Banco de Dados I Aula 04 – SQL (II) Turmas: Sistemas de Informação Professora: André Luiz da Costa Carvalho
Operações para entrada de dados –Compilação de dados codificação de dados geográficos de uma forma conveniente para o sistema; incluem a digitalização,
AOBD 07/08 Mini-Projecto 2 Soluções. 1) Considere que existem três relações R1=(A,B,C), R2=(C,D) e R3=(D,E) com chaves primárias A, C e D, respectivamente.
Optimização - 1 Optimização de perguntas 1 Processamento de selecções 2 Processamento de junções 3 Manipulação algébrica.
Modelo de base de dados relacional
1 Desenvolvimento de uma base de dados Realidade Modelo conceptual (e.g. Modelo Entidade-Associação) Modelo lógico (e.g. Modelo Relacional)
1 Structured Query Language (SQL) 4 SQL é uma linguagem normalizada (ANSI) para consultas e actualizações de bases de dados relacionais.
1 Introdução à Manipulação de Dados SQL – Structured Query Language  Tabela = Relação  DDL – Data Definition Language  Sub-conjunto do SQL que suporta.
PostgreSQL Índices Nuno Campos N.º Nuno Campos - N.º Índice Introdução Tipos de Índices – B-Tree – R-Tree – Hash – GiST Classes de Operadores.
Operações para entrada de dados –Compilação de dados codificação de dados geográficos de uma forma conveniente para o sistema; incluem a digitalização,
RDBMS Tuning Pedro da Silva. Indice 1. Schema Tuning 1.1. Vertical Partitioning 1.1. Vertical Partitioning 1.2. Tunnig Denormalization 1.2. Tunnig Denormalization.
Sistemas de Gestão de Bases de Dados Educação e Formação de Adultos (EFA) Operador de Informática Arcozelo 2009/2010 Curso Co-Financiado por:
Daniel Paulo Introdução Neste capítulo trataremos a relação entre tabelas e FILEGROUPS, bem como a alocação interna de dados.
Modelagem Dimensional do Data Warehouse
UCSal – Bacharelado em Informática
Data Warehouse Introdução ao Data Warehouse Introdução ao Data Warehouse Sistemas de Apoio à Decisão Sistemas de Apoio à Decisão Conceituação de Data Warehouse.
INTELIGÊNCIA EMPRESARIAL Aula 9 - Modelagem de Data Warehouse.
INTELIGÊNCIA EMPRESARIAL Aula 8 - Metadados e Operações OLAP.
José Antônio da Cunha CEFET - RN José Antônio -
Programação para Internet Aula 12 SQL (Comandos de Consulta ao BD)
CMMI Capability Maturity Model Integration
Análise de Dados Espaciais: Baseadas na Localização Flávia F. Feitosa Disciplina BH1408 – Cartografia e Geoprocessamento para o Planejamento Territorial.
1 MEI, ARMD 2003, Gabriel David Armazéns de Dados Notas sobre Oracle Warehouse Builder Gabriel David
Transcrição da apresentação:

Data Warehouse Tuning O que é um Data Warehouse? Índices Bitmap Índices Multidimensionais Vistas Materializadas Índices Join

Um Data Warehouse é... ...uma fonte única e integrada de informação de suporte à decisão que é formada recolhendo dados de múltiplas fontes, quer internas ou externas à organização, e que transforma e sumariza essa informação para permitir o melhoramento da tomada de decisões.

Motivação Objectivo – Acumular informação para produzir indicadores de negócio que permitam tomar decisões. Finalidade - Possibilitar aos utilizadores um acesso fácil a grandes quantidades de informação, sendo este acesso normalmente, suportado por ferramentas especializadas em análise de dados.

Contexto (em comparação com os Sistemas Operacionais) Introduzir uma nova encomenda Obter as 10 encomendas de maior valor que não foram entregues

Cubo de Dados Formato lógico que permite modelar e visualizar dados sob várias perspectivas É constituído por: Tabelas de dimensões Tabela de factos Representam o tema central do cubo Consiste em medidas numéricas pelas quais queremos analisar as relações existentes entre as dimensões

Índices Bitmap Constroiem-se para uma coluna de cada vez. Quando usar? Tabelas que não têm ou têm poucos Inserts / Updates são boas candidatas.

Índices Bitmap Adequam-se melhor a múltiplas condições sobre vários atributos que tenham cardinalidade baixa(poucas valores únicos).

Índices Bitmap Constrói-se um vector bi-dimensional AxB sendo A os valores distintos que a coluna indexada tem e B o número de registos da tabela. Cada índice desse vector corresponde a um campo da tabela e está a 1 se a linha que estamos a considerar possui esse valor na coluna indexada.

Índices Multidimensionais – Bitmap Operações de comparação, join e agregados são mais eficientes porque se reduzem a operações de aritmética binária

Índices Multidimensionais – R-Tree

Índices Multidimensionais – R-Tree

Índices Multidimensionais – R-Tree É uma árvore com pesos (height-balanced tree) com índices registo nos nós folha que contêm apontadores para os objectos de dados. Os nós folha têm entradas da forma (I, id_tuplo), sendo I o rectângulo mais pequeno que contêm, espacialmente, o objecto de dados n-dimensional representado pelo tuplo indicado. Nos nós não-folha as entradas são da forma (I, ponteiro_filho) onde I é o rectângulo mais pequeno que cobre todos os rectângulos do nó filho.

Vistas Materializadas create materialized view vendorOutstanding build immediate refresh complete enable query rewrite as select orders.vendor, sum(orders.quantity*item.price) from orders,item where orders.itemnum = item.itemnum group by orders.vendor;

Vistas Materializadas Basicamente, o que é feito é prá-calcular a soma das quantidades a multiplicar pelo preço. É criada uma tabela real como resultado da materialização da vista e esta tabela pode ser indexada.

Vistas Materializadas Existe um compromisso entre rapidez no processamento de querys e manutenção das vistas. Quando é necessário manter um grande número de vistas, temos um problema. Uma vista pode ser computada a partir de outra.

Join Índices Quando temos índices separados sobre colunas referenciadas numa query. Para optimizar o processamento podemos fazer a junção dos índices, combinando-os para encontrar só os registos que satisfazem a query Identificam tuplos de uma forma pouco dispendiosa

Bibliografia www.dbazine.com/datawarehouse/dw-articles/shasha1 Database Tuning, Shasha & Bonnet – Capítulo 10 www.akadia.com/services/ora_materialized_views www.linhadecodigo.com.br/ Apontamentos de Sistemas de Apoio à Decisão