A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Data Warehouse Tuning O que é um Data Warehouse? O que é um Data Warehouse? Índices Bitmap Índices Bitmap Índices Multidimensionais Índices Multidimensionais.

Apresentações semelhantes


Apresentação em tema: "Data Warehouse Tuning O que é um Data Warehouse? O que é um Data Warehouse? Índices Bitmap Índices Bitmap Índices Multidimensionais Índices Multidimensionais."— Transcrição da apresentação:

1 Data Warehouse Tuning O que é um Data Warehouse? O que é um Data Warehouse? Índices Bitmap Índices Bitmap Índices Multidimensionais Índices Multidimensionais Vistas Materializadas Vistas Materializadas Índices Join Índices Join

2 Um Data Warehouse é......uma fonte única e integrada de informação de suporte à decisão que é formada recolhendo dados de múltiplas fontes, quer internas ou externas à organização, e que transforma e sumariza essa informação para permitir o melhoramento da tomada de decisões....uma fonte única e integrada de informação de suporte à decisão que é formada recolhendo dados de múltiplas fontes, quer internas ou externas à organização, e que transforma e sumariza essa informação para permitir o melhoramento da tomada de decisões.

3 Motivação Objectivo – Acumular informação para produzir indicadores de negócio que permitam tomar decisões. Finalidade - Possibilitar aos utilizadores um acesso fácil a grandes quantidades de informação, sendo este acesso normalmente, suportado por ferramentas especializadas em análise de dados.

4 Contexto (em comparação com os Sistemas Operacionais) Introduzir uma nova encomenda Introduzir uma nova encomenda Obter as 10 encomendas de maior valor que não foram entregues Obter as 10 encomendas de maior valor que não foram entregues

5 Cubo de Dados Formato lógico que permite modelar e visualizar dados sob várias perspectivas Formato lógico que permite modelar e visualizar dados sob várias perspectivas É constituído por: É constituído por: Tabelas de dimensões Tabelas de dimensões Tabela de factos Tabela de factos Representam o tema central do cubo Representam o tema central do cubo Consiste em medidas numéricas pelas quais queremos analisar as relações existentes entre as dimensões Consiste em medidas numéricas pelas quais queremos analisar as relações existentes entre as dimensões

6 Índices Bitmap Constroiem-se para uma coluna de cada vez. Quando usar? Tabelas que não têm ou têm poucos Inserts / Updates são boas candidatas.

7 Índices Bitmap Adequam-se melhor a múltiplas condições sobre vários atributos que tenham cardinalidade baixa(poucas valores únicos). Adequam-se melhor a múltiplas condições sobre vários atributos que tenham cardinalidade baixa(poucas valores únicos).

8 Índices Bitmap Constrói-se um vector bi-dimensional AxB sendo A os valores distintos que a coluna indexada tem e B o número de registos da tabela. Constrói-se um vector bi-dimensional AxB sendo A os valores distintos que a coluna indexada tem e B o número de registos da tabela. Cada índice desse vector corresponde a um campo da tabela e está a 1 se a linha que estamos a considerar possui esse valor na coluna indexada. Cada índice desse vector corresponde a um campo da tabela e está a 1 se a linha que estamos a considerar possui esse valor na coluna indexada.

9 Índices Multidimensionais – Bitmap Operações de comparação, join e agregados são mais eficientes porque se reduzem a operações de aritmética binária

10 Índices Multidimensionais – R-Tree

11

12 É uma árvore com pesos (height-balanced tree) com índices registo nos nós folha que contêm apontadores para os objectos de dados. É uma árvore com pesos (height-balanced tree) com índices registo nos nós folha que contêm apontadores para os objectos de dados. Os nós folha têm entradas da forma (I, id_tuplo), sendo I o rectângulo mais pequeno que contêm, espacialmente, o objecto de dados n-dimensional representado pelo tuplo indicado. Os nós folha têm entradas da forma (I, id_tuplo), sendo I o rectângulo mais pequeno que contêm, espacialmente, o objecto de dados n-dimensional representado pelo tuplo indicado. Nos nós não-folha as entradas são da forma (I, ponteiro_filho) onde I é o rectângulo mais pequeno que cobre todos os rectângulos do nó filho. Nos nós não-folha as entradas são da forma (I, ponteiro_filho) onde I é o rectângulo mais pequeno que cobre todos os rectângulos do nó filho.

13 Vistas Materializadas create materialized view vendorOutstanding build immediate refresh complete enable query rewrite as select orders.vendor, sum(orders.quantity*item.price) from orders,item where orders.itemnum = item.itemnum group by orders.vendor;

14 Vistas Materializadas Basicamente, o que é feito é prá-calcular a soma das quantidades a multiplicar pelo preço. Basicamente, o que é feito é prá-calcular a soma das quantidades a multiplicar pelo preço. É criada uma tabela real como resultado da materialização da vista e esta tabela pode ser indexada. É criada uma tabela real como resultado da materialização da vista e esta tabela pode ser indexada.

15 Vistas Materializadas Existe um compromisso entre rapidez no processamento de querys e manutenção das vistas. Existe um compromisso entre rapidez no processamento de querys e manutenção das vistas. Quando é necessário manter um grande número de vistas, temos um problema. Quando é necessário manter um grande número de vistas, temos um problema. Uma vista pode ser computada a partir de outra. Uma vista pode ser computada a partir de outra.

16 Join Índices Quando temos índices separados sobre colunas referenciadas numa query. Quando temos índices separados sobre colunas referenciadas numa query. Para optimizar o processamento podemos fazer a junção dos índices, combinando-os para encontrar só os registos que satisfazem a query Para optimizar o processamento podemos fazer a junção dos índices, combinando-os para encontrar só os registos que satisfazem a query Identificam tuplos de uma forma pouco dispendiosa Identificam tuplos de uma forma pouco dispendiosa

17 Bibliografia articles/shasha1 articles/shasha1 Database Tuning, Shasha & Bonnet – Capítulo 10 Database Tuning, Shasha & Bonnet – Capítulo Apontamentos de Sistemas de Apoio à Decisão Apontamentos de Sistemas de Apoio à Decisão


Carregar ppt "Data Warehouse Tuning O que é um Data Warehouse? O que é um Data Warehouse? Índices Bitmap Índices Bitmap Índices Multidimensionais Índices Multidimensionais."

Apresentações semelhantes


Anúncios Google