OLAP Abmar Barros
Agenda OLAP x OLTP Análise multidimensional Cubo OLAP Como funciona a mágica? View-selection Ferramentas
OLAP x OLTP OLTP OLAP Online Transactional Processing Trabalha com registros individuais ou em pequeno número Operações de leitura e escrita OLAP Online Analytical Processing Trabalha com dados em massa Operações são geralmente read-only
OLAP x OLTP Porque online? Apesar de lidar com uma enorme quantidade de dados, o sistema deve responder rápido o suficiente para permitir uma exploração interativa dos dados.
Análise multidimensional Year 2000 2001 Growth Product Dollar sales Unit sales Total $7,073 2,693 $7,636 3,008 8% 12% — Books $2,753 824 $3,331 966 21% 17% —— Fiction $1,341 424 $1,202 380 -10% —— Non-fiction $1,412 400 $2,129 586 51% 47% — Magazines $2,426 766 -12% -7% — Greetings cards $1,567 1,045 $1,879 1,276 20% 22%
Análise multidimensional Dimensões (Dimensions) Formam as colunas e linhas Ex.: Year e Product Hierarquia de dimensões (Ex.: Books, Magazines) Medidas (Measures) Formam os valores Ex.: Dollar sales e Unit sales
Cubo OLAP
Como funciona a mágica? Para consultas complexas, cubos OLAP conseguem responder em 0,1% do tempo da mesma consulta em OLTP. O mais importante mecanismo em OLAP é a agregação.
Como funciona a mágica? Agregações são construídas a partir das tabelas de fatos: As granularidades de dimensões específicas são alteradas. Os valores são agregados sobre essas dimensões. A combinação de todas as possíveis agregações contém as respostas pra qualquer consulta, diretamente dos dados.
Como funciona a mágica? Assim, um número muito grande de agregações deve ser computado, o que é computacionalmente inviável. Normalmente uma parte das agregações são pré-calculadas, outras são calculadas por demanda. O problema de decidir quais agregações pré-calcular é conhecido como view-selection.
View-selection O objetivo do view-selection é minimizar o tempo médio de resposta das consultas. View-selection é NP-completo. Abordagens já exploradas: Algoritmos gulosos Busca aleatória (Randomized search) Algoritmos genéticos Busca A*
Ferramentas Comerciais Open-Source Microsoft Analysis Services Oracle Essbase IBM Cognos TM1 Open-Source Mondrian OLAP Server Jedox Palo