DATA WAREHOUSE Faculdades NDA – FACNET IV ENTI

Slides:



Advertisements
Apresentações semelhantes
Ferramentas OLAP: MicroStrategy OLAP Services
Advertisements

Ciclo de vida e organização do projeto
Resumo 1.1) Introdução 1.2) Abordagem Convencional de Arquivos
Data Warehouse / Data Marts / DataMining /OLAP
SISTEMAS DE INFORMAÇÃO
SAD - SISTEMA DE APOIO À DECISÃO Prof. Wagner Andrade
OLAP – Motivação e conceitos
Apresentação SOE Assunto DATA WAREHOUSE Professor TANAKA
Mineração de Dados ou Descoberta de conhecimento em BDs
Disciplina: Mineração de Dados
Aula 4 – Inteligência de Negócios (Business Intellingence)
Data Warehouse Um Data Warehouse é um armazém de dados, contendo dados extraídos do ambiente de produção da empresa. De acordo com INMON (1997), um.
Sistemas de Informação
Conjunto de ferramentas e técnicas que objetivam dar suporte à
ERP – CRM - BI.
Disciplina: Sistemas de Informação para Planejamento Estratégico
Curso Superior de Tecnologia: Sistemas para Internet
Data Mining, Data Warehousing e OLAP
Tomada de Decisão e Sistemas de Informação
Datawarehouse Um Ambiente Estruturado Por Michel Andrade de Souza
Desenvolvimento de Sistemas OLAP
Desenvolvimento de Sistemas OLAP
Metolodogia de Desenvolvimento de Data Warehouse
Gerenciamento de Dados
DATA MART: UM APOIO À TOMADA DE DECISÕES NO SETOR DE QUALIDADE DE UMA EMPRESA DE FUNDIÇÃO Orientador: Prof. Ms. Leopoldo Edgardo Messenger Parada INTRODUÇÃO.
Sociedade da Informação: Ambiente de TI nas Organizações
É um conjunto de registos dispostos numa estrutura regular que possibilita a reorganização dos mesmos e a produção de informação com a menor redundância.
Thales Alberto Priscila Tavares Kali Fauaze Igor Daniel William Martin.
Tecnologia da informação e estado
Tecnologia da Informação
Business Intelligence:
Tecnologia da informação
BI - Conceito É o conjunto de conceitos e metodologias que, fazendo uso de acontecimentos (fatos) e sistemas baseados nos mesmos, apóia a tomada de decisões.
Data Mining: Conceitos e Técnicas
Nomes: Alice C.Cazalli Allison Willian Everton Costa Denis A. Araujo
J OÃO C ARVALHO Data Warehouses. D EFINIÇÃO Um Data Warehouse é um sistema de computação utilizado para armazenar informações relativas às actividades.
A abordagem de banco de dados para gerenciamento de dados
Banco de Dados Aplicado ao Desenvolvimento de Software
Kamila T. Lyra Karina C. S. Nishimura Thiago P. Colonhezi William S. Soares.
Objetivos do Capítulo Explicar a importância da implementação de processos e tecnologias de gerenciamento de dados numa organização. Explicar as vantagens.
ASSUNTO Facilitando a Tomada de Decisão em um Ambiente Móvel Mohamed A. Sharaf Panos K. Chrysanthis Felipe Menezes Cardoso COPIN – UFCG Banco de Dados.
Uma proposta para OLAP ontológica Adriana Ribeiro.
Gestão da Tecnologia da Informação
Sistemas de Informações em Recursos Humanos
Tipos de sistema de informação Prof. Dr. Henrique Freitas & Equipe Tipos de sistema de informação Prof. Dr. Henrique Freitas & Equipe Baseado em: Introdução.
Prof. Ana Martins – UCB Unidade 02 Aula 03
Data Warehouse Bruno Estevão Rosa Emerson Barbosa Gonçalves
Automação Comercial Faculdade Estácio Radial Prof. Paulo Alipio Alves de Oliveira 2010.
OLAP - On-Line Analytical Processing (Processamento Analítico On-Line)
Capítulo 9: SAD orientado a Modelo
Unidade IV Data Warehouse
HAC 1 MD - junho/2008 Tecnologias de suporte à Mineração de Dados Gerenciamento de dados Data Warehouse OLAP Arquiteturas Visualização Sistemas de Suporte.
TIPOS DE SISTEMAS DE INFORMAÇÃO BASEADOS NA WEB
Banco de Dados Representa o arquivo físico de dados, armazenado em dispositivos periféricos, para consulta e atualização pelo usuário. Possui uma série.
Tecnologia da informação Aula 13 – Business Intelligence (BI)
TECNOLOGIA DA INFORMAÇÃO
B. I., DATAMINING e OLAP Henrique Liduario Joab Esequiel
Disciplina: Inteligência Artificial
Modelagem Dimensional do Data Warehouse
Janeiro/2013 Ceça Moraes Data Warehouse Janeiro/2013 Ceça Moraes
Data Warehouse Introdução ao Data Warehouse Introdução ao Data Warehouse Sistemas de Apoio à Decisão Sistemas de Apoio à Decisão Conceituação de Data Warehouse.
Objetivos do Capítulo Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel.
INTELIGÊNCIA EMPRESARIAL Aula 9 - Modelagem de Data Warehouse.
Sistema de Informações Qualidade e Armazenamento das Informações O impacto das mudanças e as Tendências em SIs Papéis Fundamentais de SI na Empresa.
INTELIGÊNCIA EMPRESARIAL Aula 6 – Componentes dos Sistemas de Apoio à Decisão.
INTELIGÊNCIA EMPRESARIAL Aula 8 - Metadados e Operações OLAP.
INTELIGÊNCIA EMPRESARIAL Aula 7 - Data Warehouse.
INTELIGÊNCIA EMPRESARIAL
CONCEITO DE DADOS E INFORMAÇÕES DADOS – SÃO COMPOSTOS POR FATOS BÁSICOS. EX. NOME E QUANTIDADE DE HORAS TRABALHADAS, NÚMERO DE PEÇAS PRODUZIDAS OU EM ESTOQUE.
Transcrição da apresentação:

DATA WAREHOUSE Faculdades NDA – FACNET IV ENTI Professor MSc Ly Freitas Filho Site: www.lyfreitas.com E-mail: ly@lyfreitas.com

Tendências: tecnologias wireless interactive media web analytics gestão do conhecimento business intelligence info-entertainment web commerce web warehousing content management virtual reality gestão da cadeia de valor customer relationship management technomarketing ensino à distância modelos preditivos data mining Introdução

Gestão de canais & delivery Business Intelligence: quadro de referência Lojas Quiosques Vendedores Call Center Web TV Operações Manutenção Supervisão Logística Warehousing Vendas Faturamento Behavior score Planejamento de produtos Categorias Mix produtos Segmentação Fidelização Promoções Personalização Atendimento a clientes Gestão de canais & delivery Controladoria Indicadores Melhoria de processos Alocação de capital Análise risco Gestão de processos produtivos Gestão de clientes Gestão de recursos Gestão de informação e conhecimento Engenharia Planejamento Pré-vendas Legal/jurídica Análise de tendências Adequação logística Data mining Melhoria de processos Knowledge discovery Gestão conteúdo Gestão de projetos Gestão acervo digital Gestão de sistemas Introdução/BI

Gestão de canais & delivery Business Intelligence: quadro de referência Gestão de catálogos Merchandising ERP ECR SCM OLTPs BI CRM DBM Data mining Web analytics Gestão de canais & delivery BI OLAP Data mining Gestão de processos produtivos Gestão de clientes Gestão de recursos Gestão de informação e conhecimento OLTPs DW & ETL Acervo visual Gestão metadados etc. Introdução/BI

influenciaram as vendas? Para o sucesso do negócio é necessário transformar os dados em informação e conhecimento Usuários Qual o preço do produto X? Qual o volume de vendas? Dados (Operacionais) Sistemas Operacionais Informação (Tático) Data Analysis Valor das vendas por produto, loja e mês. Valor das vendas no mês homólogo. Sistemas de Suporte à Decisão Data Mining Conhecimento (Estratégico) Que fatores influenciaram as vendas? Quais as tendêcnias mais significativas? Introdução/SSD

Sistemas Estratégicos Sistemas Suporte a Decisão Gestão da Informação Gestão Documental/Imagem Gestão do Conhecimento Sistemas de Informações Introdução/SSD

Evolução dos Sistemas de Informação OLTP - Processo de transações On-Line: automatizar os processos, melhorar o desempenho e confiabilidade SAD - Sistemas de apoio a decisão: sistemas que ajudam decisores a tomar decisões em situações onde o julgamento humano é uma contribuição importante ao processo de resolução, mas existe uma limitação humana para processar informações DW SAD OLTP Introdução/SI

O Ciclo P-T-A Publicar Efetuar transações Analisar Gerenciar conteúdo Gerenciar eficazmente o merchandising para cada cliente Publicar Efetuar transações Atrair e reter Atendimento, compras, entrega, cobrança Responder às preferências dos clientes Analisar Acompanhar e entender preferências Introdução/PTA

A arquitetura de infonegócios Portal de acesso e distribuição Análise e exploração Bases analíticas Extração e integração de dados Fontes de dados OLTP Legado Data Warehouse ou ODS Data Mart Externo Ciclo PTA Introdução/Negócios

As necessidades de informação estratégica e consolidada sempre existiram... Arquivos simples (poucos Mb) Linguagens Imperativas Análise dos Dados Pedida aos programadores Equivalente a nova aplicação Forma típica: impressões em papel BDs Cliente/Servidor (muitos Gb) Ferramentas Específicas Análise dos Dados Diretamente pelos gestores Forma típica: usando interfaces tipo “point-and-click” 1970 1980 1990 2000 BDs Centralizadas (muitos Mb) Linguagens Declarativas e Folhas de Cálculo Análise dos Dados Pedida a analistas e assessores Usando “perguntas relacionais” Forma típica: listas na tela ou folhas de cálculo Introdução/Historico

Anos 2000 o domínio do acesso Internet. A importância da informação SGBDs + Internet (muitos Tb) Ferramentas Específicas Análise dos Dados “Informação na ponta dos dedos” Tecnologia “push” Forma típica: Browser Web “Ferramentas de interrogação e folhas de cálculo têm-se mostrado extremamente limitadas na forma como a informação pode ser agregada, apresentada e analisada” E.F. Codd “A lacuna mais importante das bases de dados relacionais tem sido a incapacidade de consolidar, apresentar e analisar informação sobre múltiplas dimensões” E.F. Codd “O maior desafio das empresas de teconologias de informação é aprender a construir Bases de Informação e não Bases de Dados“ Peter Drucker “Informação sobre dinheiro está a tornar-se mais importante que o dinheiro propriamente dito.” John Reed, President of Citicorp/Citibank Introdução/Historico

Data Warehouse É um conjunto de dados íntegros, integrados e históricos, não voláteis, organizados por assunto que servirão de base aos sistemas de suporte à decisão – SSD ou sistemas de apoio à decisão - SAD. Introdução/Definição

Data Warehouse a fonte de consulta de um empreendimento (Kimball et al, 1998) coleção de dados orientada a assunto, integrada, não volátil e variável em relação ao tempo, que tem por objetivo dar apoio aos processos de tomada de decisão (Inmon, 1997) Introdução/Definição

Data Warehouse uma base de dados analítica que dá apoio a processos decisórios + recursos de acesso intuitivos (Poe et al, 1998) um processo, e não um produto, para a montagem e administração de dados provenientes de várias fontes com o propósito de obter uma visão simples e detalhada de parte de todo o negócio (Gardner, 1998) Introdução/Definição

Quando organizar os dados? Grande volume de dados, dificuldade no acesso Resultados do mesmo negócio apresentados com valores diferentes por áreas diferentes Dificuldade em localizar os dados relevantes ao negócio Pouca confiabilidade nos dados apresentados. Tempo de resposta muito ruim, quando se tenta pesquisar uma informação no banco de dados.

um Data Warehouse é uma ARQUITETURA... não é um produto ou tecnologia Um Data Warehouse é uma arquitetura de sistemas com um processo complexo de construção um Data Warehouse é uma ARQUITETURA... não é um produto ou tecnologia um Data Warehouse CONSTRÓI-SE... não se compra um Data Warehouse é um processo COMPLEXO... não um simples projeto “Primeiro surgiu a arquitetura, a seguir a metodologia depois (e apenas depois) surgiram as ferramentas” Introdução/Definição

Sistemas Operacionais Data Warehouse a informação estratégica e consolidada do seu negócio Permite a análise consolidada dos dados da organização. Estrutura a informação de forma multidimensional e hierárquica orientada aos conceitos de negócio Flexibilidade na construção de análises, permitindo navegação nos dados e rápidas mudanças de perspectiva Interface avançada com os utilizadores. Ferramentas de acesso da nova geração com capacidade de disponibilização de informação via Web, Wap e Voz Data Warehouse Sistemas Operacionais Introdução/Definição

Sist. Operacionais Data Warehouse Fontes internas internas + externas Foco no negócio: uma das diferenças entre Sistemas Operacionais e Sistemas de Suporte à Decisão Sist. Operacionais Data Warehouse Fontes internas internas + externas Organização aplicação (processo) tema (negócio) Natureza val. correntes val. históricos Otimização normalização redundância Dimensão BD Mb a Gb Gb a Tb Tipo Utilização burocrática/repetitiva analítica/exploratórias Tempos Resposta instantâneos minutos, horas Previsão Carga possível difícil Atualização atômica, alta freq. blocos, baixa freq. Introdução/Definição

No cerne desse novo ambiente "projetado" está a percepção de que há fundamentalmente duas espécies de dados: Dados Primitivos e Dados Derivados. Introdução/Definição

Dados Primitivos Dados Derivados São dados detalhados utilizados na condução das operações cotidianas da Organização. Dados Derivados São dados resumidos ou calculados de forma a atender às necessidades da área estratégica da Organização. Introdução/Definição

Data Warehouse X Data Mart Data Warehouse – contém todas as informações da companhia, vindas de múltiplas fontes de dados operacionais, dispostas de forma integrada e consolidada. Data Marts – contém um subconjunto dos dados corporativos para atender um departamento ou uma unidade de negócio. dw/dm

Datawarehouse X Datamart Recursos Humanos Produção Finanças Marketing Vendas Datamart dw/dm

Datawarehouse X Datamart Qual fazer primeiro???? dw/dm

Data Mart (DM) Data Warehouse (DW) Data Warehouse de pequena capacidade usado para atender a uma unidade específica de negócios projeto piloto atender necessidades imediatas de um Processo restrições (custo, tempo, conhecimento tecnológico) desempenho aprendizagem, aceitação Data Warehouse (corporativo) integração de seus data marts requer um planejamento global que norteie o desenvolvimento de DMs individuais integração em sistemas operacionais Data Warehouse (DW) dw/dm

Aplicações de Utilização Amigável & Reporting A arquitetura de referência de um Data Warehouse: processos de ETC, Metadata, Data Mart e Reporting. FONTES Aplicações de Utilização Amigável & Reporting Administração das estruturas de informação Sistemas Operacionais Meta-Data Sistemas Operacionais Limpeza, Extração, Transformação e Carregamento Data Mart Data Warehouse Soluções de Análise Multidimensional Externas Aplicações Verticais + Data Mining Arquitetura

Granularidade É o nível de detalhe ou de resumo contido nas unidades de dados existentes no DW É a unidade de medida mínima de um modelo de DW . É a combinação de uma linha da tabela de fatos, associada a uma linha de uma ou mais dimensões . Arquitetura/Definições

Agregação São registros sumarizados logicamente redundantes com os dados Granulares do DW Finalidades: (melhorar o tempo de reposta as consultas; reduzir o tempo de processamento; reduzir espaço de armazenamento Arquitetura/Definições

Metadados O metadado representa a definição dos dados contidos no DW, é através dele, que o usuário fica sabendo como as entidades estão representadas, de onde surgem, como foram transformadas e como podem ser utilizadas. O metadado corresponde a um catálogo e dependendo de sua estrutura poderá conter várias informações. Arquitetura/Definições

Metadados No ambiente de DW, os metadados armazenam informações sobre todo ciclo de vida: De onde o dado veio? Como foi calculado? Quando foi realizado o processo de ETL? Estatísticas de utilização. Mudanças na política de negócios. e muito mais... Arquitetura/Definições

Metadados Dados sobre dados”. Provêm informações sobre a estrutura de dados e as relações entre estas dentro ou entre bancos de dados. São também informações mantidas a cerca do DW em lugar das providas pelo DW Arquitetura/Definições

Integrado Os dados fonte de sistemas OLTP são modificados e convertidos para um estado uniforme de modo a permitir a carga no DW. Arquitetura/Definições

Não Volátil Os dados após serem extraídos, transformados e transportados para o DW estão disponíveis aos usuários somente para consulta Arquitetura/Definições

Variável em Relação ao Tempo Os DW devem armazenar dados por um período de tempo. O elemento tempo é fundamental Arquitetura/Definições

Topologias Arquitetura/Topologias

Topologias Arquitetura/Topologias

Sistema Fonte Um sistema operacional de registros cuja função é capturar as transações de negócios, as vezes são chamados de sistemas legados . Arquitetura/ETL

Importância dos Dados Corporativos Com a globalização, as corporações estão cada vez mais necessitando de informações confiáveis em um tempo hábil para tomada de decisões. A implantação de um sistema de suporte à decisão passa a ser um diferencial em uma corporação, pois oferece condições para que os níveis gerenciais definam os rumos da companhia com base em dados consistentes. Arquitetura/ETL

Data Staging Area Área de transição dos dados (dados estagiários) e definição dos processos para limpeza, transporte, combinação, integração, melhoramento e preparação dos dados para uso no Data Warehouse Arquitetura/ETL

Presentation Server Máquina física alvo no qual os dados do Data Warehouse estão organizados e armazenados para consulta direta pelos usuários finais, servidores de relatórios e outras aplicações. Arquitetura/ETL

Modelo Dimensional Uma metodologia específica para modelar dados, uma alternativa ao modelo ER, contém a mesma informação que o modelo ER, mas o pacote de dados está em um formato simétrico cujo objetivo é facilitar a consulta, melhorar a performance e flexível a mudanças. Arquitetura/ETL

Modelo Relacional Arquitetura/ETL/Modelagem

Dados Corporativos Arquitetura/ETL/Modelagem

Perguntar Arquitetura/ETL/Modelagem

Esquema Estrela Arquitetura/ETL/Modelagem

Modelagem Dimensional Arquitetura/ETL/Modelagem

Esquema Floco de Neve Desdobra-se as tabelas de dimensões removendo alguns campos para tabelas separadas conectando as mesmas com a tabela original através de chaves artificiais Geralmente não é recomendado num ambiente de DW Snowflacking - esquema onde aplica-se a normalização O excesso de chaves baixa a eficiência da consulta Arquitetura/ETL/Modelagem

Esquema Floco de Neve Arquitetura/ETL/Modelagem

Comparar e Apresentar Cálculos simples no conjunto de resultados Arquitetura/ETL/Modelagem

Mineração de Dados (Data Mining) Entender Slice and Dice Consultas Visualizações Mineração de Dados (Data Mining) Características: Buscar padrões novos, úteis e compreensíveis em grandes volumes de dados; Padrão = estrutura de relacionamento entre atributos e seus valores; Dados detalhados; Auxiliar os decisores a ampliar seu espaço de investigação de hipóteses; Técnicas de mineração (classes de problemas); Tipo de análise mais complexa (analista de dados). Arquitetura/ETL/Modelagem

On-Line Analytical Processing (OLAP) designação genérica para as atividades de acesso e apresentação de dados provenientes de um DW baseado em representação multidimensional dos dados Tecnologias: MOLAP ROLAP HOLAP: MOLAP + ROLAP DOLAP: Desktop OLAP Arquitetura/OLAP

OLAP Services Hierarquias Múltiplas e não equilibradas Particionamento de dados Junção virtual de cubos Monitoração de utilização Membros calculados Múltiplas estratégias de armazenamento MOLAP, ROLAP, HOLAP, DOLAP Particionamento – Cada cubo tem pelo menos uma partição que conterá os dados do cubo. Uma partição única é automaticamente criada quando o cubo é definido. O particionamento ajuda a separar um único cubo lógico em diferentes partições físicas, que darão um ganho em flexibilidade de armazenamento de dados e performance no tempo de resposta das queries. Virtual cubes – permite que você crie uma nova forma de análise dos dados multidimensionais sem ter a necessidade de usar espaço adicional para armazenagem física dos dados. Monitoração de utilização – Através do Usage Analisys, permite que o administrador acesse relatórios na tela e verifique o comportamento da utilização do sistema. Membros Calculados – criar indicadores que não existiam anteriormente no banco de dados e não foram gerados durante o processo de transformação. MOLAP – usa uma estrutura multidimensional para conter as agregações e uma cópia do banco de dados. O uso da técnica MOLAP nos dá um melhor tempo de resposta, dependendo apenas da quantidade e da estruturação das agregações dos cubos. Em geral, MOLAP é mais indicado para cubos com uso frequente, onde o usuário tem necessidade de respostas rápidas. ROLAP – usa tabelas no DW relacional para armazenas as agregações do cubo. Diferente do MOLAP, o ROLAP não armazena uma cópia dos dados, acessando a tabela fato original quando necessário para responder as queries. O tempo de resposta de uma estratégia ROLAP, geralmente é menor em relação ao MOLAP e ao HOLAP. Um uso típico do ROLAP é para grandes datasets, que não são acessados com muita frequencia; ex.: dados históricos de anos anteriores HOLAP – a estratégia de armazenagem combina atributos de ambos, MOLAP e ROLAP. A agregação dos dados são armazenados em estrutura MOLAP e os dados estruturais são deixados no banco relacional. Para queries que acessam dados consolidados, o HOLAP é equivalente ao MOLAP. Queries que acessam os dados estruturais, Deve buscar os mesmos no banco relacional e o tempo de resposta não será tão rápido quanto o que aconteceu com a querie acessada numa estrutura MOLAP. Os cubos armazenados na estratégia HOLAP são menores do que os equivalentes armazenados na estrutura MOLAP, e tem tempo de resposta mais rápido do que os cubos ROLAP. O HOLAP é indicado para cubos que requerem tempo de resposta rápido para dados agregados em um grande volume de dados. Arquitetura/OLAP

Recuperação e Exploração de Dados Duas Camadas Arquitetura/OLAP

Recuperação e Exploração de Dados Três Camadas - ROLAP Arquitetura/OLAP

Recuperação e Exploração de Dados Três Camadas - MOLAP Arquitetura/OLAP

Aplicações para o Usuário Final Uma coleção de ferramentas que consulta, analiza e apresenta informações desejáveis para apoiar uma necessidade de negócio. São ferramentas para acesso aos dados, planilhas, pacotes gráficos e uma interface amigável. Arquitetura/Usuário

Arquitetura/Usuário

Arquitetura/Usuário

Ferramentas para interpretar um mundo complexo Arquitetura/Usuário

Ferramentas para interpretar um mundo complexo Arquitetura/Usuário

Ferramentas para interpretar um mundo complexo Arquitetura/Usuário

Ferramentas para interpretar um mundo complexo Arquitetura/Usuário

Mostrando produtos e serviços de maneira visual, interativa e com conteúdo rico Arquitetura/Usuário

Conclusões Data Warehouse é uma base de dados voltada a apoio à decisão o processo de alimentação do DW é complexo ferramentas de acesso devem levar em conta tipo de usuário e funcionalidades desejadas produtos comerciais reaproveitam muitas funcionalidades originalmente projetadas para apoio a criação e gestão de sistemas operacionais inclusão de novas funcionalidades para processamento OLAP mineração é na prática pouco usada em contextos de data warehouse Conclusões

Algumas Tendências metodologias de desenvolvimento apoio à manutenção materialização de versões metadados sistematização do processo de alimentação do DW e maior integração com os sistemas fonte mais recursos para usuário final, considerando seu perfil tecnologias para otimização de desempenho e armazenamento distribuição uso da Web Algumas Tendências

Investimento Softwares Ferramenta ETL Ferramenta BD Ferramenta OLAP Ferramentas Usuário Final Investimento Softwares

OLAP Services Servidor OLAP distribuído com o SQL Server Exemplo /Microsoft

DATA WAREHOUSE Faculdades NDA – FACNET IV ENTI Professor MSc Ly Freitas Filho Site: www.lyfreitas.com E-mail: ly@lyfreitas.com