Uso de Ontologias em Data Warehousing

Slides:



Advertisements
Apresentações semelhantes
MER – Modelo de Entidade Relacionamento
Advertisements

Engenharia de Software
Curso: Banco de Dados I Análise de Sistemas PUC Campinas
Modelagem Organizacional
Resumo 1.1) Introdução 1.2) Abordagem Convencional de Arquivos
Processo inclui: Todas as principais atividades do processo
Engenharia de Software
Modelo Entidade-Relacionamento
Maurício Edgar Stivanello
PROBLEMAS E DECISÕES EMPRESARIAIS
1 Data Warehouse Professor Professor Edson Emílio Scalabrin telefone: 0xx download:
Teste em Esquemas de Dados Maria Cláudia Figueiredo Pereira Emer Universidade Federal do Paraná Departamento de Informática Seminário.
Mapeamento Objeto Relacional
Gerenciamento de Configuração
Professora: Aline Vasconcelos
Felipe Dias Maria Fernanda
Data Warehouse Um Data Warehouse é um armazém de dados, contendo dados extraídos do ambiente de produção da empresa. De acordo com INMON (1997), um.
Sistemas de Informação
Aspectos Avançados em Engenharia de Software Aula 3 Fernanda Campos
Interoperabilidade semântica no domínio de Engenharia de Software
Prof. Alfredo Parteli Gomes
SQL Server 2012 Introdução a Modelagem de Dados
Introdução a Banco de Dados com exercícios de aplicação
Análise Estruturada.
Autoria de Aplicações Hipermídia Daniel Schwabe Departamento de Informática PUC-Rio [ Parte 6 ]
Metolodogia de Desenvolvimento de Data Warehouse
Sociedade da Informação: Ambiente de TI nas Organizações
PETER ANTONY RAUSCH JOYCE MARTINS
Business Intelligence:
Fase de Elaboração: Fluxo de Análise Análise de Sistemas de Software Prof. Rodrigo Ribeiro.
BI - Conceito É o conjunto de conceitos e metodologias que, fazendo uso de acontecimentos (fatos) e sistemas baseados nos mesmos, apóia a tomada de decisões.
IF696 - Integração de Dados e DW
1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva
Data Mining: Conceitos e Técnicas
Sistemas Especialistas
Vânia Maria P. Vidal, José Maria Monteiro, Luís Eufrasio T. Neto
Análise de Sistemas de Informação
A abordagem de banco de dados para gerenciamento de dados
Objetivos Apresentar de forma breve a Metodologia de Modelagem Orientada a Objetos (OMT). A partir de um modelo de objetos de um sistema de informação.
Banco de Dados Aplicado ao Desenvolvimento de Software
Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.
Disciplina : Tópicos Avançados em Inteligência Artificial Simbólica Professores: Dr. Fred Freitas / Dra. Bernadette Farias Aluno: Clovis Holanda Introdução.
Objetivos do Capítulo Explicar a importância da implementação de processos e tecnologias de gerenciamento de dados numa organização. Explicar as vantagens.
Campus de Caraguatatuba Aula 2: Introdução a Tecnologia de BD
Engenharia de Software
Introdução a Banco de Dados Aula 04
METODOLOGIA, MÉTODOS E FERRAMENTAS
Uma proposta para OLAP ontológica Adriana Ribeiro.
Sistemas de Informações em Recursos Humanos
Desenvolvimento de Software Dirigido a Modelos
Data Warehouse Bruno Estevão Rosa Emerson Barbosa Gonçalves
Candidato: Lucas Santos de Oliveira Orientador: Marco Aurélio Gerosa
HAC 1 MD - junho/2008 Tecnologias de suporte à Mineração de Dados Gerenciamento de dados Data Warehouse OLAP Arquiteturas Visualização Sistemas de Suporte.
Banco de Dados Representa o arquivo físico de dados, armazenado em dispositivos periféricos, para consulta e atualização pelo usuário. Possui uma série.
Projeto de Banco de Dados
Banco de dados e tipos de programação
1 Database Systems, 8 th Edition Sistemas de Banco de Dados: Projeto, Implementação e gestão Oitava Edição Capítulo 2 Modelo de Dados.
Janeiro/2013 Ceça Moraes Data Warehouse Janeiro/2013 Ceça Moraes
1 Database Systems, 8 th Edition Sistemas de Banco de Dados: Projeto, Implementação e gestão Oitava Edição Capítulo 2 Modelo de Dados.
Detecção de tráfego Skype na Web através de Redes Neurais Artigo Original: Freire, P. E., Ziviani, A., and Salles, R. M. (2008). Detecting skype flows.
Banco de Dados Distribuídos Sílvia Cristina de Matos Soares
Integração Semântica: uma pesquisa sobre abordagens baseadas em ontologias Túlio Lages
Copyright © 2011 Ramez Elmasri and Shamkant Navathe slide 1 Tópicos  Introdução  Um exemplo  Características da abordagem de banco de dados  Vantagens.
INTEGRAÇÃO DE DADOS: UMA PERSPECTIVA TEÓRICA Guilherme P. K. Caminha Disciplina: IF696.
Alan Mateus Vieira Neves Mestrando em Ciência da Computação Prof. Dr. Ricardo Massa Orientador Um framework estratégico para tomada de decisão em ambiente.
INTELIGÊNCIA EMPRESARIAL Aula 9 - Modelagem de Data Warehouse.
INTELIGÊNCIA EMPRESARIAL Aula 8 - Metadados e Operações OLAP.
Modelagem de Dados Aula 3.
Data Warehousing & Business Intelligence PPGIA/BSI – DEINFO – UFRPE Ceça Moraes
Modelagem de Banco de Dados: Conceitos
Transcrição da apresentação:

Uso de Ontologias em Data Warehousing Alexandra Vitorio de Morais Silva av@cin.ufpe.br 18/04/2017

Roteiro Motivação Data Warehousing Engenharia de ontologias em DW Uso de ontologias durante projeto de ETL Referências 18/04/2017

Motivação Automação de processos de data warehousing Conhecimento semântico das fontes de dados 18/04/2017

Data Warehousing Coleção de tecnologias de suporte à decisão: Consolidação de dados provenientes de fontes heterogêneas (EIS, fontes externas) Data warehouse: coleção de dados orientada a assunto, integrada, variante no tempo e não volátil (Inmon) Suporte a OLAP (On-Line Analitycal Processing) Modelagem de dados multidimensional 18/04/2017

Data Warehousing Processo se dá em duas fases: ETL: extração, transformação e carga Visões multidimensionais dos dados como entrada para ferramentas de front end de análises gerenciais, mineração de dados e geração de relatórios 18/04/2017

Arquitetura de Data Warehousing Fonte: [CHAUDHURI, 1997] 18/04/2017

Engenharia de ontologia para DW Proposta por [CAO, 2006] Construção de uma estrutura ontológica para o domínio específico Definição do comprometimento ontológico e relacionamentos semânticos Especificação formal da estrutura ontológica (profile) em lógica de descrição Agregação, transformação, mapeamento e consulta intra e inter domínios 18/04/2017

Estrutura ontológica em Warehousing Transformar o domínio do problema e o sistema de resolução do problema (DW) em uma ontologia de domínio (DO) e uma ontologia de resolução do problema (PSO) DO: vocabulário de conceitos e relacionamentos Ex: 18/04/2017

Estrutura ontológica em Warehousing PSO - definir ontologias para: Tarefas Métodos Lógica de negócio Recursos (bases de dados, bases de conhecimento, metadados) 18/04/2017

Comprometimento ontológico e relacionamentos semânticos Acordo de utilização de uma ontologia compartilhada de forma coerente e consistente OC = (C,O,R,P,S), onde C é um conjunto de conceitos de um domínio específico O é um conjunto de ontologias candidatas R é um conjunto de relacionamentos entre ci e oj P são as propriedade de cardinalidade S são medidas de similaridade entre ci e oj 18/04/2017

Especificação formal e Agregação, Transformação, Mapeamento e Consultas Estrutura ontológica definida mais precisamente em lógica de descrição Definição de mecanismos de agregação, transformação, mapeamento e consulta inter e intra domínios Ex: uso de regras semânticas 18/04/2017

Projeto de ETL Análise da estrutura e conteúdo das fontes de dados e mapeamento em um modelo de dados comum Em geral, a identificação das transformações necessárias durante o processo de ETL é feita manualmente, guiada pela semântica das fontes de dados e pelas restrições e requisitos da aplicação 18/04/2017

Projeto de ETL utilizando ontologias [SKOUTAS, 2006] propõe a utilização de ontologias para a definição da seqüência de atividades de ETL Especificação formal e explícita da semântica dos esquemas das fontes de dados e do esquema do DW Automatização do processo 18/04/2017

Projeto de ETL utilizando ontologias Construção de uma ontologia baseada nos esquemas das fontes de dados e do DW Derivação automática das transformações necessárias para o processo 18/04/2017

Abordagens de integração de informação baseada em ontologia ([WACHE, 2001]) Ontologia única: integração simples, mas difícil de criar e manter Múltiplas ontologias: mais flexível, no entanto comparação torna-se difícil Abordagem híbrida: cada fonte é descrita em uma ontologia utilizando termos de um vocabulário compartilhado [SKOUTAS, 2006]: vocabulário contendo termos primitivos do domínio fontes de dados descritas independentemente a partir dos termos comuns 18/04/2017

Construção da ontologia do domínio Representação formal e explícita, permitindo uso de técnicas de raciocínio Baseada em um vocabulário comum Linguagem de representação: OWL DL classes, hierarquias, propriedades de domínio e restrições de intervalo, equivalência entre classes e disjunção Mapeamento entre a ontologia e os esquemas das fontes 18/04/2017

Resumo das características de OWL utilizadas Fonte: [SKOUTAS, 2006] 18/04/2017

Cenário As fontes de dados contém informações sobre lojas e produtos; cada produto é vendido em uma loja. Para cada produto, são fornecidos a quantidade disponível e o preço. A informação sobre a quantidade não está disponível para alguns produtos. Há dois tipos de produto: software e hardware. Em DS1 essa distinção é feita pelo atributo “type”, enquanto em DS2 duas relações distintas são utilizadas. Os preços são armazenados em euro e dólar em DS1 e DS2, respectivamente. Produtos em DS1 possuem uma check constraint para que o preço mínimo seja 200 euros. Cada loja tem nome e endereço, que inclui cidade, rua e número. Em DS1 essa informação está no atributo “location”. No DW, o atributo “street” contém a rua e o número da loja. Assume-se também que as lojas estão localizadas em uma dessas cidades: Paris, Roma ou Atenas. No DW, a relação “products” deve conter apenas produtos de software, com os preços variando de 500 a 1500 euros, a quantidade é conhecida e a cidade é Roma ou Atenas. Finalmente, o id nas relações do DW são surrogate keys que substituem as chaves primárias originais das fontes. 18/04/2017

Anotação das fontes de dados Vocabulário de termos em comum Mapeamento da fonte DS1 18/04/2017

Anotação das fontes de dados Anotação da fonte DS1 18/04/2017

Construção da Ontologia A ontologia da aplicação é composta por: Um conjunto de classes primitivas que correspondem aos conceitos especificados, formatos de representação e intervalos ou conjunto de valores Um conjunto de propriedades correspondente às características dos conceitos do domínio Um conjunto de classes definidas representando as fontes de dados 18/04/2017

Classes e propriedades A partir do vocabulário e das anotações: Hierarquia final das classes 18/04/2017

Derivação automática das transformações Conjunto de operadores de um processo de ETL 18/04/2017

Derivação automática das transformações Integração das fontes de dados e carga do DW Algoritmo que define: De quais atributos e relações as informações serão extraídas Quais as transformações necessárias para a integração 18/04/2017

Referências [CAO, 2006] Cao, L.; Ni, J.; Luo, D. Ontological Engineering in Data Warehousing. LCNS - Lecture Notes in Computer Science, vol. 3841, p. 923-929, 2006. [CHAUDHURI, 1997] Chaudhuri, S.; Dayal, U. An overview of data warehousing and OLAP technology. ACM SIGMOD Record, vol. 26, issue 1, p. 65-74, 1997. [SKOUTAS, 2006] Skoutas, D.; Simitsis, A. Designing ETL Processes Using Semantic Web Technologies. Proceedings of the 9th ACM international workshop on Data warehousing and OLAP, p. 67-74, 2006. [WACHE, 2001] Wache, H., et al. Ontology-Based Integration of Information — A Survey of Existing Approache. IJCAI wokshop on Ontologies and Information Sharing, 2001. 18/04/2017

Obrigada! 18/04/2017