INTEGRAÇÃO DE DADOS: UMA PERSPECTIVA TEÓRICA Guilherme P. K. Caminha Disciplina: IF696.

Slides:



Advertisements
Apresentações semelhantes
SISTEMAS DE INFORMAÇÕES GERENCIAIS
Advertisements

Ana Paula B. Barboza Ivana Xavier Rodrigues
TRABALHO DE BANCO DE DADOS III THIAGO LIMA ROBERTO SANTOS
Evolução dos SGBD’s (2ª Parte).
SQL Structured Query Language (continuação)
Resumo 1.1) Introdução 1.2) Abordagem Convencional de Arquivos
Funcionalidades de um SGBD
Metodologias de modelagem Web
Maurício Edgar Stivanello
FACULDADE DOS GUARARAPES
Bacharelado em Ciência da Computação
Introdução aos Sistemas Gerenciadores de Banco de Dados
1 Data Integration in a Bandwidth-Rich World Ian Foster and Robert L. Grossman Universidade Federal Fluminense Doutorado em Computação – Engenharia de.
QoS para Realidade Virtual
Junções Adaptativas em consultas Federadas sobre Linked Data
Seminário de Andamento Módulo: Merge Grupo 5 André Ribeiro Coelho Rafael de Souza Santos.
Disciplina: Sistemas de Informação para Planejamento Estratégico
Administração de Sistemas de Informação Banco de Dados
Arquitetura e Linguagens
I- Introdução A Evolução dos Modelos de Dados e dos Sistemas de Gerência de Banco de Dados.
Projeto MONITORAMA CMD-TD – Automação para a Tomada de Decisão
Arquiteturas de Referência
Gestão e Tratamento de Informação Helena Galhardas DEI IST.
Laboratório de Programação I Carlos Oberdan Rolim Ciência da Computação Sistemas de Informação.
Web Services Uninorte Semana de Tecnologia da Informação
Integração com Banco de Dados
Linguagens de programação
Design Patterns / Acesso ao banco de dados (java.sql)
Tecnologia da Informação
IF696 - Integração de Dados e DW
1.
1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva
Data Mining: Conceitos e Técnicas
UTILIZANDO A ABORDAGEM DIRIGIDA A RESPONSABILIDADES PARA A CRIAÇÃO DO SUBFRAMEWORK DE ANÁLISE SINTÁTICA E SEMÂNTICA DE FÓRMULAS Rodolfo Adamshuk Silva.
Vânia Maria P. Vidal, José Maria Monteiro, Luís Eufrasio T. Neto
Banco de Dados Parte 04 Ceça. Ceça Moraes 2 Conteúdo  Os três níveis da arquitetura  Mapeamentos  Arquitetura cliente-servidor.
Arquitetura de Desenvolvimento Web MVC vs. Three Tiers
Da Introdução à Prática
RPC and Web Service André Pereira.
Disciplina : Tópicos Avançados em Inteligência Artificial Simbólica Professores: Dr. Fred Freitas / Dra. Bernadette Farias Aluno: Clovis Holanda Introdução.
Cristina Paludo Santos URI – Campus de Santo Ângelo
Sarajane Marques Peres
Introdução a Banco de Dados Aula 01
Padrões de Interação com o Usuário
Mestrado em Engenharia de Computação área de concentração Geomática
DESENVOLVIMENTO DE SOFTWARE AULA 7 – Sistemas de Banco de Dados
Ferramenta de Modelagem de Requisitos e Agentes (TAOM4e) Laís Xavier Prof.: Jaelson Castro.
Automação Comercial Faculdade Estácio Radial Prof. Paulo Alipio Alves de Oliveira 2010.
Uma Interface em Linguagem Natural em Português para Pergunta-Resposta na Web Grupo de Inteligência Computacional Mestrado em Ciência da Computação Aluno:
Arquitetura P2P (Integração de Dados) Luciana Pereira Oliveira Professora: Valéria Times Professora: Valéria Times.
Serialização Relaxada em Banco de Dados Múltiplos Andressa Sebben
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG URL: Função: Classificação Técnica: Árvore de Decisão.
Sistemas de Apoio à Decisão - SAD
Banco de Dados Universidade do Estado de Santa Catarina
Distributed Data-Parallel Computing Using a High-Level Programming Language TL1 Programação com Objetos Distribuídos Claiton Luiz Vieira Lisboa.
Conceitos básicos Professor Esp. Diego André Sant’Ana
Uso de Ontologias em Data Warehousing
UCSal – Bacharelado em Informática
UCSal – Bacharelado em Informática Banco de Dados Profa. Semíramis Assis
1 Database Systems, 8 th Edition Sistemas de Banco de Dados: Projeto, Implementação e gestão Oitava Edição Capítulo 2 Modelo de Dados.
Janeiro/2013 Ceça Moraes Data Warehouse Janeiro/2013 Ceça Moraes
1 Database Systems, 8 th Edition Sistemas de Banco de Dados: Projeto, Implementação e gestão Oitava Edição Capítulo 2 Modelo de Dados.
Data Warehouse Introdução ao Data Warehouse Introdução ao Data Warehouse Sistemas de Apoio à Decisão Sistemas de Apoio à Decisão Conceituação de Data Warehouse.
MDA na Prática Flávia Durans Pitta Marinho
Integração Semântica: uma pesquisa sobre abordagens baseadas em ontologias Túlio Lages
DEPLOYMENT DINÂMICO DE REGRAS CEP EM UM AMBIENTE IoT COM PROCESSAMENTO CLOUD- MOBILE 09/12/2015 Felipe Oliveira Carvalho Introdução a Computação Móvel.
/ de Julho de UFPE - Universidade Federal de Pernambuco CIn - Centro de Informática Pós-Graduação em Ciência da Computação Tópicos Avançados.
Graph Database Neo4j Edson Barboza.
Web Services / SOA. O cenário de TI nas corporações Novas tendências batiam à porta das corporações Migraram o foco do “gerenciamento de dados” para o.
Solução sistêmica para apoiar os processos de fiscalização da Arsesp Agosto/2015 IX Congresso Brasileiro de Regulação.
Transcrição da apresentação:

INTEGRAÇÃO DE DADOS: UMA PERSPECTIVA TEÓRICA Guilherme P. K. Caminha Disciplina: IF696

ROTEIRO Introdução Introdução Motivação Motivação Objetivos Objetivos Conceitos Conceitos Modelagens Modelagens GAV: Um exemplo GAV: Um exemplo Estado da Arte Estado da Arte Aplicações Aplicações Referências Referências

INTRODUÇÃO Integração de dados Integração de dados Conjunto de fontes Conjunto de fontes Dados reais Dados reais Esquema global Esquema global View virtual e integrada das fontes View virtual e integrada das fontes

MOTIVAÇÃO Processo importante Processo importante Comercial Comercial Caso de uso: unir bancos de dados Caso de uso: unir bancos de dados Científico Científico Combinando resultados de repositórios diferentes Combinando resultados de repositórios diferentes

MOTIVAÇÃO Fontes isoladas de dados (Information Silos) Fontes isoladas de dados (Information Silos) Fontes distribuídas Fontes distribuídas Fontes heterogêneas Fontes heterogêneas

MOTIVAÇÃO No contexto de Warehousing No contexto de Warehousing ETL (Extract, Transform, and Load) ETL (Extract, Transform, and Load) Arquitetura fortemente acoplada Arquitetura fortemente acoplada Dados fisicamente reconciliados Dados fisicamente reconciliados Único repositório de dados Único repositório de dados Queries mais rápidas Queries mais rápidas E se as fontes forem frequentemente atualizadas? E se as fontes forem frequentemente atualizadas? E se não houver acesso aos dados completos, apenas a interface de query? E se não houver acesso aos dados completos, apenas a interface de query?

OBJETIVOS Estudar uma arquitetura que atenda às questões levantadas. Estudar uma arquitetura que atenda às questões levantadas.

CONCEITOS Solução: Solução: Integração fracamente acoplada Integração fracamente acoplada Interface de query unificada Interface de query unificada Através de um esquema mediador Através de um esquema mediador Informação obtida diretamente das fontes Informação obtida diretamente das fontes Não mais de um único repositório Não mais de um único repositório

CONCEITOS Mapeamentos Mapeamentos Entre esquema mediador e esquemas fonte Entre esquema mediador e esquemas fonte Query no esquema mediador Query no esquema mediador é transformada em query especializada

CONCEITOS Há dois tipos de mapeamento Há dois tipos de mapeamento Global as View (GAV) Global as View (GAV) Mapeia entidades do esquema Mapeia entidades do esquema mediador para fontes Local as View (LAV) Local as View (LAV) Mapeia entidades das fontes Mapeia entidades das fontes para o esquema mediador

CONCEITOS Queries feitas em termos Queries feitas em termos do esquema global Portanto, é necessário reformular Portanto, é necessário reformular as queries

CONCEITOS Formalizando: Formalizando: Componentes de um sistema de integração de dados (I) Componentes de um sistema de integração de dados (I) Esquema Global (G) Esquema Global (G) Fontes (S) Fontes (S) Mapeamento (M) Mapeamento (M) Resulta na tripla (G, S, M) Resulta na tripla (G, S, M)

CONCEITOS Esquema Global (G) Esquema Global (G) Expresso numa linguagem L G Expresso numa linguagem L G Sobre um alfabeto A G Sobre um alfabeto A G A G inclui um símbolo para cada elemento de G A G inclui um símbolo para cada elemento de G (relações, classes, etc...) (relações, classes, etc...)

CONCEITOS Esquema Fonte (S) Esquema Fonte (S) Expresso numa linguagem L S Expresso numa linguagem L S Sobre um alfabeto A S Sobre um alfabeto A S A S inclui um símbolo para cada elemento das fontes A S inclui um símbolo para cada elemento das fontes

CONCEITOS

CONCEITOS Queries em I são portanto... Queries em I são portanto... Feitas em termos de G Feitas em termos de G Expressas numa linguagem L Q Expressas numa linguagem L Q Sobre o alfabeto A G Sobre o alfabeto A G

CONCEITOS Semântica de um sistema I = (G, S, M) Semântica de um sistema I = (G, S, M) Dado um banco de dados fonte D para I Dado um banco de dados fonte D para I D é conforme com o esquema S D é conforme com o esquema S Um banco de dados global B é legal com respeito a I, se Um banco de dados global B é legal com respeito a I, se B satisfaz todas as restrições de G B satisfaz todas as restrições de G B satisfaz o mapeamento M com respeito a D B satisfaz o mapeamento M com respeito a D

MODELAGENS

MODELAGENS

MODELAGENS

MODELAGENS

GAV: UM EXEMPLO

Consideremos 3 fontes de dados Consideremos 3 fontes de dados s 1, de aridade 4, contém informações sobre empregados s 1, de aridade 4, contém informações sobre empregados s 2, de aridade 2, contém códigos e nomes de companhias s 2, de aridade 2, contém códigos e nomes de companhias s 3, de aridade 2, contém informações sobre empregação s 3, de aridade 2, contém informações sobre empregação

GAV: UM EXEMPLO

Façamos uma query: Façamos uma query: {x | employee(x, y, z)} {x | employee(x, y, z)}

ESTADO DA ARTE OLE-DB OLE-DB API de SQL para acessar várias fontes API de SQL para acessar várias fontes Permite data mining em várias fontes OLE-DB Permite data mining em várias fontes OLE-DB Permite OLAP Permite OLAP Oracle Oracle Através da tecnologia Oracle Gateway Através da tecnologia Oracle Gateway

ESTADO DA ARTE Cast Iron ( Cast Iron ( Permite a criação de projetos com listeners para: Permite a criação de projetos com listeners para: HTTP, HTTP, FTP, FTP, SMTP, e SMTP, e BDs BDs

ESTADO DA ARTE Cast Iron ( Cast Iron ( Permite fluxo de controle Permite fluxo de controle If/Then If/Then Do/While Do/While Try/Catch Try/Catch

ESTADO DA ARTE Cast Iron ( Cast Iron ( Totalmente visual Totalmente visual Facilita uso em empresas não TI Facilita uso em empresas não TI O objetivo é tornar fácil mover dados O objetivo é tornar fácil mover dados Ex: Sincronizar um BD de clientes com seu BD do salesforce.com Ex: Sincronizar um BD de clientes com seu BD do salesforce.com Possível associar dados apenas arrastando: Possível associar dados apenas arrastando:

APLICAÇÕES Mineração de Dados Mineração de Dados Uma view unificada facilita a mineração Uma view unificada facilita a mineração Consolidação de Dados Consolidação de Dados Coletar e integrar dados em um único lugar Coletar e integrar dados em um único lugar Merge de databases Merge de databases Combinação de resultados Combinação de resultados

APLICAÇÕES Exemplo Exemplo Aplicação web com consultas a estatísticas de cidades Aplicação web com consultas a estatísticas de cidades Crime, Crime, Tempo, Tempo, Hotéis, etc Hotéis, etc Tradicionalmente, a informação fica em um BD Tradicionalmente, a informação fica em um BD Porém, problemas surgem utilizando diversas fontes Porém, problemas surgem utilizando diversas fontes Exemplo: duplicações Exemplo: duplicações

APLICAÇÕES Exemplo Exemplo Solução: Integração de dados! Solução: Integração de dados!

REFERÊNCIAS M. Lenzerini, Data Integration: A Theoretical Perspective M. Lenzerini, Data Integration: A Theoretical Perspective G. Thomas et al, Heterogeneous Distributed Database Systems for Production Use G. Thomas et al, Heterogeneous Distributed Database Systems for Production Use S. Pllana et al, A Survey of the State of the Art in Data Mining and Integration Query Languages S. Pllana et al, A Survey of the State of the Art in Data Mining and Integration Query Languages

REFERÊNCIAS T. Kirk, The Information Manifold T. Kirk, The Information Manifold A. Calì et al, On the Expressive Power of Data Integration Systems A. Calì et al, On the Expressive Power of Data Integration Systems

REFERÊNCIAS Abiteboul, Hull, Vianu Abiteboul, Hull, Vianu