Alinhamento de esquemas baseado em instâncias

Slides:



Advertisements
Apresentações semelhantes
01/08/2011 Professor Leomir J. Borba- –
Advertisements

Modelos e Sistemas de Reputação
Transformação para o Espaço Latente
Mapeamento de Ontologias
1 Mapeamento de Ontologias Agentes Inteligentes e Sistemas Cooperativos 02 de Dezembro de 2004 Nuno Silva
SBC Women in Information Technology Gender and regional differences in Brazil: do they really exist? Janne Oeiras Universidade Federal do Pará
AVALIAÇÃO DE ALGORITMOS DE STEMMING PARA A LÍNGUA PORTUGUESA.
Parte III – Engenharia de Software para Autonomic Computing Seminários 2007 – 2º Semestre Maíra Gatti.
Mapeamento de Thesauri
Ambientes de Computação Empresarial e Avaliação de Custos
Teste em Esquemas de Dados Maria Cláudia Figueiredo Pereira Emer Universidade Federal do Paraná Departamento de Informática Seminário.
Arquitetura de Aplicações Web
ArchC: Uma linguagem de descrição de arquiteturas
Metodologia para Desenvolvimento de Sistemas Web
Ontologia para Sistemas Configurarionais Urbanos
Professora: Aline Vasconcelos
Ontologias para Melhorar Precisão e Cobertura de Buscas na Web
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Departamento de Sistemas de Computação Desenvolvimento e Avaliação de Algoritmos.
Junções Adaptativas em consultas Federadas sobre Linked Data
Engenharia de Requisitos
Carlos Alberto de Freitas Pereira Júnior
Composição e Geração de Aplicações usando Aspectos
FERRAMENTA PARA ANÁLISE DE IMPACTO BASEADO EM RASTREABILIDADE DE
Seminário de Andamento Módulo: Merge Grupo 5 André Ribeiro Coelho Rafael de Souza Santos.
Grupo 5: Fernando Lourenço Pinho Costa Rafael de Souza Santos
FERRAMENTA PARA ANÁLISE DE IMPACTO BASEADO EM RASTREABILIDADE DE
Visão Geral do Desenvolvimento de Sistemas e Papéis no Desenvolvimento de Software Marcely Dias
Rebeca Teodoro da Silva[Voluntário] ;
Interoperabilidade semântica no domínio de Engenharia de Software
1 Felipe L. SeverinoPDP Enhancing Grids for Massively Multiplayer Online Computer Games Felipe L. Severino Programação com Objetos Distribuídos paralela.
Research of Dynamic SOA Collaboration Architecture
Matheus dos Santos Lima
II Workshop de Dissertação Pós-Graduação em Ciência da Computação Faculdade de Computação – FACOM Universidade Federal de Uberlândia – UFU Dezembro/2008.
Aluno: Lucas Bucci da Silveira Orientador: Carlos Roberto Lopes
Adicionando Escalabilidade ao Framework de Recomendação IRF
Aluno: Rodolfo A. L. Costa Orientador: Prof. Frederico G. Guimarães
Marcus Vinicius Silva Soares Orientador: Luiz Merschmann Outubro / 2010.
Banco de Dados II Prof. Antônio Cordeiro.
MAS-ML Tool: Um Ambiente de Modelagem de Sistemas Multi-Agentes
1.
1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva
Projeto de Banco de Dados
Universidade Tecnológica Federal do Paraná
UTILIZANDO A ABORDAGEM DIRIGIDA A RESPONSABILIDADES PARA A CRIAÇÃO DO SUBFRAMEWORK DE ANÁLISE SINTÁTICA E SEMÂNTICA DE FÓRMULAS Rodolfo Adamshuk Silva.
APLICANDO O PROCESSO DIRIGIDO POR RESPONSABILIDADES PARA A CRIAÇÃO DE UM SUBFRAMEWORK PARA VALIDAÇÃO SINTÁTICA DE FÓRMULAS Autores: Rafael Hornung Simone.
BPM BUSINESS PROCESS MANAGEMENT Projecto em Informática e Gestão de Empresas Lisboa, 20 de Junho de 2006.
Banco de Dados Parte 04 Ceça. Ceça Moraes 2 Conteúdo  Os três níveis da arquitetura  Mapeamentos  Arquitetura cliente-servidor.
João Pedro Barbosa da Silva Sessão Controlo Tese 2º Semestre 2007/2008 From Legacy Systems to Ontologies.
Reconhecimento e Verificação de Assinaturas
Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.
Disciplina : Tópicos Avançados em Inteligência Artificial Simbólica Professores: Dr. Fred Freitas / Dra. Bernadette Farias Aluno: Clovis Holanda Introdução.
Mestrado em Engenharia de Computação área de concentração Geomática
Sumarização Ontologias Paulo Orlando V. Q. Sousa.
Um Sistema Peer-to- Peer para Armazenamento Distribuído de Arquivos Daniel Mauricio Sthor Lauro Luis Costa Lucas Nascimento Ferreira Departamento de Informática.
Análise de Estratégias de Green Computing em Grades Oportunistas.
Categorização de Documentos Mariana Lara Neves CIn/UFPE.
GIS e web Lúbia Vinhas Divisão de Processamento de Imagens INPE.
Distributed Data-Parallel Computing Using a High-Level Programming Language TL1 Programação com Objetos Distribuídos Claiton Luiz Vieira Lisboa.
Uso de Ontologias em Data Warehousing
1 Database Systems, 8 th Edition Sistemas de Banco de Dados: Projeto, Implementação e gestão Oitava Edição Capítulo 2 Modelo de Dados.
Integração de dados Bernadette, Ceça, Luciano, Haroldo, Guilherme. Orientadora: Ana Carolina Salgado Universidade Federal de Pernambuco Pós-Graduação em.
Integração Semântica: uma pesquisa sobre abordagens baseadas em ontologias Túlio Lages
Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.
DEPLOYMENT DINÂMICO DE REGRAS CEP EM UM AMBIENTE IoT COM PROCESSAMENTO CLOUD- MOBILE 09/12/2015 Felipe Oliveira Carvalho Introdução a Computação Móvel.
Uma Abordagem Bottom-Up para a Integração Semântica de Esquemas XML Tese de Doutorado por Ronaldo dos Santos Mello Prof. Carlos Alberto Heuser Orientador.
Métricas de Software Orientado a Aspectos Diego Martins – Turah Xavier –
INTEGRAÇÃO DE DADOS: UMA PERSPECTIVA TEÓRICA Guilherme P. K. Caminha Disciplina: IF696.
Uma Extensão do Fluxo de Análise e Projeto do RUP com suporte a Desenvolvimento Baseado em Componentes Eduardo Almeida
ONTOLOGIAS NO CONTROLE DA ADAPTAÇÃO AO CONTEXTO EM ESPAÇO UBÍQUO ONTOLOGIAS NO CONTROLE DA ADAPTAÇÃO AO CONTEXTO EM ESPAÇO UBÍQUO Nelsi Warken, Luiz A.
ADICIONANDO CBR NA GERÊNCIA AUTONÔMICA DE REDES Romildo Martins da Silva Bezerra (GSORT/IFBA) Joberto Sérgio Barbosa Martins (NUPERC/UNIFACS) WOSIDA.
Transcrição da apresentação:

Alinhamento de esquemas baseado em instâncias PROPOSTA DE DOUTORADO Daniela F. Brauner Orientador: Prof. Marco Antonio Casanova

Agenda Definição do problema Abordagem proposta Trabalhos relacionados Alinhamento de tesauros Alinhamento de esquemas conceituais Trabalhos relacionados Contribuições Organização da tese Cronograma

Agenda Definição do problema Abordagem proposta Trabalhos relacionados Alinhamento de tesauros Alinhamento de esquemas conceituais Trabalhos relacionados Contribuições Organização da tese Cronograma

Esquema de Classificação: Definição do problema Como acessar bancos de dados que adotam esquemas heterogêneos? SA SB ? DBA DBB TA TB ? ? Esquema conceitual: descreve em alto nível como organizar os dados armazenados em um BD Esquema de Classificação: classifica os dados armazenados em um BD em categorias pré-definidas Ex: palavras-chave, tesauros, taxonomias.

Definição do problema Ex: DBA DBB ID FULL_NAME_ND DSG DMS_LAT DMS_LONG 67203 Rio de Janeiro PPLA -225400 -431400 -22.9 -43.2333333 39870 STM -115100 -450900 -11.45 -45.15 76124 São Sebastião do Rio de Janeiro DBB identifier display-name class gml:y gml:x adlgaz-1-1457057-00 Rio de Janeiro, Estado do - Brazil administrative areas -22.0 -42.5 adlgaz-1-1457059-20 Rio de Janeiro, Serra do - Brazil mountains -17.95 -44.95 adlgaz-1-1457061-32 Rio de Janeiro - Brazil populated places -22.9 -43.2333 adlgaz-1-1437138-6b Janeiro, Rio de - Brazil streams -11.85 -45.15 adlgaz-1-3223719-6f Rio de Janeiro - Loreto, Departamento de - Peru -4.3833 -71.8167

 Definição do problema Solução: Alinhamento de esquemas (schema matching): Dados dois esquemas como entrada, gerar um mapeamento entre os elementos desses esquemas que correspondem semanticamente um ao outro. SA  sb = (sa) SB

Definição do problema Aplicações: Transformação de dados Ex: data warehousing Mediação de consultas Ex: arquitetura de mediadores

? Definição do problema Transformação de dados: DBA DBB “Populated places” ≠ “PPL” ? ______ ______ TA TB DBA DBB

Definição do problema Transformação de dados: DBA DBB “Populated places” “PPL” ______ ______ TA TB DBA DBB

Request “Populated places” Definição do problema Mediação de consultas: TB TA Populated places PPL Client Request “Populated places” Request “PPL” ______ ______ TA TB DBA DBB

? Mediator Definição do problema Mediação de consultas: DBA DBB Populated places Client Request “Populated places” ? “Populated places” “PPL” Mediator ______ Request “Populated places” ______ Request “PPL” ______ TA TB DBA DBB

Definição do problema Como obter os mapeamentos? Manualmente: Nível de esforço linear com relação ao número de mapeamentos Processo tedioso e dispendioso Consome cerca de 40% do tempo de trabalho dos departamentos de TI Abordagens a priori: Requer amadurecimento das técnicas de projeto de BDs Abordagens sintáticas: Suscetíveis a erros Abordagens semânticas: Utilizam instâncias KEENE, C. Data Services for Next-Generation SOAs. SOA WebServices Journal, 4(12), 2004. http://webservices.syscon.com/read/47283.htm CASANOVA, M. A.; BREITMAN, K. K.; BRAUNER, D. F.; MARINS, A. L. Database Conceptual Schema Matching. IEEE Computer Society, Computer, vol. 40,  n. 10,  pp. 102-104,  Oct.,  2007.

Agenda Definição do problema Abordagem proposta Trabalhos relacionados Alinhamento de tesauros Alinhamento de esquemas conceituais Trabalhos relacionados Contribuições Organização da tese Cronograma

Abordagem proposta Alinhamento de esquemas utilizando instâncias Abordagem a priori: descoberta dos mapeamentos antes da implantação do mediador Abordagem adaptativa: descoberta e adaptação dos mapeamentos de forma incremental, utilizando as respostas às consultas dos usuários como evidências dos mapeamentos

Agenda Definição do problema Abordagem proposta Trabalhos relacionados Alinhamento de tesauros Alinhamento de esquemas conceituais Trabalhos relacionados Contribuições Organização da tese Cronograma

Alinhamento de tesauros Utilizando instâncias Identifica instâncias equivalentes Conta os casamentos entre termos de tesauros distintos Define taxa de mapeamento para pares de termos DBA ID FULL_NAME_ND DSG DMS_LAT DMS_LONG LAT LONG 67203 Rio de Janeiro PPLA -225400 -431400 -22.9 -43.2333333 39870 STM -115100 -450900 -11.45 -45.15 DBB identifier display-name class gml:y gml:x adlgaz-1-1457057-00 Rio de Janeiro, Estado do - Brazil administrative areas -22.0 -42.5 adlgaz-1-1457059-20 Rio de Janeiro, Serra do - Brazil mountains -17.95 -44.95 adlgaz-1-1457061-32 Rio de Janeiro - Brazil populated places -22.9 -43.2333 adlgaz-1-3223719-6f Rio de Janeiro - Loreto, Departamento de - Peru -4.3833 -71.8167

Alinhamento de tesauros Abordagem a priori Mapping Rate Estimator Module 1 2 CA CB Thesaurus RA RB Mapping Rates Matrix BRAUNER, D. F.; CASANOVA, M. A.; MILIDIU, R. L. Towards Gazetteer Integration Through an Instance-based Thesauri Mapping Approach. In: Clodoveu A. Davis Jr; Antonio M.V.M. Monteiro. (Org.). Advances in Geoinformatics. Heidelberg: Springer, 2007, v.1, p.235-245.

Alinhamento de tesauros Abordagem a priori: transformação de dados “Populated places” “PPL” ______ ______ TA TB DBA DBB

Alinhamento de tesauros Abordagem adaptativa Client CA CB Query 1 Query Thesaurus Thesaurus 3 Query Manager Module 4 2 Cache 5 Mappings 6 Mapping Rate Estimator Module 8 7 Mapping Rates Matrix BRAUNER, D. F.; CASANOVA, M. A.; MILIDIU, R. L. Mediation as Recommendation: An Approach to Design Mediators for Object Catalogs. In: 5th International Conference on Ontologies, DataBases, and Applications of Semantics, 2006, Montpellier, OTM 2006 Workshops. Berlin/Heidelberg:Springer, 2006. v. 4277. p. 46-47.

Alinhamento de tesauros Abordagem adaptativa: mediação de consultas TB TA Populated places PPL Client ..in a user session.. Request “Populated places” using TA Request “PPL” using TB Mediator Cache Mappings ______ ______ ______ ______ TA TB DBA DBB

Alinhamento de tesauros Geração de tesauro de referência: Abordagem a priori: Assume-se um dos tesauros das fontes como tesauro de referência A pertinência dos elementos é confirmada a partir dos mapeamentos realizados Abordagem adaptativa: Assume-se um dos tesauros das fontes como referência (por exemplo, o da primeira fonte cadastrada) A pertinência dos elementos é confirmada a medida que os mapeamentos são descobertos Novos elementos são incluídos quando novos mapeamentos são descobertos

Agenda Definição do problema Abordagem proposta Trabalhos relacionados Alinhamento de tesauros Alinhamento de esquemas conceituais Trabalhos relacionados Contribuições Organização da tese Cronograma

Alinhamento de esquemas conceituais Utilizando instâncias Utiliza um conjunto de instâncias de referência Conta re-ocorrência dos valores dos atributos Define matrizes de ocorrência Ref. ID NAME IDTYPE LAT LONG 67203 Rio de Janeiro PPLA -22.9 -43.2333333 266178 Alps MTS 46.41666 10.0 433587 Mississippi River STM 29.15105 -89.253342 DBA identifier display-name class gml:y gml:x adlgaz-1-1457057-00 Rio de Janeiro, Estado do - Brazil administrative areas -22.0 -42.5 adlgaz-1-1457059-20 Rio de Janeiro, Serra do - Brazil mountains -17.95 -44.95 adlgaz-1-1457061-32 Rio de Janeiro - Brazil populated places -22.9 -43.2333 adlgaz-1-3223719-6f Rio de Janeiro - Loreto, Departamento de - Peru -4.3833 -71.8167

Alinhamento de esquemas conceituais Abordagem a priori DBA DBB SB Global Instances + Global Schema SG 1 SA RG 2 Query Manager Module 3 Cache 4 Mapping Rate Estimator Module 6 Mappings 5 Occurrence Matrix between SG e SA Occurrence Matrix between SG e SB BRAUNER, D. F.; INTRATOR, C.; FREITAS, J. C.; CASANOVA, M. A. An Instance-based Approach for Matching Export Schemas of Geographical Database Web Services. In: IX Brazilian Symposium on GeoInformatics, 2007, Campos do Jordão. IX Brazilian Symposium on GeoInformatics (GeoInfo 2007), 2007.

Alinhamento de esquemas conceituais Abordagem adaptativa Client DBA DBB SB 1 Query SA 2 Query Manager Module 3 Cache 4 Mapping Rate Estimator Module 6 Mappings 8 5 7 Occurrence Matrix EMI Matrix BRAUNER, D. F.; GAZOLA, A.; CASANOVA, M. A.; BREITMAN, K. K. Matching Schemas of Database Web Services by Mediating User Queries. In: 10th International Conference on Enterprise Information Systems (ICEIS 2008), 12-16, June, 2008. Barcelona, Spain (Submitted).

Alinhamento de esquemas conceituais Geração de esquema conceitual global: Abordagem a priori: O esquema conceitual global é definido a priori A pertinência dos elementos (atributos) é confirmada a partir dos mapeamentos realizados Abordagem adaptativa: Assume-se um dos esquemas conceituais das fontes cadastradas como esquema global (por exemplo, o da primeira fonte cadastrada) A pertinência dos elementos (atributos) é confirmada a medida que os mapeamentos são descobertos Novos atributos são incluídos quando novos mapeamentos são descobertos

Agenda Definição do problema Abordagem proposta Trabalhos relacionados Alinhamento de tesauros Alinhamento de esquemas conceituais Trabalhos relacionados Contribuições Organização da tese Cronograma

Trabalhos Relacionados Rahm e Bernstein (2001) apresentam um survey incluindo diversas técnicas de alinhamento de esquemas conceituais, e propõem uma taxonomia para classificá-las. Bernstein e Melnik (2007) apresentam uma revisão dos requisitos para um Sistema de Gerenciamento de Modelos (que inclui operações para alinhamento de esquemas, diff de esquemas, transformação de dados a partir dos mapeamentos, etc.). Apontam a necessidade de inclusão de um componente para execução dos mapeamentos em runtime. Rahm, E.; Bernstein, P. A. A Survey of Approaches to Automatic Schema Matching, The VDLB Journal, vol. 10, pp. 334–350, 2001. Bernstein, P. A.; Melnik, S. Model management 2.0: manipulating richer mappings. In Proc. of the 2007 ACM SIGMOD International Conference on Management of Data, Beijing, China, 2007. pp.1 - 12.

Trabalhos Relacionados (Wang et al. 2004) Técnica de alinhamento de esquemas baseada em instâncias usando sondagem de consultas específica de domínio, aplicada a bancos de dados na Web Um banco de dados na Web é composto por: Esquema de Interface: o que pode ser consultado Esquema de Resultado: o que é apresentado aos usuários Assume a existência/definição prévia de: um esquema global para bancos de dados na Web de um mesmo domínio um conjunto de instâncias de referência Wang, J., Wen, J. Lochovsky, F.H. and Ma, W. (2004). Instance-based schema matching for web databases by domain-specific query probing, In Proceedings of 30th Intl. Conference on Very Large Data Bases, pp. 408-419.

Trabalhos Relacionados Esquema global + Instâncias de referência Web Database (Esquema de Interface) Instâncias de Referência Title Author Publisher ISBN xxxx xxxxxxx xxxx xxxx Wang, J., Wen, J. Lochovsky, F.H. and Ma, W. (2004). Instance-based schema matching for web databases by domain-specific query probing, In Proceedings of 30th Intl. Conference on Very Large Data Bases, pp. 408-419.

Trabalhos Relacionados Esquema global + Instâncias de referência Web Database (Esquema de Interface) Instâncias de Referência Title Author Publisher ISBN xxxx xxxxxxx xxxx xxxx Result Page (Esquema de Resultado) Wang, J., Wen, J. Lochovsky, F.H. and Ma, W. (2004). Instance-based schema matching for web databases by domain-specific query probing, In Proceedings of 30th Intl. Conference on Very Large Data Bases, pp. 408-419.

Agenda Definição do problema Abordagem proposta Trabalhos relacionados Alinhamento de tesauros Alinhamento de esquemas conceituais Trabalhos relacionados Contribuições Organização da tese Cronograma

Contribuições Técnicas baseadas em instâncias para alinhamento de: esquemas de classificação (tesauros) esquemas conceituais Classificação das técnicas em a priori e adaptativas Técnicas para, a partir destes alinhamentos, criação de: esquemas de classificação (tesauros) de referência esquemas conceituais globais

Agenda Definição do problema Abordagem proposta Trabalhos relacionados Alinhamento de tesauros Alinhamento de esquemas conceituais Trabalhos relacionados Contribuições Organização da tese Cronograma

Organização da tese Introdução Trabalhos relacionados Alinhamento de tesauros Alinhamento de esquemas Conclusões

Agenda Definição do problema Abordagem proposta Trabalhos relacionados Alinhamento de tesauros Alinhamento de esquemas conceituais Trabalhos relacionados Contribuições Organização da tese Cronograma

Cronograma

Alinhamento de esquemas baseado em instâncias PROPOSTA DE DOUTORADO Daniela F. Brauner Orientador: Prof. Marco Antonio Casanova