Uma Abordagem Bottom-Up para a Integração Semântica de Esquemas XML Tese de Doutorado por Ronaldo dos Santos Mello Prof. Carlos Alberto Heuser Orientador.

Slides:



Advertisements
Apresentações semelhantes
Sistema de informação:
Advertisements

Introdução Marcus Vinícius Carneiro Teixeira.
Engenharia de Software
Resumo 1.1) Introdução 1.2) Abordagem Convencional de Arquivos
Introdução a Banco de Dados
Introdução a Banco de Dados Prof.: Bruno Rafael de Oliveira Rodrigues.
Teste em Esquemas de Dados Maria Cláudia Figueiredo Pereira Emer Universidade Federal do Paraná Departamento de Informática Seminário.
Neide dos Santos Oscar Luiz Monteiro de Farias
Ontologia para Sistemas Configurarionais Urbanos
GHHITS – Mining the Web Link Structure Universidade Federal de Pernambuco Centro de Informática Roberta Coelho Silvio Meira.
Ontologias para Melhorar Precisão e Cobertura de Buscas na Web
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Departamento de Sistemas de Computação Desenvolvimento e Avaliação de Algoritmos.
Junções Adaptativas em consultas Federadas sobre Linked Data
Seminário de Andamento UNILASALLE André Sandri Maio 2006 PROFILE EM UML PARA MODELAGEM SIMPLIFICADA DE INTERFACES GRÁFICAS EM APLICATIVOS.
Aspectos Avançados em Engenharia de Software Aula 3 Fernanda Campos
Roteiro Para o Trabalho do Módulo
University of Minho, Portugal
Interoperabilidade semântica no domínio de Engenharia de Software
Prof. Alfredo Parteli Gomes
O NTOLOGY M ATCHING Thiago Pachêco. R OTEIRO Motivação Ontology matching Definição Conceitos Processo Técnicas Álgebra Ferramentas existentes OAEI Aplicações.
Web Services Uninorte Semana de Tecnologia da Informação
Bancos de Dados Projeto de BD
Prof. Kelly E. Medeiros Bacharel em Sistemas de Informação
Engenharia do Conhecimento Ernesto Trajano Jacques Robin CIn-UFPE.
1.
Metodologias e Processos para Projeto Conceitual de Banco de Dados
1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva
Projeto de Banco de Dados
Modelagem de Negócio no RUP
UTILIZANDO A ABORDAGEM DIRIGIDA A RESPONSABILIDADES PARA A CRIAÇÃO DO SUBFRAMEWORK DE ANÁLISE SINTÁTICA E SEMÂNTICA DE FÓRMULAS Rodolfo Adamshuk Silva.
Vânia Maria P. Vidal, José Maria Monteiro, Luís Eufrasio T. Neto
Banco de Dados Aplicado ao Desenvolvimento de Software
Tradutor Oracle SQL Server Núcleo comum Lookup Middleware consultas esquema de mediação Base de dados das fontes locais Ambiente de geração das consultas.
Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.
Disciplina : Tópicos Avançados em Inteligência Artificial Simbólica Professores: Dr. Fred Freitas / Dra. Bernadette Farias Aluno: Clovis Holanda Introdução.
Cristina Paludo Santos URI – Campus de Santo Ângelo
Campus de Caraguatatuba Aula 2: Introdução a Tecnologia de BD
Semântica em Integração de Dados – Ontologia Contextual
Tese de Doutorado Middleware para Integração de Dados Heterogêneos Baseado em Composição de Frameworks Aluno: Alvaro Cesar P Barbosa Orientador: Prof.
Mestrado em Engenharia de Computação área de concentração Geomática
Desenvolvimento de Software Dirigido a Modelos
Uma Interface em Linguagem Natural em Português para Pergunta-Resposta na Web Grupo de Inteligência Computacional Mestrado em Ciência da Computação Aluno:
Arquitetura P2P (Integração de Dados) Luciana Pereira Oliveira Professora: Valéria Times Professora: Valéria Times.
XML Prof. Dr. Fernando Gauthier INE/UFSC. XML XML (Extensible Markup Language) é uma linguagem para marcar documentos que contêm informações estruturadas.
RDF na interoperabilidade de dados entre domínios Dissertação de Mestrado Domingos Sávio Apolônio Santos Mestrando Ulrich Schiel Orientador /9.
Methodologies for the Design of Service- Based Systems Barbara Pernici João Victor Guimarães de Lemos Professor: Jaelson Castro Outubro/2010.
Banco de Dados e Internet
Modelação Aula T15 Modelação Conceptual de Sistemas Revisão do Comportamento OCL – Object Constraint Language José Borbinha.
METHONTOLOGY Sandro Rautenberg
Uso de Ontologias em Data Warehousing
Programa Nacional de Cooperação Acadêmica (PROCAD / CAPES) Desenvolvimento de Linhas de Produtos de Software usando Técnicas Orientadas a Aspectos REQUISITOS.
Persistência em Software Orientado a Objetos:
1 Database Systems, 8 th Edition Sistemas de Banco de Dados: Projeto, Implementação e gestão Oitava Edição Capítulo 2 Modelo de Dados.
Professora: Kelly de Paula Cunha
CIn/UFPE – IF696 - Integração de Dados e DW - Prof. Robson Fidalgo  1.
1 Database Systems, 8 th Edition Sistemas de Banco de Dados: Projeto, Implementação e gestão Oitava Edição Capítulo 2 Modelo de Dados.
APS II Análise e Projeto de Sistemas de Informação II
Integração Semântica: uma pesquisa sobre abordagens baseadas em ontologias Túlio Lages
Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.
/ de Julho de UFPE - Universidade Federal de Pernambuco CIn - Centro de Informática Pós-Graduação em Ciência da Computação Tópicos Avançados.
INTEGRAÇÃO DE DADOS: UMA PERSPECTIVA TEÓRICA Guilherme P. K. Caminha Disciplina: IF696.
Ensinet/Nav: Uma ferramenta para estruturação de cursos baseados em objetos de aprendizagem UNIVERSIDADE CATÓLICA DE PELOTAS ESCOLA DE INFORMÁTICA NÚCLEO.
/ de Abril de UFPE - Universidade Federal de Pernambuco Centro de Informática Pós-Graduação em Ciência da Computação Dissertação de Mestrado.
1 Especificação de Sistemas de Software e a UML. 2 Modelagem de sistema A modelagem de sistema auxilia o analista a entender a funcionalidade do sistema.
Soluções de Telecomunicações para a Inclusão Digital Novas linguagens e modelos de interação M. Cecília C. Baranauskas Proposta NIED e InterHAD Unicamp.
Ontologias na Descoberta de Recursos da Computação Pervasiva Renato Dilli – TA2PD e TEWS UCPel – PPGINFO – Set/2008.
Modelagem de Dados Aula 3.
Análise e Projeto de Sistemas Análise & modelagem conceitual Prof. Edjandir Corrêa Costa
GRLibrelotto & JCRamalho & PRHenriques, XATA’06, Fevereiro Topic Maps aplicados ao Sistema de Informação do Museu da Emigração Giovani R. Librelotto.
Modelagem de Banco de Dados: Conceitos
Transcrição da apresentação:

Uma Abordagem Bottom-Up para a Integração Semântica de Esquemas XML Tese de Doutorado por Ronaldo dos Santos Mello Prof. Carlos Alberto Heuser Orientador UFRGS/II - PPGC

Roteiro 1.Introdução 2.Abordagem de Integração Proposta 3.Modelo Canônico e Mapeamentos 4.Etapa de Conversão da DTD 5.Etapa de Integração Semântica 6.Considerações Finais

Roteiro 1.Introdução 2.Abordagem de Integração Proposta 3.Modelo Canônico e Mapeamentos 4.Etapa de Conversão da DTD 5.Etapa de Integração Semântica 6.Considerações Finais

Motivação Contexto do problema –consultas a fontes de dados heterogêneas e semi- estruturadas na Web –foco em dados XML Áreas de pesquisa –integração de esquemas –tradução e otimização de consultas globais –integração de resultados de consultas

Motivação Contexto do problema –consultas a fontes de dados heterogêneas e semi- estruturadas na Web –foco em dados XML Áreas de pesquisa –integração de esquemas –tradução e otimização de consultas globais –integração de resultados de consultas

Objetivo da Tese Uma abordagem de integração semântica de esquemas XML –semi-automático mínima intervenção do usuário –processo bottom-up esquema global que representa de forma garantida todas as informações dos esquemas das fontes –modelo canônico conceitual alto nível de abstração

Trabalhos Relacionados TrabalhoIntegraçãoProcessoModelo Canônico TSIMMISmanualbottom-upgrafo Garlicmanualbottom-upODMG MIXmanualbottom-upDTD DIXSEmanualbottom-upconceitual Jensenmanualbottom-upUML YATmanual-árvore McBrienmanual-grafo Vdovjakmanualtop-downconceitual Xylemesemi-automáticotop-downDTD LSDsemi-automáticotop-downDTD Limsemi-automáticobottom-upgrafo CUPIDsemi-automáticobottom-upconceitual MOMISsemi-automáticobottom-upconceitual

Trabalhos Relacionados TrabalhoIntegraçãoProcessoModelo Canônico TSIMMISmanualbottom-upgrafo Garlicmanualbottom-upODMG MIXmanualbottom-upDTD DIXSEmanualbottom-upconceitual Jensenmanualbottom-upUML YATmanual-árvore McBrienmanual-grafo Vdovjakmanualtop-downconceitual Xylemesemi-automáticotop-downDTD LSDsemi-automáticotop-downDTD Limsemi-automáticobottom-upgrafo CUPIDsemi-automáticobottom-upconceitual MOMISsemi-automáticobottom-upconceitual

Características não tratam a integração de representações alternativas de elementos não tratam de forma completa a integração de elementos textuais com estruturados Limitações na integração de esquemas XML MOMIS CUPID Trabalho

Características TrabalhoLimitações da Modelagem Conceitual CUPID não modela representações alternativas de elementos não filtra elementos irrelevantes para o domínio MOMIS esquema conceitual definido manualmente Vdokjak esquema conceitual definido manualmente DIXSE não modela relacionamentos de herança não filtra elementos irrelevantes para o domínio

Proposta da Tese Processo de integração semântica de esquemas XML –tratamento dos casos de unificação de elementos heterogêneos –modelagem canônica conceitual de um esquema XML análise do esquema XML inferências semânticas (heurísticas) análise de documentos XML

Roteiro 1.Introdução 2.Abordagem de Integração Proposta 3.Modelo Canônico e Mapeamentos 4.Etapa de Conversão da DTD 5.Etapa de Integração Semântica 6.Considerações Finais

Arquitetura de Mediação Sites Web Documentos XML Sites Web

Camada de Wrappers Wrapper 1 Wrapper n DTD 1 DTD n Sites Web... Documentos XML Sites Web disponibiliza um esquema local para uma ou mais fontes executa consultas nestas fontes

Mediador Wrapper 1 Wrapper n DTD 1 DTD n Consulta local textual Usuário Especialista Mediador DTDs Documentos XML Locais Sites Web... Documentos XML Sites Web Esquema Global integra esquemas locais gerencia consultas globais a um conjunto de fontes Documento XML global Consulta global textual

Interface de Consulta Wrapper 1 Wrapper n DTD 1 DTD n Consultas locais textuais Documento XML global Esquema Global Usuário Especialista Mediador Interface de Consulta DTDs Consulta globalResultados Documentos XML Locais Sites Web Consulta global textual... Documentos XML Sites Web define consultas sobre o esquema global apresenta os resultados

Processo de Integração DTD 1 DTD n Esquema Global Usuário Especialista Integração Semântica Camada de Mediação... Esquema Conceitual 1Esquema Conceitual n... Conversão da DTD ARTEMIS Documentos XML Documentos XML Conversão da DTD...

Processo de Integração DTD 1 DTD n Esquema Global Usuário Especialista Integração Semântica Camada de Mediação... Esquema Conceitual 1Esquema Conceitual n... Conversão da DTD ARTEMIS Documentos XML Documentos XML Conversão da DTD...

Processo de Integração DTD 1 DTD n Esquema Global Usuário Especialista Integração Semântica Camada de Mediação... Esquema Conceitual 1Esquema Conceitual n... Conversão da DTD ARTEMIS Documentos XML Documentos XML Conversão da DTD...

Roteiro 1.Introdução 2.Abordagem de Integração Proposta 3.Modelo Canônico e Mapeamentos 4.Etapa de Conversão da DTD 5.Etapa de Integração Semântica 6.Considerações Finais

Roteiro 1.Introdução 2.Abordagem de Integração Proposta 3.Modelo Canônico e Mapeamentos 3.1 Modelo Conceitual Canônico (MCC) 3.2 Mapeamento MCC-DTD 4.Etapa de Conversão da DTD 5.Etapa de Integração Semântica 6.Considerações Finais

Modelo Conceitual Canônico (MCC) Variante do ORM (Object with Roles Model) Halphin, T. Object-Role Modeling (ORM/NIAM), Handbook on Architectures of Information Systems. Springer-Verlag, –notação gráfica do modelo ER

Exemplo de Esquema MCC Publication Proceedings Title Business University Address Conference Publisher Book (1,N) homeAddress (0,1) (1,N) (1,1) (1,N) (1,1) (1,N) (1,1) {technical, fiction} Category Author Name (1,1) (1,N) workAddress (1,1) (1,N) StreetCity (1,N) (1,1) Number (1,N) (1,1) string integer stringinteger

Exemplo de Esquema MCC Publication Proceedings Title Business University Address Conference Publisher Book (1,N) homeAddress (0,1) (1,N) (1,1) (1,N) (1,1) (1,N) (1,1) {technical, fiction} Category Author Name (1,1) (1,N) workAddress (1,1) (1,N) StreetCity (1,N) (1,1) Number (1,N) (1,1) string integer stringinteger conceito NL (1,N)

Exemplo de Esquema MCC Publication Proceedings Title Business University Address Conference Publisher Book (1,N) homeAddress (0,1) (1,N) (1,1) (1,N) (1,1) (1,N) (1,1) {technical, fiction} Category Author Name (1,1) (1,N) workAddress (1,1) (1,N) StreetCity (1,N) (1,1) Number (1,N) (1,1) string integer stringinteger conceito L (1,N)

Exemplo de Esquema MCC Publication Proceedings Title Business University Address Conference Publisher Book (1,N) homeAddress (0,1) (1,N) (1,1) (1,N) (1,1) (1,N) (1,1) {technical, fiction} Category Author Name (1,1) (1,N) workAddress (1,1) (1,N) StreetCity (1,N) (1,1) Number (1,N) (1,1) string integer stringinteger relacionamento de associação (1,N)

Exemplo de Esquema MCC Publication Proceedings Title Business University Address Conference Publisher Book (1,N) homeAddress (0,1) (1,N) (1,1) (1,N) (1,1) (1,N) (1,1) {technical, fiction} Category Author Name (1,1) (1,N) workAddress (1,1) (1,N) StreetCity (1,N) (1,1) Number (1,N) (1,1) string integer stringinteger relacionamento de herança (1,N)

Exemplo de Esquema MCC disjunção Publication Proceedings Title Business University Address Conference Publisher Book (1,N) homeAddress (0,1) (1,N) (1,1) (1,N) (1,1) (1,N) (1,1) {technical, fiction} Category Author Name (1,1) (1,N) workAddress (1,1) (1,N) StreetCity (1,N) (1,1) Number (1,N) (1,1) string integer stringinteger (1,N)

Roteiro 1.Introdução 2.Abordagem de Integração Proposta 3.Modelo Canônico e Mapeamentos 3.1 Modelo Conceitual Canônico (MCC) 3.2 Mapeamento MCC-DTD 4.Etapa de Conversão da DTD 5.Etapa de Integração Semântica 6.Considerações Finais

Mapeamento MCC - DTD Informação de mapeamento –correspondência entre o esquema global e os esquemas locais –finalidade: tradução de consultas globais Abordagens para definição de mapeamentos –catálogos de mapeamento –visões

Mapeamento MCC - DTD Informação de mapeamento –correspondência entre o esquema global e os esquemas locais –finalidade: tradução de consultas globais Abordagens para definição de mapeamentos –catálogos de mapeamento –visões

Mapeamento MCC - DTD Estratégia de mapeamento –expressões de caminho XPath associadas a conceitos e relacionamentos do esquema global –por quê XPath? XPath é um padrão para consulta a dados XML visão XPath: expressão direta de busca para um elemento ou atributo em uma fonte XML

Mapeamento de Conceitos Expressão de caminho absoluto XPath Book (1,N) Author (1,N) DTD X

Mapeamento de Conceitos Expressão de caminho absoluto XPath Book (1,N) Author (1,N) DTD X : /Book/ DTD X

Mapeamento de Conceitos Expressão de caminho absoluto XPath Book (1,N) Author (1,N) DTD X : /Book/AuthorList DTD X

Mapeamento de Conceitos Expressão de caminho absoluto XPath Book (1,N) Author (1,N) DTD X : /Book/AuthorList/Author DTD X

Mapeamento de Relacionamentos Expressão de caminho relativo XPath Book (1,N) Author (1,N) DTD X

Mapeamento de Relacionamentos Expressão de caminho relativo XPath Book (1,N) Author (1,N) DTD X DTD X: Book  Author:

Mapeamento de Relacionamentos Expressão de caminho relativo XPath Book (1,N) Author (1,N) DTD X DTD X: Book  Author:AuthorList

Mapeamento de Relacionamentos Expressão de caminho relativo XPath Book (1,N) Author (1,N) DTD X DTD X: Book  Author:AuthorList/Author

Mapeamento de Relacionamentos Expressão de caminho relativo XPath Book (1,N) Author (1,N) DTD X DTD X: Author  Book:

Mapeamento de Relacionamentos Expressão de caminho relativo XPath Book (1,N) Author (1,N) DTD X DTD X: Author  Book:..

Mapeamento de Relacionamentos Expressão de caminho relativo XPath Book (1,N) Author (1,N) DTD X DTD X: Author  Book:../..

Roteiro 1.Introdução 2.Abordagem de Integração Proposta 3.Modelo Canônico e Mapeamentos 4.Etapa de Conversão da DTD 5.Etapa de Integração Semântica 6.Considerações Finais

Etapa de Conversão da DTD Contribuição principal da abordagem –diferencial em relação a outros trabalhos define um esquema semântico para uma DTD resulta de uma análise detalhada do esquema + dados de documentos XML + inferências semânticas –modelagem canônica +adequada ao domínio esquema global +preciso

Processo de Conversão Documentos XML Usuário Especialista Pré-Processamento DTD Pré-Processada Conversão Esquema Conceitual Preliminar Reestruturação Esquema Conceitual Definitivo Fonte XML

Processo de Conversão Documentos XML Usuário Especialista Pré-Processamento DTD Pré-Processada Conversão Esquema Conceitual Preliminar Reestruturação Esquema Conceitual Definitivo Fonte XML modifica detalhes de estruturação da DTD: remoção de informação irrelevante para o domínio tratamento de elementos com aninhamento renomeação de informação

Remoção de Elementos...

Remoção de Elementos...

Tratamento de Aninhamentos

Tratamento de Aninhamentos

Processo de Conversão Documentos XML Usuário Especialista Pré-Processamento DTD Pré-Processada Conversão Esquema Conceitual Preliminar Reestruturação Esquema Conceitual Definitivo Fonte XML gera os conceitos e relacionamentos de um esquema MCC com base: nas definições de elementos e atributos da DTD nos documentos XML

Regras de Conversão

Conversão de Elemento Composto Publication

Conversão de Elemento Simples Year integer Publication análise de docs XML default: string

Análise de Documentos XML Análise de tipo de dado Tipo de dado de Year : integer

Conversão de Componentes Year integer Publication (1,1) (1,N) default: (1,N) regras de cardinalidade

Análise de Documentos XML Análise de cardinalidade inversa Cardinalidade Year  Publication : (1,N)

Conversão de Componentes Year integer Publication (1,1) (1,N) Author University string (1,N) Business string (1,N) (1,1)

Heurística de Herança Year integer Publication (1,1) (1,N) Author University string (1,N) Business string (1,N) (1,1) Book consulta à Thesaurus (Wordnet)

Conversão de Atributos Year integer Publication (1,1) (1,N) Author University string (1,N) Business string (1,N) (1,1) Book Title string (1,1)

Processo de Conversão Documentos XML Usuário Especialista Pré-Processamento DTD Pré-Processada Conversão Esquema Conceitual Preliminar Reestruturação Esquema Conceitual Definitivo Fonte XML realiza validações manuais e automáticas para uma melhor adequação do esquema ao domínio

Validações Manuais Publication Proceedings (1,1) (1,1) Publication Proceedings

Validações Automáticas Publication Proceedings Book Title (1,1) (1,N) (1,1) (1,N) (1,1)(1,N) Book Proceedings Publication

Processo de Conversão Documentos XML Usuário Especialista Pré-Processamento DTD Pré-Processada Conversão Esquema Conceitual Preliminar Reestruturação Esquema Conceitual Definitivo Fonte XML

Roteiro 1.Introdução 2.Abordagem de Integração Proposta 3.Modelo Canônico e Mapeamentos 4.Etapa de Conversão da DTD 5.Etapa de Integração Semântica 6.Considerações Finais

Etapa de Integração Semântica Baseada em regras e algoritmos de unificação Diferencial em relação a outros trabalhos –trata as particularidades de integração de esquemas XML representações textuais e/ou estruturadas representações alternativas

Processo de Integração Semântica Usuário Especialista Clusterização de Sinônimos Clusters de Afinidade Esquema Conceitual 1 Reestruturação Esquema Global Definitivo Esquema Conceitual n Unificação Inclusão de Relações de Herança Esquema Global Preliminar ARTEMIS...

Processo de Integração Semântica Usuário Especialista Clusterização de Sinônimos Clusters de Afinidade Esquema Conceitual 1 Reestruturação Esquema Global Definitivo determinação de equivalências entre conceitos: graus de afinidade agrupamento em clusters Esquema Conceitual n Unificação Inclusão de Relações de Herança Esquema Global Preliminar ARTEMIS...

Processo de Integração Semântica Usuário Especialista Clusterização de Sinônimos Clusters de Afinidade Esquema Conceitual 1 Reestruturação Esquema Global Definitivo Esquema Conceitual n Unificação Inclusão de Relações de Herança Esquema Global Preliminar ARTEMIS... integração semântica de conceitos presentes em um mesmo cluster

Unificação Regras e algoritmos aplicadas a três casos de unificação –Unificação L x L (cluster léxico) –Unificação NL x NL (cluster não-léxico) –Unificação NL x L (cluster misto)

Unificação L x L Number integer Nr integer Number float Number float string Business string Enterprise string (1) (2) Enterprise (3) (1) (2)

Unificação NL x NL Writer Name (1,1) (1,N) (1,1) (1,N) Author Name (1,1) (1,N) (2) (1) University Business Name (1,1) (1,N) (1,1) (1,N) University (1,1) (1,N) (1,1) (0,N) University Business (1,N)(0,1) (1,N)

Unificação NL x L City Publishing-House Manual (1,N) (1,1) Name string (1,N) (1,1) string (1,1) (0,N) (2) Publisher string (1) Publisher (2)  Publishing-House/Name (1) (mapeamento 1:1) City Publishing-House Manual (1,N) (1,1) Name string (1,N) (1,1) string (1,1) (0,N) DTD 2: Publisher

Unificação NL x L Address Street City (1,N) (1,1) Number (1,1) string integer (1,N) (1) Address string (2) Address (2)  Address/Street  Address/Number  Address/City (1) (mapeamento 1:N) Address DetailedAddress TextualAddress TextualAddress Text string (1,N) (1,1) Street (1,N) (1,1) City (1,N) (1,1) string Number (1,1) integer (1,N) string DTD 1: AddressDTD 2: Address

Processo de Integração Semântica Usuário Especialista Clusterização de Sinônimos Clusters de Afinidade Esquema Conceitual 1 Reestruturação Esquema Global Definitivo Esquema Conceitual n Unificação Inclusão de Relações de Herança Esquema Global Preliminar ARTEMIS... consideração de novos relacionamentos de herança relevantes para o domínio

Inclusão de Relações de Herança Publication Title (1,1) string (1,N) Manual (1,1) (1,N) e Publication Title (1,1) string (1,N) Manual (1,1) (1,N) relacionamento relevante?

Processo de Integração Semântica Usuário Especialista Clusterização de Sinônimos Clusters de Afinidade Esquema Conceitual 1 Reestruturação Esquema Global Definitivo Esquema Conceitual n Unificação Inclusão de Relações de Herança Esquema Global Preliminar ARTEMIS... validações manuais e automáticos para uma melhor adequação do esquema global ao domínio

Ajuste de Disjunções Publication Proceedings Book Manual Publication Proceedings Book Manual + Publication Proceedings Book Manual Publication Proceedings Book Manual 

Simplificação do Esquema Publication Title (1,1) string (1,N) Manual (1,1) (1,N) Publication Title (1,1) string (1,N) Manual

Processo de Integração Semântica Usuário Especialista Clusterização de Sinônimos Clusters de Afinidade Esquema Conceitual 1 Reestruturação Esquema Global Definitivo Esquema Conceitual n Unificação Inclusão de Relações de Herança Esquema Global Preliminar ARTEMIS...

Roteiro 1.Introdução 2.Abordagem de Integração Proposta 3.Modelo Canônico e Mapeamentos 4.Etapa de Conversão da DTD 5.Etapa de Integração Semântica 6.Considerações Finais

Contribuições Um processo de conversão de uma DTD para um esquema conceitual Um processo de integração semântica de esquemas XML Uma estratégia de mapeamento baseado no padrão XPath

Trabalhos Relacionados TrabalhoIntegraçãoProcessoModelo Canônico TSIMMISmanualbottom-upgrafo Garlicmanualbottom-upODMG MIXmanualbottom-upDTD DIXSEmanualbottom-upconceitual Jensenmanualbottom-upUML YATmanual-árvore McBrienmanual-grafo Vdovjakmanualtop-downconceitual Xylemesemi-automáticotop-downDTD LSDsemi-automáticotop-downDTD Limsemi-automáticobottom-upgrafo TESEsemi-automáticobottom-upconceitual

Trabalhos Relacionados TrabalhoTécnicas de IntegraçãoIntegração de esquemas XML CUPID análise de informação do esquema análise de nomenclatura análise de estrutura não tratam a integração de representações alternativas de elementos (disjunções) não tratam de forma completa a integração de elementos textuais com estruturados MOMIS TESE análise de informação do esquema análise de nomenclatura análise de estrutura análise de informação de instâncias de instâncias tratam a integração de disjunções disjunções consideram várias consideram várias alternativas para a alternativas para a integração NL x L integração NL x L

Trabalhos Relacionados TrabalhoLimitações de Modelagem ConceitualTESE CUPID não modela representações alternativas de elementos não filtra elementos irrelevantes para o domínio  MOMIS esquema conceitual definido manualmente  Vdokjak esquema conceitual definido manualmente  DIXSE não modela relacionamentos de herança não filtra elementos irrelevantes para o domínio 

Trabalhos Futuros Comparação de esquemas –técnicas de integração baseada em instâncias aprendizado de máquina, PLN Mapeamento –desenvolvimento do módulo processador de consultas do Mediador validação da estratégia de mapeamento –consideração de restrições de integridade Fonte X: Sigmod Record Journal –Journal — Title (Fonte X: [Title = “Sigmod Record”])

Trabalhos Futuros Processo de integração –abstração de esquemas em XML-Schema –consulta a vários Thesauri comparação de termos em diversas línguas –análise de performance dos algoritmos otimização de processamento –realização de mais estudos de caso validação da aplicabilidade das regras e algoritmos –desenvolvimento de um protótipo completo

Publicações Abordagem de integração –“A Method for the Unification of XML Schemata” Mello, R.; Castano, S.; Heuser, C. Information & Software Technology, v.44, n.4, Mar –“A Rule-Based Conversion of a DTD to a Conceptual Schema” Mello, R.; Heuser, C. Proceedings of the XX International Conference on Conceptual Modeling (ER’2001), Yokohama, Japan, Springer-Verlag, Nov –“A Bottom-Up Approach for Integration of XML Sources” Mello, R.; Heuser, C. Proceedings of the International Workshop on Information Integration on the Web (WIIW’2001), Rio de Janeiro, Brazil, Apr 2001.

Publicações Estado da arte –“Dados Semi-Estruturados” Mello R. et. al. Anais do XV Simpósio Brasileiro de Banco de Dados (SBBD’2000) / XIV Simpósio Brasileiro de Engenharia de Software – Mini-cursos e Tutoriais, João Pessoa, Brasil, Out –“Aplicação de Ontologias a Dados Semi- Estruturados” Mello R., Heuser, C. Anais da XXVI Conferencia Latinoamericana de Informática (CLEI’2000), Cidade do México, México, Set, 2000 (ed. eletrônica)

Uma Abordagem Bottom-Up para a Integração Semântica de Esquemas XML Tese de Doutorado por Ronaldo dos Santos Mello Prof. Carlos Alberto Heuser Orientador UFRGS/II - PPGC

ORM x ER ER –dicotomia Entidade-Atributo Author University DTD University Author affiliation ER: name

ORM x ER ORM – somente um construtor de modelagem para representação de informação léxica ORM: Author University DTD

ORM x ER ER –elementos léxicos compartilhados não podem ser modelados como atributos DTD Author Name Company Name ER:

ORM x ER ORM –não há restrição de modelagem para conceitos léxicos compartilhados ORM: Author Name DTD Company