A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

1 Érick de Souza Carvalho Integração de Diferentes Fontes de Dados Aula 09 Instituto Tecnológico de Aeronáutica CE-262 Ontologia e Web Semântica Prof.

Apresentações semelhantes


Apresentação em tema: "1 Érick de Souza Carvalho Integração de Diferentes Fontes de Dados Aula 09 Instituto Tecnológico de Aeronáutica CE-262 Ontologia e Web Semântica Prof."— Transcrição da apresentação:

1 1 Érick de Souza Carvalho Integração de Diferentes Fontes de Dados Aula 09 Instituto Tecnológico de Aeronáutica CE-262 Ontologia e Web Semântica Prof. Dr. José M. Parente de Oliveira

2 Instituto Tecnológico de Aeronáutica CE262_2007_09A Érick de Souza Carvalho 2 Revisão da Aula Anterior Conhecemos as fontes de dados: Memória, Arquivo e Banco de Dados Vimos uma avaliação de Sistemas de Base de Conhecimentos (Knowledge Base Systems -KBS) para grandes bases de dados OWL. KBSs Avaliados: Memory-based systems: OWLJessKB, Memory-based Sesame Systems with persistent storage: Database-based Sesame, DLDB-OWL KBSs Não-avaliados (Descartados): Memory-based Jena, Database-based Jena, KAON, TRIPLE, RACER

3 Instituto Tecnológico de Aeronáutica CE262_2007_09A Érick de Souza Carvalho 3 Integração X Descentralização A Web tradicional é naturalmente descentralizada e distribuída. Logicamente a Web Semântica também é descentralizada e distribuída! Os dados vêm de diferentes ontologias. Integração X Descentralização: Quando falamos em integração, a idéia é trabalhar de forma centralizada, ou seja, pegar os dados que estão distribuídos e integrá-los. Mais usado dentro de uma empresa. Para trabalharmos com uma base de dados descentralizada usamos uma arquitetura P2P com várias bases de dados distribuídas. Mais usado na Internet.

4 Instituto Tecnológico de Aeronáutica CE262_2007_09A Érick de Souza Carvalho 4 Integração de Bases de Dados Temos duas bases separadas que têm algo em comum, ou que tratam de um mesmo domínio e desejamos transformá-las em uma única base. Normalmente vamos fazer a integração de ontologias de domínios similares. Para podermos integrar precisamos conhecer as bases e fazer um mapeamento entre elas. No caso da Web Semântica, precisamos conhecer as ontologias, as correspondências semânticas entre seus elementos e fazer o mapeamento semântico entre elas. Podemos fazer isto manualmente ou usando uma ferramenta

5 Instituto Tecnológico de Aeronáutica CE262_2007_09A Érick de Souza Carvalho 5 Learning to Map Between Ontologies on the Semantic Web Ontologies play a prominent role on the Semantic Web. However, because of the Semantic Web's distributed (de-centrilized) nature, data on it will inevitably come from many different ontologies. Many of these ontologies will describe similar domains, but using different terminologies, and others will have overlapping domains. To integrate data from disparate ontologies, we must know the semantic correspondences between their elements. Information processing across ontologies is not possible without knowing these semantic mappings between their elements.

6 Instituto Tecnológico de Aeronáutica CE262_2007_09A Érick de Souza Carvalho 6 Map Between Ontologies on the Semantic Web The semantic correspondences are in effect the glue that hold the ontologies together into a web of semantics". Without them, the Semantic Web is akin to an electronic version of the Tower of Babel. Manually finding such mappings is tedious, error-prone, and clearly not possible at the Web scale. Hence, the development of tools to assist in the ontology mapping process is crucial to the success of the Semantic Web.

7 Instituto Tecnológico de Aeronáutica CE262_2007_09A Érick de Souza Carvalho 7 GLUE (Ferramenta para o mapeamento ente Ontologias) GLUE is a system that employs machine learning techniques to find and semi-automatically create such mappings. Given two ontologies, for each concept in one ontology GLUE finds the most similar concept in the other ontology. It uses multiple learning strategies, each of which exploits a different type of information either in the data instances or in the taxonomic structure of the ontologies.

8 Instituto Tecnológico de Aeronáutica CE262_2007_09A Érick de Souza Carvalho 8 Integração Semântica de Dados através de Federação de Ontologias A comunidade de Banco de Dados tem conhecimento de métodos para dar conta da integração de bases de dados distribuídas no contexto de federações de Bancos de Dados heterogêneos. A comunidade de Banco de Dados tem considerado ontologias na solução do problema da integração de Banco de Dados. O alinhamento ou merge de ontologias são algumas das propostas conhecidas da comunidade de WEB semântica. É proposto o uso de métodos de merge de ontologias como solução ao problema da construção de uma federação de ontologias como método integrador de fontes de dados. O estudo de caso foi implementado no Protegé

9 Instituto Tecnológico de Aeronáutica CE262_2007_09A Érick de Souza Carvalho 9 Peer Data Management System (PDMS) The Peer Data Management System (PDMS) represents a natural step beyond data integration systems, replacing their single logical schema with an interlinked collection of semantic mappings between peers individual schemas. This is in contrast to data integration systems, which have a centralized mediated schema and administrator, and which, in our experience, impede small, point-to-point collaborations The concept of the peer data management system emphasizes not only an ad-hoc, scalable, distributed peer-to peer computing environment (which is compelling from a distributed systems perspective), but it provides an easily extensible, decentralized environment for sharing data with rich semantics.

10 Instituto Tecnológico de Aeronáutica CE262_2007_09A Érick de Souza Carvalho 10 Referências COLONESE, E.M., Methodology for Integrating the Scenario Databases of Simulation Systems Masters Thesis AFIT/GCS/ENG/99J-03, June 1999 CUNHA, Adilson M., Notas de Aulas – Projeto de Sistemas de Banco de Dados (CE-240), Instituto Tecnológico de Aeronáutica (ITA), 1o Semestre de 2006 DIAS, Sandra Aparecida; MELO, Rubens Nascimento. Integração Semântica de Dados através de Federação de Ontologias. Dissertação de Mestrado - Departamento de Informática, Pontifícia Universidade Católica do Rio de Janeiro, 83p. Rio de Janeiro, 2006 DOAN, A., MADHAVAN, J., DOMINGOS, P., HALEVY, A. Learning to Map between Ontologies on the Semantic Web Computer Science and Engineering University of Washington, Seattle, WA, USA, 2002 KWOK, C. C. T., ETZIONI, O., WELD, D. S., Scaling Question Answering to the Web Computer Science and Engineering University of Washington, USA, 2001

11 Instituto Tecnológico de Aeronáutica CE262_2007_09A Érick de Souza Carvalho 11 Referências (Continuação) GUO, Y., PAN, Z., HELFLIN, J. An Evaluation of Knowledge Base Systems for Large OWL Datasets Computer Science and Engineering Department, Lehigh University, Bethlehem, PA18015, USA, 2004 LOPEZ, V., MOTTA E., UREN V. PowerAqua: Fishing the Semantic Web Knowledge Media Institute & Centre for Research in Computing, The Open University. Walton Hall, Milton Keynes,MK7 6AA, United Kingdom, 2005 RUTLEDGE L., OSSENBRUGGEN J., HARDMAN L. Making RDF Presentable: Integrated Global and Local Semantic Web Browsing Box 94079 NL1090 GB Amsterdam, The Netherlands, 2005 HALEVY, A. Y., IVES Z. G., SUCIU, D., TATARINOV I. Schema Mediation in Peer Data Management Systems University of Washington Seattle, WA, USA, 2004


Carregar ppt "1 Érick de Souza Carvalho Integração de Diferentes Fontes de Dados Aula 09 Instituto Tecnológico de Aeronáutica CE-262 Ontologia e Web Semântica Prof."

Apresentações semelhantes


Anúncios Google