A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Introdução à Web Semântica Ana Maria de C. Moura PRODERJ - RJ

Apresentações semelhantes


Apresentação em tema: "Introdução à Web Semântica Ana Maria de C. Moura PRODERJ - RJ"— Transcrição da apresentação:

1 Introdução à Web Semântica Ana Maria de C. Moura PRODERJ - RJ anamoura@proderj.rj.gov.br

2 A.M Moura - SDMS 2004 2 Sumário A Evolução da Web Pesquisa, Recuperação, Organização e Extração de Recursos na Web A Web Semântica Fundamentos Ontologias Linguagens p/ representação de ontologias Ferramentas e Projetos de Suporte à Web Semântica Conclusão

3 A.M Moura - SDMS 2004 3 Introdução A Web: como tudo começou 1990 – CERN (European Organization for Nuclear Research) Idéia: tornar o conhecimento accessível a todos e de forma amigável WWW Consortium (W3C) - 1994 – Tim Berners-Lee (MIT, INRIA, Keio University) objetivos: dar suporte à evolução da tecnologia da informação: infraestrutura - redes, gráfico, interface encorajar cooperação na indústria: desenvolvimento de interfaces e plataformas padrões Interação humana apenas

4 A.M Moura - SDMS 2004 4 A evolução da Web 1993 Mosaic: 50 sites 1994: primeiras máquinas de busca (webcrawler, wwww - World Wide Web Worm) 1996: US$ 1 bilhão compras na Internet (150 países) 1997: 1 milhão de páginas 1998: 300 mil provedores.... 2004: de 4 bilhões de páginas Web* 945 milhões de usuários * www.google.com

5 A.M Moura - SDMS 2004 5 Gerações Web: rumo à Web semântica 1 a geração TCP/IP ftp, e-mail, Gopher,... pág. html manuais pág.html geradas automatica/ (leitura, browsing, formulários) mecanismos busca conectividade 2 a geração apresentação 3 a geração...... programação (processamento humano) Serviços Web XML WSDL (Web Service Description Language) UDDI (Universal Description, Discovery & Integration) WSFL (Web-Services Flow Language) SOAP (Simple Object Access Protocol) Web Semântica + Serviços Web Tecnologia Inovação

6 A.M Moura - SDMS 2004 6 Problemas na Web Atual Aumento exponencial de publicações na Web 2004: de 4 bilhões de páginas Web 50% a mais de novas páginas a cada ano!! somente 20% estarão acessíveis em 1 ano!!! Somente 62% apresentam contéudo novo [Ntoulas et al 04]

7 A.M Moura - SDMS 2004 7 Problemas na Web Atual Busca da Informação Problema de precisão das atuais ferramentas de pesquisa navegação através de links e uso de pal. chaves p/ busca Problemas p/ identificar, descrever e localizar recursos de forma mais eficiente

8 A.M Moura - SDMS 2004 8 Na Web Atual: Busca de informação Nice pubs in Nice The Old Book 12, R. Victor Hugo The White Swan 3 Av. Hemingway The Horseshoe Nice pubs in Nice The Old Book 12, R. Victor Hugo The White Swan 3 Av. Hemingway The Horseshoe Summary of the novel "The Old Man And The Sea" by Ernest Hemingway This new edition starts with a large historical introduction of the work Summary of the novel "The Old Man And The Sea" by Ernest Hemingway This new edition starts with a large historical introduction of the work Missed Recall Noise Precision

9 A.M Moura - SDMS 2004 9 Pesquisa, Recuperação, Organização e Extração de Recursos na Web Estratégias importantes Mecanismos de busca Bibliotecas digitais Linguagens de consulta Web Mecanismos de extração (wrappers)

10 A.M Moura - SDMS 2004 10 Mecanismos de Busca Busca baseada em pal. chaves ex: Alta Vista, Infoseek, Yahoo, MetaCrawler, Google... Problemas com a recuperação da informação Recuperação (recall) limitada: toda a informação relevante foi localizada? um documento naquele assunto, porém com uma descrição diferente da palavra chave não é recuperada Precisão limitada: quantos documentos são realmente relevantes? um documento de um assunto diferente que utiliza as mesmas palavras é recuperado Relevância: baseada em vetor de palavras é duvidosa PageRank (Google)

11 A.M Moura - SDMS 2004 11 Usam topologia da Web em consultas p/ controlar navegação e obter melhores respostas: navegação e pesquisa WebSQL [Mihaila 96], W3QL[Konopnicki et al.98] WebSQL explora estrutura e topologia do documento semântica clara baseada num modelo de grafo virtual documento(url, titulo,texto,type, lenght,modif) ex: encontre todos os documentos html sobre XML select d.url, d.titulo from Documento d such that d mentions XML where d.type=text.html Linguagens de consulta Web

12 A.M Moura - SDMS 2004 12 Mecanismos de extração baseado em Wrappers Agente de consulta Mediador Wrapper 1 Wrapper 2 Wrapper n BD 2 BD 1 BD n.... lida com usuário lida c/ fontes de informação [Widerhold 1992]

13 A.M Moura - SDMS 2004 13 Mecanismos de extração Programas extratores (Wrappers) Mapeiam páginas Web em um conjunto de objetos organizados sob forma de árvore de modo a extrair informações relevantes Abordagens p/ desenvolvimento de Wrappers [Laender SBBD 2001] Baseadas em contexto Baseadas em conteúdo

14 A.M Moura - SDMS 2004 14 Wrappers – exemplos Contexto W4F [Sahuguet et al, DKE 36(2), 2000] RoadRunner [Crescenzi VLDB 2001] DeBye [Laender et al., DKE, 2002] (modelo de dados - padrões/exemplos p/ extração)...... Conteúdo Ontologia específica de domínio ex: BYU Tool [Embley et al., DKE 31(3),1999] Estrut. doc. HTML

15 A.M Moura - SDMS 2004 15 Problemas na Web Atual (cont) Integração de informações: O site A tem descrição de produtos de software O site B tem preços de material de computação Problema: Combinar produtos e preços. Dificuldade: Como integrar tais informações?

16 A.M Moura - SDMS 2004 16 Enfim, na Web Atual Situação atual: O conteúdo pode ser lido, mas não processado pela máquina Problema: É difícil automatizar processos/serviços na Web Como interoperar informações num ambiente heterogêneo? Como integrar recursos na Web? Um início de solução: Descrever os dados contidos na Web e representá-los de forma conveniente

17 A.M Moura - SDMS 2004 17 O que é Web Semântica? É uma extensão da Web atual que visa dar significado semântico ao conteúdo das páginas Web, criando um ambiente onde agentes de software e usuários possam trabalhar de forma cooperativa [Tim Berners-Lee et al. 2001]

18 A.M Moura - SDMS 2004 18 Web Semântica: Visão W3C A Web Semântica é uma visão: é a idéia de de se ter dados na Web definidos e ligados de uma maneira tal que possam ser usados por máquinas não só com o objetivo de apresentação, mas p/ automação, integração e reuso de dados entre aplicações * *: World Wide Web Consortium: Semantic Web Activity Statement. http://www.w3.org/2001/sw/Activity

19 A.M Moura - SDMS 2004 19 Usando a Web Semântica... The Perfect Storm [Hendler 2001]

20 A.M Moura - SDMS 2004 20 Uso de Agentes Web Acesso a um agente de um servidor geográfico: Obter uma foto satélite dessa região do Atlântico

21 A.M Moura - SDMS 2004 21 Resultado da Consulta Uma imagem satélite obtida ontem às 10 horas da manhã está disponível na Web no endereço http://.... Uma nova imagem satélite que será feita hoje às 10 horas estará disponível por $100 - aperte aqui p/ autorizar a transferência de fundos e obter a imagem (é necessário fornecer um cartão de crédito) Numa situação de emergência um avião de guarda costeira pode ser enviado a qualquer local na área indicada. Nota: você será responsável pelos custos de vôo se a situação não for de emergência (aperte aqui p/ mais informações) Um observador de grande-altitude pode ser enviado até aí em 13 hs. Clique aqui p/ iniciar procedimento (é necessário autorização militar, código e oficial responsável. Caso de abuso resultará em prisão). Um serviço denominado serviço comercial para prover imagens satélites é anunciado para disponibilização em 2004. Mais informações consulte http://....

22 A.M Moura - SDMS 2004 22 Objetivos da Web Semântica Dados científicos: integração entre dados ponteiros para condições experimentais, fontes, algoritmos Comércio Eletrônico significados bem definidos p/ documentos catálogos, preços, taxas, especificações Gerenciamento pessoal de informações: calendários, fotos,.... Plataforma comum p/ manipulação de BDs, inferência, etc. Regras e ontologias Novos desafios: WS- IA

23 A.M Moura - SDMS 2004 23 A Web Semântica requer Capacidade p/ representar e gerenciar conteúdo semântico na Web Como um agente pode aprender o significado de um novo termo a partir de uma especificação formal? Necessidade de formalização (metadados, ontologias) descrição de propriedades e relacionamentos sobre itens; regras, inferência

24 A.M Moura - SDMS 2004 24 A Web Semântica requer (cont.) Integração e interoperabilidade 2 agentes estão semanticamente integrados se puderem comunicar-se entre si com sucesso! Mas é preciso levar em consideração linguagens de representação distintas incompatibilidade de conceitos termos e estilos diferentes de modelagem

25 A.M Moura - SDMS 2004 25 Níveis de semântica Consenso humano Implícito motor: mecanismo que propulsiona energia e faz veículo se locomover Texto descritivo Informal (explícito) (motor tem (superclasses (...)) Semântica explícita elaborada: usada em tempo de execução Semântica processada: usada em tempo de execução (inferência) Formal (p/ humanos) Formal (p/ máquinas) Web [Uschold e Gruninger 2002]

26 A.M Moura - SDMS 2004 26 Semântica Formal p/ Processamento por Máquina O objetivo deste relatório é descrever o funcionamento da máquina XPTO e analisar as suas funcionalidades.... 123 deve ser utilizado na temperatura..... Ontologia Motor (MTO) ( has (superclasses (periferico– mecanico)) (text-def (Serve para....))) (todo has (componentes_ fisicos (cilindro, valvula, pistao)) (funcionalidade(injetar combustivel))) Oba, conheço esta ontologia! motor a gasolina (motor-gasolina has Marcador semântico? (superclasses MTO.motor)) motor a gasolina motor web

27 A.M Moura - SDMS 2004 27 Web atual x Web Semântica

28 A.M Moura - SDMS 2004 28 URI Unicode XML Namespaces Signature Encryption RDF Model & Syntax RDFS Ontology Rules Logic framework Proof Trust Fonte: http://www.w3.org/2002/Talks/04-sweb/slide12-0.html A Visão da Web Semântica pela W3C camada sintática camada de dados camada de ontol. camada de lógica camada de prova camada de validação caract. internac. esquema dado sintática/ correto representação dado/ metadado significado do dado regras intercâmbio entre agentes verdades

29 A.M Moura - SDMS 2004 29 Principles of Distributed Database Systems Ozsu Valduriez Prentice Hall 1999 Data on the Web Abiteboul Buneman Vianu Morgan Kaufmann 1999 XML descreve conteúdo

30 A.M Moura - SDMS 2004 30 Características do XML XML é flexível Meta linguagem Usuários definem suas próprias marcações (tags) Separação nítida entre conteúdo, estrutura e layout stylesheets (XSL) p/ converter em HTML Estrutura documentos sob forma de árvore Estrutura pode refletir algum significado APIs p/ parsers XML (DOM, SAX) Um documento XML pode conter uma descrição opcional de sua gramática (DTD)

31 A.M Moura - SDMS 2004 31 XML para Integração de Dados mediador/wrapper como elemento integrador de visão de fontes de dados BD wrapper mediador - XML wrapper File Web

32 A.M Moura - SDMS 2004 32 Impedance Mismatch Objetos Conceito Objeto Tabelas Relacionais Árvore XML Grafo RDF

33 A.M Moura - SDMS 2004 33 Porém, XML não é suficiente... Vantagem do uso do XML: reutilização do parser e validação do documento; porém, Diferentes possibilidades de expressar um mesmo domínio de discurso, podendo acarretar em ambiguidade de interpretação Livro autor título preço idioma < livro lang= Ingles preco= US$ 60.00 titulo= Principles of Distributed Database Systems autor=Ozsu Valduriez> Principles of Distributed … ….

34 A.M Moura - SDMS 2004 34 Representação de Conhecimento na Web Premissas Conhecimento na Web é distribuído Conhecimento na Web é tendencioso Não existe verdade universal Ambiente propício a discussões Diversificação de usuários; extensibilidade e simplicidade É necessário separar conteúdo de estrutura!! - Resource Description Framework (RDF) - Topic Maps

35 A.M Moura - SDMS 2004 35 Resource Description Format (RDF) Modelo de metadados simples e expressivo: trata dados/metadados de forma uniforme Provê interoperabilidade na Web (XML) Meio de integração entre diferentes padrões de metadados Expressa vocabulários distintos com base em um modelo de dados e sintaxe comuns (XML) Visa processamento por máquina Constituído de: Modelo RDF Sintaxe RDF http://www.w3.org/RDF

36 A.M Moura - SDMS 2004 36 Modelo RDF: estrutura básica Recurso Valor propriedade http://www.ipanema.ime.eb.br/~anamoura/public/metadado.html Ana Maria Documento Valor autora Representação de um documento em RDF Statement sujeito predicado

37 A.M Moura - SDMS 2004 37 RDF http://www.ipanema.ime.eb.br/~anamoura/public/metadado.html Ana Maria Documento Valor dc:creator Metadados Ana Maria metadados dc:subject

38 A.M Moura - SDMS 2004 38 Coleções em RDF http://curso/top.avanc.bd/turma01 bagid rdf:bag / alunos/Andre / alunos/Abilio / alunos/Emerson / alunos/Adriana rdf:type rdf:_1 rdf:_4 ….. rdf: Bag rdf: Seq. rdf: Alt s:constituida_por

39 A.M Moura - SDMS 2004 39 RDF/XML com um Bag http://curso/top.avanc.bd/turma

40 A.M Moura - SDMS 2004 40 RDF Schema (RDFS) RDF define somente o modelo de dados É preciso definir um vocabulário – uma linguagem que permita definir estrutura semântica! RDF schema são recursos Web (têm uri) e podem ser descritos usando o modelo RDF RDFS permite definir propriedades de recursos (título, autor, etc.) e relacionamentos entre essas propriedades

41 A.M Moura - SDMS 2004 41 Primitivas básicas do RDFS Classes básicas Classe raiz rdfs:Resource MetaClass rdfs:Class Literais rdfs:Literal Properties (herda do RDF) rdfs:subclassOf – property ConstraintProperty rdfs:domain rdfs:range rdfs:label, rdfs:comment, etc. rdf:type (instância de)

42 A.M Moura - SDMS 2004 42 Primitivas básicas do RDFS

43 A.M Moura - SDMS 2004 43 Exemplo de aplicação usando o RDF Schema rdfs::Resource rdfs:Class xyz:Veiculo s = rdfs:subClassOf t = rdf:type r= rdfs range d= rdfs domain s t s t t s xyz:VeículoDePassageiro t s xyz:Caminhão t ` marca ` modelo d d literal r r veiculo marca modelo veic.pass caminhao

44 A.M Moura - SDMS 2004 44 Codificando em RDFS

45 A.M Moura - SDMS 2004 45 RDF/RDFS: a interoperabilidade ainda não é plena... Interoperabilidade de recursos a nível: Sintático: um modo padrão para a representação e transporte de metadados Estrutural: representação para modelo de dados distintos especificando como os recursos estão organizados, os tipos e os possíveis valores para cada tipo Semântico: compreensão plena de conteúdo axiomas, mecanismos de inferência Ontologias

46 A.M Moura - SDMS 2004 46 Ontologia lida com a natureza e organização da realidade O que é o ser? Quais são as características comuns a todos os seres? Filosofia (Aristóteles 384-322 aC)

47 A.M Moura - SDMS 2004 47 Ontologia na Ciência da Computação Inteligência Artificial tudo que existe deve poder ser representado por um formalismo Constituída por um vocabulário e um conjunto de declarações, é de fato a base para a comunicação entre humanos e máquinas e/ou agentes

48 A.M Moura - SDMS 2004 48 Ontologia Visa dar significado semântico pleno à informação Tema importante em várias áreas de pesquisa Recuperação da informação (mecanismos de busca) Ontologia Bibliotecas Digitais Web Semântica Comércio eletrônico Process. ling. natural Integração de informação Eng. conhecimento Gerência do conhecimento

49 A.M Moura - SDMS 2004 49 Ontologia A comunicação entre humanos é possível através de palavras/símbolos Mapeamento de palavras/símbolos para coisas é feito de maneira indireta através de relações e conceitos Conceito SímboloCoisa Manga lembra refere-se a significa (referente)

50 A.M Moura - SDMS 2004 50 Quais são os problemas? Pessoas, organização e sistemas de software precisam se integrar, mas... comunicação pobre: diferentes vocabulários, conceitos, estruturas e métodos utilizados de formas diferentes dificuldades de identificar requisitos e conseqüentemente especificar o sistema interoperabilidade potencial p/ reuso e compartilhamento esforço desnecessário, reinventando a roda

51 A.M Moura - SDMS 2004 51 Solução? Reduzir ou eliminar confusão conceitual e teminológica e chegar a um entendimento compartilhado framework unificado base p/ comunicação ( necessidades, ptos de vista) interoperabilidade entre sistemas (tradução entre modelagens, paradigmas, linguagens, ferramentas) Eng. Sistemas reusabilidade: atrib, entidades, relacionam, processos,....; consistência devido à representação formal; especificação (melhor identificação requisitos leva a uma melhor definição do sistema

52 A.M Moura - SDMS 2004 52 Uso de Ontologias Comunicação entre pessoas e organizações Interoperabilidade entre sistemas Reuso consistência (bibl. ontologias) especificação Engenharia de sistemas Terminologia uniforme; reduz ambiguidade Integração de ambientes

53 A.M Moura - SDMS 2004 53 Ontologia: algumas definições [Guarino1996] Uma ontologia é uma especificação explícita de uma conceitualização [Gruber1994] Uma ontologia é uma especificação do nível de conhecimento explícito de uma conceitualização, que pode ser afetado por um domínio e objetivo para os quais foi destinada [van Heijst et al.1996] Uma ontologia são acordos acerca de conceitualizações compartilhadas Uma ontologia é o entendimento compartilhado em algum domínio de interesse Constituída por um vocabulário e um conjunto de declarações, é de fato a base para a comunicação entre humanos e máquinas/agentes

54 A.M Moura - SDMS 2004 54 Ontologia é uma especificação formal explícita de uma conceitualização compartilhada. Gruber, T. R.: A translation approach to portable ontologies, Knowledge Acquisition, 5(2): 199-220, 1993. Conceitualização: modelo abstrato de algum fenômeno do mundo, cujos conceitos foram identificados como relevantes para aquele fenômeno. Explícita: conjunto de conceitos utilizados e as restrições aplicadas são previamente e explicitamente definidas. Formal: espera-se que uma ontologia seja processável por um computador, o que exclui definições em linguagem natural, por exemplo. Compartilhada: descreve um conhecimento consensual, que é utilizado por mais de um indivíduo e aceito por um grupo. [Studer et al. 1998]

55 A.M Moura - SDMS 2004 55 Compartilhamento entendimento sobre conceitos para comunicação entre agentes Filtragem modelos de abstração: uma ontologia define o que deveria ser extraído de um sistema Propriedades de uma ontologia

56 A.M Moura - SDMS 2004 56 Terminológica conj. básico de conceitos e relações. Ex: animal, homem, vegetal,... Assertiva conj. de axiomas: assertivas aplicadas aos conceitos e relações exemplos: solteiro(x) homem(x) casado(x) carnívoro(x) animal(x) come (y) y = 'carne' herbívoro(x) animal(x) come (y) y = 'vegetais' animal(x) carnívoro(x) herbívoro(x) Uma ontologia pode conter informações de naturezas distintas...

57 A.M Moura - SDMS 2004 57 Pragmática camada de ferramentas: informações pragmáticas não incluídas nas demais Ex: conceito classe Como desenhar este conceito?Informação (APIs em IDL...) pragmática Uma ontologia pode conter informações de naturezas distintas...

58 A.M Moura - SDMS 2004 58 Principais componentes de uma ontologia 5 diferentes tipos de componentes: Classes: Conceitos do domínio ou tarefas, geralmente organizados em taxonomias Em uma ontologia universitária: estudante e professor são duas classes Relações: Um tipo de interação entre conceitos do domínio Ex.: subclass-of, is-a

59 A.M Moura - SDMS 2004 59 Principais componentes de uma ontologia (cont.) Funções: Caso especial de relações onde o n-ésimo elemento é único para os n-1 elementos precedentes Ex.: Preço de um carro usado Axiomas: Sentenças verdadeiras Ex.: se um estudante está matriculado na disciplina X e Y é pré-requisito de X, então o aluno já cursou Y Instâncias: Representam elementos específicos Ex: O estudante João é uma instância da classe Estudante

60 A.M Moura - SDMS 2004 60 A Inteligência Abordagem declarativa Descreve um domínio com suas entidades e características, através de fatos declarativos, que não estão dentro dos programas Motores de inferência deduzem novos fatos a partir dos existentes Teorias Fundamentadas em lógica matemática e Sistemas para expressar e manipular conhecimento declarativo de forma tratável e eficiente computacionalmente Formalismo provê Acesso aos fatos (conhecimento) Mecanismo de inferência (ou estratégia de resolução) Estratégias de controle e escalonamento da inferência

61 A.M Moura - SDMS 2004 61 Resumindo... Ontologias visam capturar o conhecimento consensual de forma genérica e formal, de modo a poder ser reutilizado e compartilhado entre aplicações e pessoas

62 A.M Moura - SDMS 2004 62 Ontologias: Metodologias Uschold & King Tove(TOronto Virtual Enterp.) [Grüninger&Fox] Methontology [Fernándes, Gómez-Pérez, Juristo] Ontology101 [Noy & McGuiness] Ontology101 Construção de ontologias baseadas no LAL (Léxico Ampliado da Linguagem) [Leite]

63 A.M Moura - SDMS 2004 63 Criação de Ontologias conforme Ontology101 Conforme [Noy & McGuiness, 2001]: Passo 1: Determine o domínio e o escopo da ontologia Escopo=Questões de Competência (exs) Passo 2: Considere o reuso de ontologias existentes Passo 3: Enumere termos importantes da ontologia Passo 4: Defina as classes e a hierarquia de classes Passo 5: Defina as propriedades das classesslots Passo 6: Defina as restrições das propriedades (facets of the slots) Passo 7: Crie instâncias Ontology Development 101: A Guide to Creating Your First Ontology, http://protege.stanford.edu/publications/ontology_development/ontology101-noy- mcguinness.html http://protege.stanford.edu/publications/ontology_development/ontology101-noy- mcguinness.html

64 A.M Moura - SDMS 2004 64 Evolução de Ontologias catálogo termos/ glossário tesauro (is-a) informal formal is a frameslógica instâncias formais restrições de valor axiomas, relações de disjunção/ conjunção inversa...

65 A.M Moura - SDMS 2004 65 Tesauro de Recuperação (M. Luiza A. Campos – UFF 2002) Unesco através do programa UNISIST define Tesauro de recuperação sob dois aspectos: 1 - Segundo a Estrutura - É um vocabulário controlado e dinâmico de termos relacionados semântica e genericamente cobrindo um domínio específico do conhecimento. 2 - Segundo a Função - É um dispositivo de controle terminológico usado na tradução da linguagem natural dos documentos, dos indexadores ou dos usuários numa linguagem do sistema (linguagem de documentação, linguagem de informação) mais restrita.

66 A.M Moura - SDMS 2004 66 Tesauro Organiza conceitos (e não objetos) num domínio de conhecimento Compilação de palavras e frases através de descritores, mostrando sinônimos, relacionamentos hierárquicos, associativos e de dependência [Matthews et. al 2001]; Organização segue princípios lógicos de identidade, partição, associação É um tipo de: Uma procissão religiosa é um tipo de cortejo É parte de: Uma procissão é parte de uma festa religiosa Controlado por padrões internacionais (ex. ISO2788:1986 [ISO1986] – tesauro p/ único idioma)

67 A.M Moura - SDMS 2004 67 Tesauro Organização do conhecimento: Domínios do saber Processos (ações, fenômenos, estados) Entidades (instituições, nomes, locais, eventos,...) Classes e relações Gênero/espécie ex: Ser humano/ homem Relação partitiva (parte de) ex: corpo humano/ cabeça, tronco, membros... Equivalência ex: tangerina/mexirica Oposição ex: inflação/deflação Relacionamento de associação (material- produto; coisas- processo) ex : Barbeiro / Doença de Chagas; Vacina/Veneno Objetos: Termos: palavras de um idioma (pode ser multi-lingual) ou Conceitos: todo termo refere-se a um único conceito

68 A.M Moura - SDMS 2004 68 Relações num tesauro Tesauro Conceito na hierarquia (C) Termo genérico (TG) Termo genérico partitivo (TGP) Termo específico (TE) Termo específico partitivo (TEP) Termo associado (TA) Equivalência (UP) Uso (U) Nota (N) Exemplo [Gomes90] Parte sistemática Arma Arma de fogo Revolver Canhão... Arma branca Arma branca de choque Adaga estilete Faca Facão Espada Gládio Parte alfabética Arma branca TG Arma TE Arma branca de choque TA Equipamento defesa Arma branca de choque TG Arma branca TE Faca Arma de fogo TG Arma TE Revolver TEP Gatilho...........

69 A.M Moura - SDMS 2004 69

70 A.M Moura - SDMS 2004 70

71 A.M Moura - SDMS 2004 71

72 A.M Moura - SDMS 2004 72 Tesauros - Exemplos Tesauro do Folclore e Cultura Popular (http://www.museudofolclore.com.br/tesauro/) UMLS (Unified Medical Language System) (http://umlsks.nlm.nih.gov/) Terminologia médica (National Library of Medicine) 730.000 conceitos 1.500.000 significados Sinônimos, derivações, relacionamentos entre termos, variantes léxicos... ELSST (European Lexico Social Science Thesaurus) (http://www.limber.rl.ac.uk/External/external.htm) Terminologia p/ Ciências Sociais tesauro multi-linguístico (inglês, frances, espanhol e alemão) 49 hierarquias de termos MS – Access, gerando representação em RDF (interoperabilidade Web) ou uso convencional (listagem alfabética) adotado como padrão europeu na área Extensão p/: finlandês, dinamarquês, norueguês e grego

73 A.M Moura - SDMS 2004 73 Linguagens de Ontologias - Classificação Linguagens de Ontologias tradicionais Lógica de Predicados: Cycl [Lenat&Guha1990] Frame: Ontolingua [Farquhar et al. 1996] F-Logic [Kifer et al. 1995] CML * [Schereiber et al. 1994] OCML ** [Motta E.1999] Lógica descritiva: Loom [McGregor1991] Outras: Telos [Mylopoulos et al.1990] [Corcho&Perez2000] [Su&Ilebrekke2002] * Conceptual Modeling Language ** Operational Conceptual Modeling Language Padrões Web XML RDF XOL SHOE OIL DAML + OIL OWL Linguagens de Ontologias p/ Web Topic Maps

74 A.M Moura - SDMS 2004 74 XOL (XML- based Ontology Exchange Language) [Karp et al.1999] Linguagem p/ intercâmbio de ontologias Primitivas de modelagem e semântica baseada no modelo OKBC Lite (Open Knowledge Base Connectivity) ( ontology, kb, database, dataset) cabeçalho (nome, versão) classes/subclasses slots (propriedades) instâncias Linguagens de Ontologias p/ a Web

75 A.M Moura - SDMS 2004 75 Exemplo Homem Mulher Pessoa tem irmãos tem pai nome data_nasc

76 A.M Moura - SDMS 2004 76 Exemplo de ontologia em XOL Familia - ontologia 1.2 { "@context": "http://schema.org", "@type": "ImageObject", "contentUrl": "http://images.slideplayer.com.br/291470/1/slides/slide_75.jpg", "name": "A.M Moura - SDMS 2004 76 Exemplo de ontologia em XOL Familia - ontologia 1.2

77 A.M Moura - SDMS 2004 77 XOL – Exemplo arquivo XOL (cont) tem_ irmaos...... pessoa homem tem_pai...... pessoa homem pai_de Pedro homem data_nasc 10/09/1970 Instâncias

78 A.M Moura - SDMS 2004 78 XOL – Exemplo arquivo XOL (cont) tem_pai Paulo Paulo homem data_nasc 15/01/1950 pai-de Pedro Observe relacionamentos inversos!!

79 A.M Moura - SDMS 2004 79 Linguagens de Ontologias p/ a Web SHOE (Simple HTML Ontology Extensions) [Luke&Heflin2000] Extensão do HTML Definição de ontologias Provê definição de regras (cláusulas Horn) Fazer anotações em páginas html a partir de propriedades de uma ou mais ontologias

80 A.M Moura - SDMS 2004 80 SHOE - Exemplo Criando uma ontologia Arv.Genealogica > raiz Relações Relacionamentos

81 A.M Moura - SDMS 2004 81 SHOE - Exemplo Criando axiomas { "@context": "http://schema.org", "@type": "ImageObject", "contentUrl": "http://images.slideplayer.com.br/291470/1/slides/slide_80.jpg", "name": "A.M Moura - SDMS 2004 81 SHOE - Exemplo Criando axiomas

82 A.M Moura - SDMS 2004 82 SHOE - Exemplo Criando anotações em págs. HTML....... Minha home-page Sou Ana Maria Moura. Antes de mais nada apresento-lhes minha familia. Este eh meu pai tem pai É necessario no entanto especificar a ontologia na qual me baseio É preciso também instanciar valores

83 A.M Moura - SDMS 2004 83 Linguagens de Ontologias p/ a Web OIL (Ontology Inference Layer) (http://www.ontoknowledge.org/oil/) OIL Description Logics (DL) (Semântica formal & Inferência) Sistemas Baseados em Frames (Modelagem epistemológica, Primitivas) Linguagens Web: XML/RDF

84 A.M Moura - SDMS 2004 84 ontology-container title Exemplo - Ontologia creator Ana Maria Moura subject exemplo OIL language Português... ontology-definitions class-def pessoa classe slot-def motorista slot-def idade slot-def tem-pai inverse e-filho_de OIL - Exemplo class-def motorista subclass–of pessoa slot- constraint idade value-type (min18) class-def homem subclass–of pessoa class-def mulher subclass–of pessoa, not homem slot-constraint tem-pai has-value homem max-cardinality 1 elem. DC propriedades de Pessoa conjs. não disjuntos

85 A.M Moura - SDMS 2004 85 OIL como extensão do RDFS linguagem de ontologia OIL é definida em RDFS qq agente RDF/RDFS pode processar instâncias OIL agentes OIL podem explorar semântica e inferência rdfs:Resource oil:Classexpression oil:ConstraintResource oil:rdf:Property rdfs:Classoil:AND oil:OR oil:NOT oil:SlotConstraint oil:TransitiveProperty oil:SymmetricProperty oil:ReflexiveProperty oil:NumberRestrictionoil:ValueTypeoil:HasValue oil:MinCardinality oil:Cardinality oil:MaxCardinality oil:ClassType oil:PrimitiveClass oil:DefineClass [Maedche &Staab, 2002]

86 A.M Moura - SDMS 2004 86 DAML (DARPA Agent Markup Language) (http://www.daml.org) iniciativa da agência DARPA (Defense Advanced Research Projects Agency): objetivo: linguagem universal de marcação p/ Web Semântica: rica p/ representar ontologias; suporte a agentes desenvolver ferramentas gratuitas; disponibilizar conteúdo significativo a ser manipulado por essas ferramentas DAML + OIL (embutidos em RDF/RDFS) Linguagem p/ representação de ontologias: W3C Estendendo o OIL

87 A.M Moura - SDMS 2004 87 DAML + OIL Amplia número de propriedades aos axiomas: intersection of union of disjointUnion of same as one of..... RDF/RDFS

88 A.M Moura - SDMS 2004 88 ........ DAML + OIL importando vocabulários Definindo Classes/ Subclasses

89 A.M Moura - SDMS 2004 89 DAML +OIL – uso de restrições Coleção disjunta...... Toda pessoa só tem 1 pai Relacionamento irmão Relacionamento inverso pai/filho Pessoa pode ter vários irmãos

90 A.M Moura - SDMS 2004 90 Comparando linguagens RDF(S)OIL DAML+OIL XOLSHOEXTM (1) Poder de expressividade media - media +media media + (2) N 0 construtores pequeno medio -medio pequeno med (3) Mecanismos de abstração cla,gen agre,ass cla,gen agre,ass cla,gen agre,ass cla,gen agre,ass cla,gen agre,ass cla,gen ag,ass (4) Axiomas nãosim nãosimnão (5) Inferência nãosim nãosimnão (6) Checagem de restrições fraca m.fracafraca- Obs: (1): media -: conj. limitado de propriedades (2): agreg: somente entre classes; disjunção somente em OIL, DAML+OIL e TM (4): tem como base LPO: OIL e DAML+OIL permitem definir propr. algébr.de relações(transit., simetria, negação, etc.) (6): fraca - : association templates- permite especificar um conj. de restrições de um tipo (estendido de [Su e Ilebrekke 2002], [Perez e Corcho 2002])

91 A.M Moura - SDMS 2004 91 Ontology Web Language (OWL) http://www.w3.org/2004/OWL / revisão da DAML+OIL OWL faz uso de URIs para nomeação padrão recomendado pela W3C -10/03/04.URIs Características: compartilhamento e interoperabilidade (ontologias como objetos) extensibilidade (reutilização de termos) metadados versionamento (evolução) axiomas (oneof/disjunção, subclasse,sameclassas) conj de classes e propriedades primitivas tipos de dados simples e complexos, equivalência de classes e propriedades (transitividade,inversa,simetria, união, intercessão, sameproperty/sameclass/as...) detecção de inconsistências (cardinalidades min/max) compatibilidade com outros padrões.....

92 A.M Moura - SDMS 2004 92 OWL OWL Lite: hierarquia e características simples de restrição. Ex: valores de cardinalidade limitados a 0 e 1; OWL DL: maior expressividade sem perda de completeza computacional e decidibilidade dos sistemas. Inclui todos os construtores do OWL; OWL Full: nível máximo de expressividade e liberdade sintática do RDF sem garantia computacional. Ex: uma classe pode ser tratada simultaneamente como uma coleção de elementos individuais e como um elemento individual. Não existe sw capaz de processar todas as características da linguagem.

93 A.M Moura - SDMS 2004 93 OWL-DL (Exemplo)

94 A.M Moura - SDMS 2004 94 Propriedades OWL

95 A.M Moura - SDMS 2004 95 OWL-DL (Outro exemplo)

96 A.M Moura - SDMS 2004 96 A magherita pizza kind of pizza and has has, amongst other things, Mozzarella and Tomato toppings

97 A.M Moura - SDMS 2004 97 Ferramentas de suporte a ontologias Principais funcionalidades: Permitir o desenvolvimento de ontologias a nível de: criação, visualização, dedução, navegação, edição, integração, compartilhamento, reuso,... Exemplos: Ontolingua [Farquhar et al. 1996] Ontobroker (ontobroker.semanticweb.org) Protegé-2000 [Noy et al. 2000] OntoEdit [A.Maedche et al. 2000] Kaon [Handschuh et al. 2001] WebOnto (http://kmi.open.ac.uk/projects/ocml/) WebODE [Arprez et al. 2001] OilEdit [Bechhofer et al. 2001] DOGMA [MEERSMAN et.al, 2002]...

98 A.M Moura - SDMS 2004 98 OntoEdit Características Univ. Karlsruhe, Alemanha projeto e manutenção de ontologias ontologias multilingual modelo de representação baseado em frames não suporta reuso

99 A.M Moura - SDMS 2004 99 OntoEdit

100 A.M Moura - SDMS 2004 100 Protégé Características Univ. Standford, depto de Informática Médica (4 a versão) desenvolvimento e manutenção de sistemas de base de conhecimento modelo de representação baseado em frames, compatível c/ OKBC exporta representação em RDFS plugin para criação de ontologias em OWL

101 A.M Moura - SDMS 2004 101 Protégé

102 A.M Moura - SDMS 2004 102 KAON: The Ka rlsruhe On tology and Semantic Web Infrastructure Características Univ. Karlsruhe, Alemanha baseada na arquitetura de multi-camadas de Tim Berners- Lee conj. de ferramentas que permite a criação, edição, manutenção, dedução e compartilhamento de ontologias uso de DAML+OIL e Frame-Logic Apis p/ RDF, OWL Lógica descritiva a partir de uma ontologia OWL/DL

103 A.M Moura - SDMS 2004 103 KAON

104 A.M Moura - SDMS 2004 104 Avaliação de Ontologias OntoClean [Guarino,Welty 2002] metodologia independente de domínio que provê um acompanhamento sobre quais decisões ontológicas devem ser tomadas e como essas podem ser avaliadas. Exemplo: classe água – instância de água? classe oceano: oceano Atlântico, instância de oceano (todo) é correto dizer que oceano é subclasse de água?

105 A.M Moura - SDMS 2004 105 OntoClean a cada propriedade (classe) é atribuída uma meta- propriedade que descreve seu comportamento em relação a noções ontológicas (rigidez, por ex.); benefícios: validação de taxonomias estrutura básica da ontologia (propriedades rígidas) facilidade de integração de ontologias descoberta do uso inconsistente do conceito de subclasse (subsumption)

106 A.M Moura - SDMS 2004 106 Processos Produtos Recursos A verdadeira Integração na Web Semântica CO mapeamento manual CO: conteúdo ontológico (Web Services)

107 A.M Moura - SDMS 2004 107 Alguns projetos em andamento Kaon (Univ. Karlsruhe) CREAM (framework p/ marcação de páginas) EDUTELLA ( Annotating Resources P2P- semanticweb2002) SWWS (Semantic Web Enabled Web Services - Univ. Karlsruhe & Amsterdã) Harmonise (Interoperability in Tourism - Univ. Karlsruhe ) Ontologging (Multiple Ontologies & Ontology Evolution - Univ. Karlsruhe ) OntoShare (Btexact Technologies- semanticweb2002) Haystack (MIT AI Laboratory - semanticweb2002) Wonderweb (ontology infrastructure for the SW) OntoWeb (ontology-based information exchange for knowledge management and E-commerce) SWAP (P2P e ontologias Univ. Karlsruhe) http://swap.semanticweb.org/public/theproject.htm Semantic web services: http://dip.semanticweb.org/http://dip.semanticweb.org/ ROSA ( repositório de objetos de aprendizagem com acesso semântico) Projetos Univ. Karlsruhe http://www.aifb.uni- karlsruhe.de/Forschungsgruppen/WBS/englishhttp://www.aifb.uni- karlsruhe.de/Forschungsgruppen/WBS/english.... Univ. Amsterdã

108 A.M Moura - SDMS 2004 108 Conclusões Grandes esforços na concepção de tecnologias: padrões, linguagens, ferramentas Ontologia é a base p/ a Web Semântica A Web semântica representa grandes desafios: Requer maior processamento de semântica formal menor esforço no desenvolvimento de aplicações na Web Aprendizado de ontologias (ontology learning) processo semi-automático de suporte à engenharia de ontologias (extração, reuso, evolução, interoperabilidade e gerenciamento) OL Descoberta conhecimento Engenharia ontologias

109 A.M Moura - SDMS 2004 109 Questões em andamento Evolução de ontologias Uso de múltiplas ontologias Ontologias e multimídia Absorção de dimensões culturais: acesso ao conhecimento a níveis local, regional, nacional e internacional

110 A.M Moura - SDMS 2004 110 Alguns eventos recentes e/ou futuros relevantes WWW04: 13th World Wide Web Conference N. York, 17-22 Maio 2004 http://www2004.org/ ISWC2004: International Semantic Web Conference 7-11 Novembro 2004, Hiroshima, Japan http://iswc2004.semanticweb.org/ WWW2005: International WWW Conference 10-14 Maio 2005, Chiba, Japan http://www.www2005.org Semantic Web Challenge: Resultados ICWE 2005: Int Conference on Web Engineering 25-29 July 2005 Sydney, Australia

111 A.M Moura - SDMS 2004 111 URLs Interessantes URLs Essenciais: World Wide Web Consortium (W3C) http://www.w3.org Semantic Web: http://www.w3.org/2001/sw Outras URLs: OWL Web Ontology Language: http://www.w3.org/TR/owl-features/ Tutorial Costello: lists.oasis-open.org/archives/ uddi- spec/200401/ppt00000.ppt Portal de Iniciativas na Web Semântica: http://www.semanticweb.org Repositório de Projetos e Recursos para a Web Semântica http://semwebcentral.org Ferramenta de Edição de Ontologias Protégé: http://protege.stanford.edu/ Ambiente de Implementação: http://sesame.aidministrator.nl/ OOHDM e SHDM (PUC-Rio): http://www.oohdm.inf.puc-rio.br:8668 (Dave Beckett´s (RDF) Resource Guide) http://www.ilrt.bris.ac.uk/discovery/rdf/resources/

112 A.M Moura - SDMS 2004 112

113 A.M Moura - SDMS 2004 113 Referências [Arprez et al 2001]Arprez J.C., Corcho O., Fernandez-Lopez M.,G. Perez A. A Scalable Workbench for Ontological Engineering. 1st Int. Conf. on Knowldege Capture, Canda 2001. [Bechhofer et al. 2001]S. Bechhofer, I.Goble, C. Horrocks. Daml+oil is not enough. First Semantic Web Working Symposium (SWWWS01), California, EU, 2001, (http:oiled.man.ac.uk/). [Bézivin 1998]J. Bézivin. Whos Afraid of Ontologies?http://www.metamodel.com/oopsla98- ccdif-workshop/bezivin1/. [Corcho,Perez2000]O. Corcho, A., Gómez-Pérez.. A Roadmap to Ontology Specification Languages. Proc of EKAW00, France, 2000. (http://delicias.dia.fi.upm.es/articulos/ocorcho/ekaw2000-corcho.pdf. [DOGMA]Background of DOGMA Ontology Research. Disponível em: http://www.starlab.vub.ac.be/research/dogmabody.htm. Acessado em: abril 2003. http://www.starlab.vub.ac.be/research/dogmabody.htm [Farquhar et al. 1996]Farquhar A., Fikes R. Rice J. The Ontolingua Server: A tool for Collaborative Ontology Construction. Proc of KWA96. Banff, Canada 1996. [Gomes 1990]Gomes, H.E. Manual de Elaboração de Tesauros Monolíngues, CNPq, 1990 [Gruber 1994]Gruber T. Toward Principles for the Design of Ontologies Used for Knowledge Sharing. IJHCS, 43(5/6): 907-928. [Guarino 1996]N. Guarino. Understanding, Building, and Using Ontologies, 1996. http://ksi.cpsc.ucalgary.ca/KAW/KAW96/guarino/guarino.html. [Guarino,Welty 2002]N. Guarino, C.Welty. Evaluating ontological decisions with OntoClean. Comm. of the ACM(2):61-65(2002).

114 A.M Moura - SDMS 2004 114 [Handschuh et al. 2001]S. Handschuh A. Maedche, L. Stojanovic et al. Kaon- The Karlsruhe Ontology and Semantic Web Infrastructure, (http://kaon.semanticweb.org/)./ [Hendler 2001]J. Hendler. Agents and the Semantic Web, IEEE Intelligent Systems, março/abril/2001. [ISO27881986]Documentation – Guidelines for the establishment and development of monolingual thesauri 2nd ed, 1986. [Karp et al. 1999]R. Karp, V.Chaudri, J. Thomere. XOL: an XML-Based Ontology Exchange Language. http://www.ai.r.sri.com/pkarp/xol, 1999. [Kifer et al. 1995]Kifer M., Lausen G. Wu J. Logical Foundations of Object-Oriented and Frame- Based Languages. Journal of the ACM 1995. [Konopnicki et al.1998]D. Konopnicki, O.Shmueli. Information Gathering in the World Wide Web: the W3QL Query Language and W3QS System. Israel Institue of Technology, 1998. [Lenat&Guha 1990]D.B.Lenat, R.V.Guha. Building large knowledge-based systems. Representation and Inference in the yc Project. Addison-Wesley, Readings, Massachusetts. [Luke,Heflin 2000]S. Luke, J.Heflin. Shoe 1.01 proposed specification, shoe project. http://www.csumd.edu/projects/plus/SHOE/spec.html, abril 2000. [A.Maedche et al 2000]A.Maedche H.P. Schnurr, et al. representation language-neutral modeling of ontologies. Workshop Modellieung 2000, St. Goar, Alemanha, 2000. [Maedche,Staab, 2002]A. Maedche S.Staab. Ontologies: Representation, Engineering, Learning and Application, ECAI 2002. [Matthews et. al 2001]B. Matthews,K. Miller, M.Wilson. A Thesaurus Interchange Format in RDF, 2001 (http://www.limber.rl.ac.uk/External/SW_conf_thes_paper.htm) [McGregor 1991]McGregor R. Inside the LOOM classifier. SIGART bulletin. Vol.2(3):70-76, jun 1991.

115 A.M Moura - SDMS 2004 115 [Meersman et al 2002 [Mihaila 1996] Meersman, R. et al. Data Modelling Versus Ontology Engineering. SIGMOD Records vol 31, no 4, pg. 12-17, dez 2002. Disponível em: http://www.acm.org/sigmod/record/issues/0212/SPECIAL/2.Meersman.pdf. Acessado em: abril 2003. http://www.acm.org/sigmod/record/issues/0212/SPECIAL/2.Meersman.pdf G.Mhaila. WebSQL- An SQL-like Query Language for the WWW. http://www.cs.toronto.edu/~websql [Motta E. 1999]Motta E. Reusable Componentsfor Knowledge Modeling. IOS Press. Amsterdam 1999. [Mylopoulos et al. 1990] J. Mylopoulos, A. Borgida et al. Telos: Representing knowledge about information systems. Information Systems, 8(4):325-362, 1990. [Noy et al. 2000]N.F.Noy, R.W.Fergerson, M.Musen. The Knowledge model of Protégé-Combining interoperability and flexibility. Proc. do EKAW00), LNCS 1937, pp. 17-32, Springer, 2000, (http:www.smi.stanford.edu/projects/protege/). [Ntoulas et al 2004] [Perez,Corcho 2002] A. Ntoulas, J. Cho, C. Olston, WWW2004, N. York, USA, May 2004. A. Gómez-Pérez, O. Corcho. Ontology Languages for the Semantic Web. IEEE Intelligent Systems, jan/fev 2002 [Schereiber et al. 1994] A. Schereiber, B. Wielinga et al. CML: the commonkads conceptual modeling language, EKAW94. [Su, Ilebrekke 2002] X. Su, L. Ilebrekke. A Comparative Study of Ontology Languages and Tools. CAISE 02, Toronto, Canada, Maio 2002. [Tim Berners-Lee et al 2001 ] T. Berners-Lee, J. Hendler, O. Lassila. The Semantic Web. Scientific American, maio, 2001.,(http://www.scientificamerian.com/2001/0501issue/0501berners- lee.html).

116 A.M Moura - SDMS 2004 116 [Uschold e Gruninger 2002] M. Uschold e M. Gruninger. Creating Semantically Integrated Communities on the WWW. Semantic Web Workshop, Havai, 2002. [Van Heijst et al 1996] Van HeijstG. Schreiber A.T., Wielinga B.J. 1996. IJHCS, 43(5/6). Widerhold 1992][Wiederhold, G.. Mediators in the Architectute of Future Information Systems. IEEE Computer Society Press, p. 38-49, Março 1992.


Carregar ppt "Introdução à Web Semântica Ana Maria de C. Moura PRODERJ - RJ"

Apresentações semelhantes


Anúncios Google