Aplicação de XML Web Semântica Tópicos Avançados em Bancos de Dados II Paulo José Azevedo Ferreira UNIRIO - 2005
XML: Web Semântica Problema da web: busca “Um dos principais problemas da Web atual é a recuperação da informação contida nela. Isso acontece porque essa informação não está estruturada nem segue nenhum padrão, sendo que a única preocupação é estética, ou seja, que essa informação esteja organizada em páginas feitas para humanos entenderem. Mesmo as melhores ferramentas atuais de busca na Web (como o Google e o Altavista) não são completamente capazes de identificar quais páginas satisfazem a consulta que o usuário faz, trazendo, junto com bons resultados, uma grande quantidade de páginas sem nenhuma ligação com a informação esperada”. (George Henrique Silva. Construção de Agentes Inteligentes para a Web semântica. Instituto de Matemática e Estatística, USP)
XML: Web Semântica Solução Uma forma de classificar, rotular, definir, integrar e procurar tudo que existe na web, que é um grande repositório de informações. Este é o conceito de web semântica, uma web em que seus componentes (recursos) possuam significado e possam ser melhor entendidos por mecanismos automáticos, permitindo métodos de busca mais eficazes e complexos.
XML: Web Semântica Padrões Alguns padrões foram definidos para permitir esse processo de representação de dados na web. Como XML e linguagens derivadas já são largamente utilizadas para troca de informações na web, foram criadas extensões do padrão XML. Estas extensões geraram dentre outros, os seguintes padrões, que discutirei a seguir: RDF graph data model RDF schema OWL RDF Data Access
XML: Web Semântica RDF Graph Data Model Trinca RDF Uma trinca RDF é a forma de representação de recursos e seus atibutos no modelo RDF. Sujeito Predicado Objeto
XML: Web Semântica RDF Graph Data Model Exemplo de grafo RDF http://www.uniriotec.br/~paulo.ferreira Creator Paulo José
XML: Web Semântica RDF Graph Data Model Exemplo de arquivo RDF <?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:s="http://description.org/schema/"> <rdf:Description about="http://www.uniriotec.br/~paulo.ferreira"> <s:Creator>Paulo José</s:Creator> </rdf:Description> </rdf:RDF>
XML: Web Semântica RDF Schema O RDF Schema é uma linguagem de descrição de vocabulários. Através dela podemos definir classes, subclasses, atributos, relacionamentos, agrupamentos e outros com os elementos de uma trinca RDF. Por exemplo, poderíamos definir que a propriedade autor está no domínio de um documento .
XML: Web Semântica Ontology Web Language OWL é utilizado para permitir que as informações contidas nos documentos sejam processadas por aplicações. OWL pode ser usada para representar significado de termos e relações entre esses termos. OWL amplia a descrição do vocabulário, permitindo descrições como: Nada pode ser ao mesmo tempo um Documento e uma Pessoa. Avô e Neto são inversos. AlunoUnirio é uma Pessoa cuja UniversidadeHP é http://www.unirio.br Uma Pessoa só pode ter um Pai.
XML: Web Semântica OWL: Características Permite inferência nos dados Permite detecção automática de contradições Provê mecanismos para mesclagem complexa de dados Dentre outras A última característica é uma das principais e não deve ser subestimada.
XML: Web Semântica DataAccess: SPARQL Através de uma linguagem de consulta a trincas RDF, como a SPARQL podemos: Extrair informações sobre valores de atributos, etc. Extrair subgrafos RDF. Construir novos grafos RDF baseados nos resultados de consultas.
XML: Web Semântica DataAccess: SPARQL Exemplo de consulta Dados: <http://ex/livro1> <http://ex/titulo> "Tutorial WS". Consulta: SELECT ?titulo WHERE (<http://ex/livro1> <http://ex/titulo> ?titulo ) Resultado: titulo Tutorial WS