Franklin de Souza Ramalho Web Semântica Franklin de Souza Ramalho DSC-CCT-UFCG fsr@cin.ufpe.br http://www.cin.ufpe.br/~fsr Franklin Ramalho DSC-CCT-UFCG
O que será abordado? Motivação Estudo de caso: engenhos de busca Web Semântica Introdução Arquitetura Ferramentas Aplicações Considerações Finais Franklin Ramalho DSC-CCT-UFCG
Motivação “WWW: espaço onde a informação tem um significado bem definido, facilitando a cooperação entre pessoas e agentes computacionais” (Tim Berners Lee) Enfoque da Web atual é na comunicação humana Visão de Berners Lee ainda não foi alcançada Franklin Ramalho DSC-CCT-UFCG
Motivação Páginas Web atuais: HTML HTML Define apenas elementos de apresentação de texto e elementos gráficos Não agrega nenhuma semântica aos dados Dados apresentados em linguagem natural Não possui flexibilidade Franklin Ramalho DSC-CCT-UFCG
Motivação Franklin Ramalho DSC-CCT-UFCG
Motivação <meta NAME="Author" CONTENT="Jacques Robin"> <meta NAME="Description" CONTENT="Personal HOme-page of Jacques Robin professor"> … <h3><font face="Arial">Research Interests</font></h3> <ul> <li> Artificial Intelligence </li> <li> Multi-Agent Systems </li> <li> Computational Linguistics </li> <li> NLP </li> <li> Hypertext Generation </li> <li> Intelligent Databases </li> <li> Logic Programming </li> <li>Data Warehousing and OLAP</li> </ul> Franklin Ramalho DSC-CCT-UFCG
Motivação Dificuldade por parte dos agentes computacionais em tratar a informação na Web Recuperação de Informação (engenhos de busca) Comércio eletrônico Integração da Informação Chat-Bots Web Services Comunicação entre agentes … Franklin Ramalho DSC-CCT-UFCG
Estudo de Caso: o problema dos Engenhos de Busca Busca baseada em palavras-chave Robôs realizam download das páginas Web Indexadores extraem termos chaves das páginas Interface de consulta recebe termos que são comparados com a base de termos indexados Franklin Ramalho DSC-CCT-UFCG
Estudo de Caso: o problema dos Engenhos de Busca Baixa precisão Baixa Cobertura Franklin Ramalho DSC-CCT-UFCG
Estudo de Caso: o problema dos Engenhos de Busca Como coletar a informação desejada precisamente? Como coletar informação distribuída? Como coletar informação implícita? Como realizar consultas sofisticadas? Como diminuir o esforço humano? Franklin Ramalho DSC-CCT-UFCG
Web Semântica Franklin Ramalho DSC-CCT-UFCG
Web Semântica Extensão da Web atual Informação estruturada e com semântica bem definida Agentes computacionais capazes de processar e entender os dados Facilita a automação, integração e distribuição dos dados Visão de Tim Berners Lee é alcançada: Cooperação entre pessoas e agentes computacionais Franklin Ramalho DSC-CCT-UFCG
Arquitetura Web Semântica Camada Lógica Regras de Inferência Ontologia Engenho de Busca … E-commerce Web Semântica Camada Lógica Regras de Inferência Ontologia Ontologia Ontologia Camada de Esquema Camada de Estrutura Dados Franklin Ramalho DSC-CCT-UFCG
Camada de Estrutura Responsável por estruturar os dados e definir seu significado Tecnologia já vinha sendo estudada há algum tempo por pesquisadores de IA (LOOM, LISP, etc) Sistemas centralizados Limitação das questões a serem colocadas Estas limitações não são incorporadas na Web Semântica Tecnologias atuais: XML e RDF Franklin Ramalho DSC-CCT-UFCG
XML (eXtensible Markup Language) Meta-linguagem de editoração Baseada em rótulos que descrevem a estrutura do documento Separação entre rótulos de descrição e apresentação do conteúdo Baseado no modelo de árvore XML é texto Franklin Ramalho DSC-CCT-UFCG
XML <FirstName>Jacques</FirstName> <LastName>Robin</LastName> <Email>jr@cin.ufpe.br</Email> … <Research_Topic> Artificial Intelligence </Research_Topic> <Research_Topic> Multi-Agent Systems </Research_Topic> <Research_Topic> Computational Linguistics </Research_Topic> <Research_Topic> NLP </Research_Topic> <Research_Topic> Hypertext Generation </Research_Topic> <Research_Topic> Intelligent Databases </Research_Topic> <Research_Topic> Data Warehousing and OLAP </Research_Topic> Franklin Ramalho DSC-CCT-UFCG
RDF (Resource Definition Framework) Modelo para descrever recursos Baseado em um modelo de grafo no lugar de árvore Sintaxe: (Sujeito, Predicado, Objeto) Usa XML como sintaxe Melhora a descoberta, o acesso e o gerenciamento das informações da Web Franklin Ramalho DSC-CCT-UFCG
RDF http://www.cin.ufpe.br Jacques Robin Creator Professor 02-05-2002 http://www.cin.ufpe.br/~jr Date Description Personal home-page … Franklin Ramalho DSC-CCT-UFCG
RDF <rdf:RDF xmlns:rdf=http://www.w3.org/1999/02/22-rdf-syntax-ns# xmlns:dc=http://pur1.org/metadata/dublin_core# > <rdf:Description about=http://www.cin.ufpe.br/~jr> <dc:Creator>Jacques Robin</dc:Creator> <dc:Date>05-02-2002</dc:Date> <dc:Description>Personal home-page …</dc:Description> <Professor rdf:resource=“http://www.cin.ufpe.br”/> </rdf:Description> </rdf:RDF> Franklin Ramalho DSC-CCT-UFCG
Arquitetura Web Semântica Camada Lógica Regras de Inferência Camada de Engenho de Busca … E-commerce Web Semântica Camada Lógica Regras de Inferência Ontologia Camada de Esquema Camada de Estrutura Dados Franklin Ramalho DSC-CCT-UFCG
Camada de Esquema Responsável por definir relações entre os dados Ontologia: “Entendimento comum e compartilhado de um domínio” Documento que define formalmente a relação entre termos de um domínio Uso de ontologias em páginas web torna mais simples a resolução de indefinição ou conflito de terminologia Franklin Ramalho DSC-CCT-UFCG
Camada de Esquema Elementos de uma ontologia Hierarquia de conceitos Relações Restrições de Integridade Instâncias dos conceitos Não existe ainda nenhuma linguagem que contemple todos os conceitos de uma ontologia Franklin Ramalho DSC-CCT-UFCG
Camada de Esquema Ontologia Person Employee :: Person AcademicStaff :: Employee Researcher :: AcademicStaff PhDStudent :: Researcher Employee[ affiliation : Organization; worksAtProject : Project; headOf : Project; headOfGroup : ResearchGroup]. AcademicStaff[ supervises :PhDStudent]. Researcher[ researchInterest : ResearchTopic; memberOf : ResearchGroup; cooperatesWith : Researcher]. Franklin Ramalho DSC-CCT-UFCG
Camada de Esquema Formalismos para representar ontologias Ontolingua, LOOM, Flogic, KIF XMLS RDFS DAML OIL DAML-OIL OWL Franklin Ramalho DSC-CCT-UFCG
Camada de Esquema <rdfs:Class rdf:ID="Researcher"> <rdfs:subClassOf rdf:resource="#AcademicStaff"/> <daml:Restriction daml:mincardinality="n" daml:maxcardinality="1"> <daml:onProperty rdf:resource="#researchInterest"/> <daml:toClass rdf:resource="#ResearchTopic"/> </daml:Restriction> </rdfs:subClassOf> </rdfs:Class> <daml:ObjectProperty rdf:ID=“supervises”> <caml:inversOf rdf:resource=“supervisor”/> </daml:ObjectProperty> Franklin Ramalho DSC-CCT-UFCG
Arquitetura Web Semântica Regras de Inferência Camada Lógica Ontologia Engenho de Busca … E-commerce Web Semântica Regras de Inferência Camada Lógica Ontologia Ontologia Ontologia Camada de Esquema Camada de Estrutura Dados Franklin Ramalho DSC-CCT-UFCG
Camada de Lógica Responsável por definir mecanismos para fazer inferência sobre os dados Composta por um conjunto de regras de inferência Regras de inferência fornecem aos agentes computacionais o poder de raciocinar sobre as estruturas de dados RuleML, DAML-L, XRML, RFML, URML, AORML … Franklin Ramalho DSC-CCT-UFCG
RuleML Linguagem independente de padrões proprietários Abrange regras reativas, dedutivas e de produção Representação de fatos Sintaxe XML (versão 0.8 em DTD) Franklin Ramalho DSC-CCT-UFCG
RuleML - exemplo <imp> <_head> <atom> <rel>cooperatesWith</rel> <var>person2</var> <var>person1</var> </atom> </_head> <_body> </body> </imp> Franklin Ramalho DSC-CCT-UFCG
Agentes Computacionais O verdadeiro valor da Web Semântica representar valor para os seus utilizadores Agentes computacionais Compreender o significado e relação entre objetos Raciocinar sobre eles Trocar resultados Trocar provas Autenticidade e confiabilidade Assinaturas difitais Crenças (estado mental) Franklin Ramalho DSC-CCT-UFCG
Infra-estrutura em camadas para Web Semântica Franklin Ramalho DSC-CCT-UFCG
Ferramentas Construir páginas Web com semântica é uma tarefa muito laboriosa Ferramentas de apoio: Validação XML: XMLSpy … Construção Ontologias: OilEd, OntoEdit, Protégé … Anotação de Páginas: OntoMat, OntoAnnotate,UBOT… Motores de Inferência: LoPix, TRIPLE … Franklin Ramalho DSC-CCT-UFCG
Ferramentas - OntoEdit Franklin Ramalho DSC-CCT-UFCG
Aplicações Engenho de Busca: OntoBroker Sistemas de recomendação: MyPlanet E-commerce: MKBEEM, SMART-EC NLP: OncoTerm, PANGLOSS, OntoGeneration Integração da Informação: Ariadne, OBSERVER Web Services Franklin Ramalho DSC-CCT-UFCG
Considerações Finais Web mais inteligente! Grande quantidade de agentes computacionais fazendo uso da WS Maior sinergia entre diversas comunidades de pesquisa Franklin Ramalho DSC-CCT-UFCG
Considerações Finais XML – ponto de partida para padronização de conteúdos na comunicação entre agentes computacionais Markup Languages extensíveis Markup Languages cada vez mais “verborreicas” Ferramentas de apoio são necessárias Franklin Ramalho DSC-CCT-UFCG
Considerações Finais Grupos da W3C ainda trabalham de forma isolada Necessidade de uma única linguagem que expresse dados e regras para raciocínio sobre estes. Como prover tratamento de provas e credibilidade? O que vem por ai? ?ML, ?ML, ?ML … Franklin Ramalho DSC-CCT-UFCG
Considerações Finais Obrigado!! Franklin Ramalho DSC-CCT-UFCG