Web Semântica Mineração na Web – if796 Subtitle
Equipe João Victor Leite Lucas Harada Maria Fernanda Castro Ricardo Souza
Roteiro Cenário atual da Web O que é Web Semântica? Como funciona? Tecnologias Arquitetura Impacto para a RI Algumas aplicações Futuro da Web Semântica Conclusão
Cenário atual da Web Hoje, é possível que uma pessoa receba mais informação nova em um dia do que um camponês da Idade Média durante toda a sua vida.
Cenário atual da Web A Web está cada dia mais presente em nossa vida: Vida social (redes sociais) Comércio (compras online, anúncios) Finanças (movimentação bancária online) Educação (cursos à distância)
Cenário atual da Web Grande volume de informações, gerado em grande velocidade Nenhum controle sobre a produção de conteúdo
Cenário atual da Web Problema: Como “entender” o sentido de um conteúdo, para tratar e manipular os dados que se encontram na Web de maneira eficiente?
O que é Web Semântica? Tim Berners-Lee – criador da World Wide Web e idealizador da Web Semântica “É uma extensão da Web atual que visa dar significado semântico ao conteúdo das páginas Web, criando um ambiente onde agentes de software e usuários possam trabalhar de forma cooperativa”
A C B O que é Web Semântica? Baseada em 3 “pilares” A: Integração C: Interoperabilidade
O que é Web Semântica? Representar informação de maneira a tornar o processamento mais simples Trazer a abordagem de dados além de puramente conteúdo Inferir e racionalizar as informações Exemplo: Consulta: “Palestra SBPC” Resultado: Convidados, palestrantes, datas, eventos relacionados
Como funciona? A Web Semântica faz uso de diversas tecnologias, sendo os principais tipos: Metadados Ontologias Agentes Que são usadas para criar uma arquitetura em camadas
Tecnologias - Metadados Metadata: “dados sobre dados”, informações de contexto e significado Uso de tags, labels e descrições herárquicas Surgimento do RDF e do HTML 5
Tecnologias - Metadados RDF – Resource Description Framework Recomendado a partir de 1999 pela W3C Originalmente descrevia páginas web Cria uma estrutura de grafos para os dados, estruturando a informação Sintaxe baseada no XML Vocabulário baseado em URI
Tecnologias - Metadados
Tecnologias - Metadados SPARQL Single Protocol and RDF Query Language Linguagem de consulta para metadados descritos em RDF Só permite consultas
Tecnologias - Metadados @prefix foaf: <http://xmlns.com/foaf/0.1/> _:a foaf:name “Johnny Lee Outlaw” _:a foaf:mbox <mailto:jlow@example.com> _:b foaf:name “Peter Goodguy” _:b foaf:mbox <mailto:peter@example.org> _:c foaf:mbox <mailto:carol@example.org> PREFIX foaf: <http://xmlns.com/foaf/0.1/> SELECT ?name ?mbox WHERE { ?x foaf:name ?name ?x foaf:mbox ?mbox } Dados Consulta SPARQL name mbox “Johnny Lee Outlaw” <mailto:jlow@example.com> “Peter Goodguy” <mailto:peter@example.org> Resultado
Tecnologias - Metadados HTML 5 Hypertext Markup Language 5 Linguagem para estruturação de conteúdo Surgiu em 2008 como uma evolução do HTML, trazendo a abordagem semântica Em 2011, 34 dos 100 melhores sites utilizavam HTML 5
Tecnologias - Ontologias Especificação e contextualização de um domínio Termos e relacionamentos, propriedades, disjunção, operações lógicas RDF Schema e OWL
Tecnologias - Ontologias RDF Schema Conjunto de classes que visa prover elementos básicos para descrição de recursos estruturados em RDF “Vocabulário” RDF Possui relacionamentos e propriedades entre classes
Tecnologias - Ontologias
Tecnologias - Ontologias OWL Web Ontology Language Surgiu com a necessidade de uma ontologia mais expressiva Tornou-se a linguagem padrão de representãção de conhecimento na Web Semântica Possui muitos dos elementos do RDF Schema
Tecnologias - Ontologias
Tecnologias - Agentes Componentes que agem de maneira autônoma e proativa Podem atuar em: Metadados : extraindo e catalogando informação da Web Ontologias: interpretando e classificando contextos Inferência: deduzindo a partir de regras aplicadas ao conteúdo Atividades diversas: comunicação entre agentes, manutenção de modelos de usuário
Tecnologias - Outros URI RIF Universal Resource Identifier Representação única e padronizada de recursos, visando interoperabilidade RIF Rule Interchange Format Formato padronizado para compartilhamento de regras entre os sistemas
Arquitetura Arquitetura em camadas para facilitar interoperabilidade entre as tecnologias e adesão de novos componentes
Arquitetura Trust + Crypto Proof Unifying Logic
Arquitetura – Trust + Crypto Verificar autenticidade das fontes = confiabilidade Previne inconsistências Garante a segurança, privacidade e integridade das informações = assinatura digital
Arquitetura – Proof Mecanismos de inferência sobre as regras Verificar consistência tanto das regras quanto das conclusões obtidas
Arquitetura – Unifying Logic Trazer uma interface lógica única para as aplicações = união das tecnologias Padronizar a especificação do conteúdo Alguns detalhes ainda estão indefinidos
Impacto para a RI Área com maior expressividade no uso da Web Semântica até o momento. Usar a inferência a partir de um contexto torna os resultados mais eficientes Busca pelo contexto, e não pela sintaxe Permite analisar outros tipos de conteúdo, criados por outras aplicações Utilização da RI + Web Semântica na área de Saúde
Algumas Aplicações A Web Semântica ainda é um grande desafio Aplicações utilizam apenas algumas das tecnologias No entanto, estão conquistando mercado e obtendo lucro
Algumas Aplicações
Algumas Aplicações Em 2006, a Spock levantou 7 milhões de dólares em capital de ventura Em 2008, o faturamento da empresa foi de 10 milhões. A empresa foi comprada pela Intelius, especializada em informações sociais, em 2009
Algumas Aplicações
Algumas Aplicações
Futuro da Web Semântica Transição gradual entre a Web que conhecemos e a Semântica Grandes marcas estarão envolvidas Google adquire a empresa MetaWeb Governo inglês investe 30 milhões de libras em pesquisa Para participar do projeto: http://www.w3.org/participate/ Fóruns Eventos Disponibilização de código
Conclusão Web Semântica tenta trazer “significado” ao conteúdo existente A Web Semântica transformará a Web que conhecemos hoje numa Web de Dados, onde tudo poderá ser interligado As tecnologias usadas tornarão os serviços Web mais eficientes
? Dúvidas