Ontologias para Melhorar Precisão e Cobertura de Buscas na Web

Slides:



Advertisements
Apresentações semelhantes
Terminologia Definicao Construção Exemplos
Advertisements

Profa. Dra Maria Luiza de Almeida Campos
Recuperação de Informação
Engenharia de Software
UNIVERSIDADE ESTADUAL DE MATO GROSSO DO SUL SISTEMAS DE INFORMAÇÃO ENGENHARIA DE SOFTWARE Métricas de Software Prof.ª Adriana dos Santos Caparróz Carvalho.
(Unified Modeling Language)
Software Básico Silvio Fernandes Universidade Federal Rural do Semi-Árido Departamento de Ciências Exatas e Naturais Ciência da Computação Aula.
UML – MODELAÇÃO DA ESTRUTURA Professor Sandro Carvalho.
UML Diagrama de Classes elementos básicos. Contexto Os diagramas de classes fazem parte do da visão estática da UML. Os elemento desta visão são conceitos.
Mapeamento Objeto Relacional
Gerenciamento de Configuração
Neide dos Santos Oscar Luiz Monteiro de Farias
Ontologia e Sistemas de Informação Geográfica Departamento de Informática - Universidade Federal de Viçosa Jugurta Lisboa Filho Alcione de Paiva Oliveira.
Sistema Web para Departamentos
André Neves, Flávia Barros & Geber Ramalho
Eduardo Silva, Frederico Fernandes, Juliano Rabelo e Flávia Barros
Introdução a Teoria da Classificação
Agentes na Web Márcio David de Magalhães Santos Departamento de Informática UFPE Recife, 1 de junho de 1999.
UNIVERSIDADE FEDERAL DE SANTA CATARINA - UFSC PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA E GESTÃO DO CONHECIMENTO EGC – GESTÃO DO CONHECIMENTO E FERRAMENTAS.
Internet: conceitos básicos
Diagrama de Classes.
Universidade Federal de Minas Gerais Escola de Ciência da Informação Disciplina:Introdução á Informática Alunas: Fernanda Christina Jocélia Rangel.
Alunos: Benedito Jr, Douglas Bertol, Robson Costa
Protégé 3.0 Apresentação para a disciplina DAS 6607
Aspectos Avançados em Engenharia de Software Aula 3 Fernanda Campos
Como Desenvolver Sistemas de Informação
Engenharia de Software
Aula 11: Social Bookmarks. UNIVERSIDADE ESTADUAL PAULISTA Júlio de Mesquita Filho Faculdade de Filosofia e Ciências – Campus de Marília Universidade Aberta.
Aula 7: Portais de Noticias
Administração de Sistemas de Informação Banco de Dados
Os cursos de Sistemas de Informação têm a computação como atividade meio, isto é, utilizam a computação como recurso para a solução de problemas.
Prof. Ilaim Costa Jr. Novas Tecnologias Prof. Ilaim Costa Jr.
Macrotesauros em Biotecnologia para Amazônia. Caracterização do Problema Crescimento da oferta de informação Sistemas de organização do conhecimento Promovam.
UNIVERSIDADE FEDERAL DE SANTA CATARINA CENTRO DE CIÊNCIA DA EDUCAÇÃO CURSO DE BIBLIOTECONOMIA Disciplina: Gerenciador de Base de Dados CDS/ISIS Construção.
UFMG DCC ICEx - Especialização em Informática
C&L: Um Ambiente para Edição e Visualização de Cenários e Léxicos
Autoria de Aplicações Hipermídia Daniel Schwabe Departamento de Informática PUC-Rio [ Parte 6 ]
Taxonomia Profa. Lillian Alvares,
Web Services Uninorte Semana de Tecnologia da Informação
Sistemas de Apoio à DecisãoMárcio MoreiraUnidade 5 – Decisões Não Estruturadas – Recuperação de Informações – Slide 1 5Decisões Não Estruturadas 5.1Recuperação.
Rodrigo Cristiano Silva
LABORATÓRIOS DE INFORMÁTICA IV ENGENHARIA DE SOFTWARE: DA TEORIA À PRÁTICA GRUPO 13.
Alex Sandro Souza de Oliveira BOA NOITE 25/02/2010.
Engenharia de Software
Arquitetura do Software
Vânia Maria P. Vidal, José Maria Monteiro, Luís Eufrasio T. Neto
Banco de Dados Aplicado ao Desenvolvimento de Software
Endeavour Apresentação da Ferramenta. Observações a respeito da escolha da ferramenta o foco do trabalho não são as ferramentas em si, mas sim a integração.
Profa. Lillian Alvares Faculdade de Ciência da Informação Universidade de Brasília Recuperação 1.
Inteligência Artificial Web Semântica
ESCOLA POLITÉCNICA DA UNIVERSIDADE DE SÃO PAULO Departamento de Engenharia de Computação e Sistemas Digitais Implementação de buscas utilizando Linguagem.
Consulta a XBRL usando Certificado Digital Eduardo Mazza Batista Centro de Informática Universidade Federal de Pernambuco Recife - PE 01/30/2007.
Uma Interface em Linguagem Natural em Português para Pergunta-Resposta na Web Grupo de Inteligência Computacional Mestrado em Ciência da Computação Aluno:
ENIA 2001/SBC Fortaleza, CE 30/07 a 03/ ActiveSearch Um Agente Pró-ativo para Recuperação de Documentos Similares em Repositórios Digitais.
1 Projeto X-Finder Agents Recuperação e Indexação de páginas especializadas na Web Disciplina: Inteligência Artificial Simbólica Professora: Flávia Barros.
PCS - Departamento de Engenharia de Computação e Sistemas Digitais Projeto de Formatura – Turmas 2008 Integrantes: Professor Orientador: Engenharia de.
Modelagem Conceitual descreve a informação que o sistema vai gerenciar.
Utilização de Ontologias para Integração de Heterogeneidade Semântica
Prototipação de Software
Tesauro, Taxonomia e Ontologia: uma evolução?
Análise e Projeto de Sistemas Orientado a Objetos Profa. Ana Karina Barbosa.
Programação para Internet
Modelagem Conceitual descreve a informação que o sistema vai gerenciar.
Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de Ciência da Informação Gestão da Informação Recomendações para o desenvolvimento.
/ de Julho de UFPE - Universidade Federal de Pernambuco CIn - Centro de Informática Pós-Graduação em Ciência da Computação Tópicos Avançados.
/ de Abril de UFPE - Universidade Federal de Pernambuco Centro de Informática Pós-Graduação em Ciência da Computação Dissertação de Mestrado.
Análise e Projeto de Sistemas Análise & modelagem conceitual Prof. Edjandir Corrêa Costa
Síntese do Negócio ONTOWEB. Ontoweb – Nova Geração de Ferramenta de Busca Possui comportamento inteligente que auxilia o usuário a organizar e compartilhar.
Modelagem de Banco de Dados: Conceitos
Transcrição da apresentação:

Ontologias para Melhorar Precisão e Cobertura de Buscas na Web Flávia Barros, Pedro Gonçalves e Thiago Santos Departamento de Informática Universidade Federal de Pernambuco Recife - PE SEMISH’98

Buscas na Web O que queremos? O que temos: O que fazer? Mecanismos de Busca na Web (search engines) que ofereçam: precisão e boa cobertura (recall) nas buscas funcionamento transparente para o usuário flexibilidade na busca O que temos: Mecanismos de busca gerais com: boa cobertura, porém baixa precisão pouca transparência e flexibilidade. O que fazer? _____________________________ F. Barros, P. Gonçalves e T. Santos

Contexto para Buscas Classificação em Hierarquias de conceitos problemas: transparência e flexibilidade e.g., Yahoo!, Cadê, Lycos Buscas “conceituais” problemas: precisão e transparência e.g., AltaVista, Excite! cursos de violoncelo - violino Problema central: como associar contexto às buscas na Web com transparência e flexibilidade? _____________________________ F. Barros, P. Gonçalves e T. Santos

Ontologias! Hierarquias de conceitos. Em Filosofia: Teoria Ontológica estudo do que existe no mundo Em IA: Engenharia Ontológica especificação das classes (conceitos), objetos e suas relações em um dado domínio Taxonomia do domínio _____________________________ F. Barros, P. Gonçalves e T. Santos

Nossas Ontologias Seguimos o trabalho da Engenharia Ontológica observando que nosso domínio é irrestrito (a Web) Nossas ontologias são grafos cíclicos dirigidos onde: nós representam conceitos contêm palavras-chave e URL-exemplos arcos representam relações semânticas “frouxas” e.g., “é um“, especialização, parte-de, grupo, conceito composto ciclos não são problema: o grafo é dirigido não classificamos URLs na ontologia. _____________________________ F. Barros, P. Gonçalves e T. Santos

... Exemplo de Ontologia filme, diretor, Cannes, .. Teatro Cinema: http://www.cinemas.br Entretenimento Especialização Especialização Teatro Cinema Tem Tem programação grupo ... Segunda Terça Quarta _____________________________ F. Barros, P. Gonçalves e T. Santos

Ontologias para contextualizar consultas Nossas Ontologias: Hierarquias de conceitos dinâmicas que não classificam a priori as páginas indexadas e sim, auxiliam na construção do contexto da busca. Contexto da busca: Construído pelo usuário a partir das ontologias do sistema. Reflete a estrutura conceitual de cada consulta à Web favorecendo o aumento da precisão e da cobertura nas buscas. _____________________________ F. Barros, P. Gonçalves e T. Santos

Exemplo:

Nossa Abordagem Conceitos nas ontologias: Três classes: descritos por palavras semanticamente relacionadas que podem ser selecionadas individualmente. Três classes: (1) sinônimos => cobertura macaxeira OR aipim problema: difíceis de achar mesa, cadeira, parede ??? tesauros (2) restrição ou especialização => precisão esporte de campo AND futebol (3) expansão ou generalização => cobertura Roland Garros OR campeonato de tênis _____________________________ F. Barros, P. Gonçalves e T. Santos

Um Framework para Gerenciar Ontologias Framework para Gerenciar Ontologias (OMF) é um plug in que pode ser conectado a diferentes mecanismos de busca é independente da língua usada Critérios básicos para o sistema: modularidade e reusabilidade engenharia de software escalabilidade sistemas de informação para a Web transparência e flexibilidade interfaces em geral _____________________________ F. Barros, P. Gonçalves e T. Santos

Arquitetura do Sistema

As Ontologias As Ontologias são criadas e mantidas pelo Módulo de Manutenção de Ontologias: uma Ontologia Pública, compartilhada por todos os usuários do sistema diversas Ontologias Privadas, criadas e mantidas por cada usuário em sua própria área Ontologia pública (genérica) => sistema Ontologias privadas (domínios especializados) => usuário _____________________________ F. Barros, P. Gonçalves e T. Santos

Interface do Sistema

Trabalhos Relacionados Uma solução para aumentar a precisão nas buscas: classificar a página segundo alguma ontologia disponível na Web usando tags HTML especiais SHOE = Simple HTML Ontology Extension) GDA = Global Document Annotation Maiores problemas: até o momento, não existe um sistema único de tags universalmente aceito. os bancos de índices limitam-se às páginas marcadas com as tags especiais de cada sistema. _____________________________ F. Barros, P. Gonçalves e T. Santos

Considerações Finais Seguimos os critérios básicos estabelecidos: modularidade na arquitetura favorecendo portabilidade e reusabilidade transparência nas consultas o usuário determina o contexto de cada consulta flexibilidade no uso do sistema como um todo: acesso a diferentes mecanismos de busca construção de contextos dinamicamente o usuário constrói suas próprias ontologias que podem ser adicionadas à ontologia pública o framework é independente da Língua O exemplo apresentado demonstrou uma melhoria de 30% pela expansão da consulta inicial. _____________________________ F. Barros, P. Gonçalves e T. Santos

Trabalhos Futuros Atualmente estamos desenvolvendo o Módulo de Manutenção de Ontologias. Próximos passos: desenvolver o mecanismo para criação e uso das ontologias privadas testar o framework com usuários reais _____________________________ F. Barros, P. Gonçalves e T. Santos