Eduardo Silva, Frederico Fernandes, Juliano Rabelo e Flávia Barros

Slides:



Advertisements
Apresentações semelhantes
Recuperação de Informação
Advertisements

Internet Introdução à Internet Navegação na WWW (Web)
TUTORIAL BASE DE DADOS SCIENCE DIRECT Elaborado por:
TUTORIAL BASES DE DADOS PROQUEST
Informática Para Marketing I
#pshare: compartilhando preços de produtos na web Dárlinton B. F. Carvalho Março de 2010.
#pshare: compartilhando preços de produtos na web Dárlinton B. F. Carvalho Março de 2010.
OCL Object Constraint Language
GHHITS – Mining the Web Link Structure Universidade Federal de Pernambuco Centro de Informática Roberta Coelho Silvio Meira.
Ontologias para Melhorar Precisão e Cobertura de Buscas na Web
Introdução a Teoria da Classificação
Agentes na Web Márcio David de Magalhães Santos Departamento de Informática UFPE Recife, 1 de junho de 1999.
Recuperação de Informações
Descoberta de Conhecimento:
Divisão de Biblioteca e Documentação FMUSP
Universidade de São Paulo
Base SCOPUS 2011 Divisão de Biblioteca e Documentação FMUSP.
UNIVERSIDADE FEDERAL DE SANTA CATARINA - UFSC PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA E GESTÃO DO CONHECIMENTO EGC – GESTÃO DO CONHECIMENTO E FERRAMENTAS.
Bruno Augusto Vivas e Pôssas
Alunos: Benedito Jr, Douglas Bertol, Robson Costa
ESTADO DO PARANÁ NÚCLEO REGIONAL DE EDUCAÇÃO DE GUARAPUAVA.
Criando Apresentações
Recuperação Inteligente de Informação Tarefa 1 Equipe.
Bruno Cavalcante (bmsc) Gabriel Monteiro (gam) João Florêncio (jcpf) Lucas Marinho (lpm)
Acadêmicos: Durval Slompo Junior / Verediane R. S. Monteiro
Um estudo exploratório da aplicação da engenharia de software orientada a agentes para o desenvolvimento de ferramentas de suporte a comunidades online.
Sistemas de Apoio à DecisãoMárcio MoreiraUnidade 5 – Decisões Não Estruturadas – Recuperação de Informações – Slide 1 5Decisões Não Estruturadas 5.1Recuperação.
Eustáquio Júnior Utilização de mecanismos de busca
TUTORIAL. Acervo de 47 jornais especialmente selecionados pela British Library para melhor representar o século XIX. Inclui jornais nacionais e regionais.
Técnicas de pesquisa avançada na Internet
Tutorial Scopus.
Mineração da Web Recuperação de Informação
Mineração na Web Introdução a Recuperação de Informação
Recuperação de Informação Mineração na Web
Recuperação de Informação Clássica
Recuperação de Informação
Título do projeto Equipe Local Data.
Recuperação de Informação
Recuperação de Informação
Recuperação de Informação
1. Aprenda o básico sobre o Google
Professor: Márcio Amador
Equipe NTM/Santos. SITES DE BUSCA São sites que atuam como robôs na busca de páginas que contém as informações que você procura a partir de palavras chave.
CRSC Segurança em Redes Política de Segurança Eng.º Miguel Frade ESTG - Leiria.
Redes Sociais Colaborativas Patrícia Ramos | 22/05/2006.
FACULDADE DE TECNOLOGIA SENAC-RS Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas Uma Ferramenta para Geração de Casos de Testes para.
Academia de Ensino Superior 2007 O Ciclo de Dados.
A Lexicon-Enhanced Method for Sentiment Classification: An Experiment on Online Product Reviews Bruno Andrade.
WINDOWS EXPLORER.
TCC - Aplicativo de Interação Acadêmica
Consulta a XBRL usando Certificado Digital Eduardo Mazza Batista Centro de Informática Universidade Federal de Pernambuco Recife - PE 01/30/2007.
RequisitePro Ismênia Galvão Lourenço da Silva ANÁLISE E ESPECIFICAÇÃO DE REQUISITOS CENTRO DE INFORMÁTICA UNIVERSIDADE FEDERAL DE PERNAMBUCO.
Recuperação Inteligente de Informação
Profª Angela Tissi Tracierra. É uma arquitetura de rede, onde existem dois módulos básicos na rede: o Servidor e os Clientes.
22/4/20151 / Query By Humming. Ana Alves (apba) Bruno Ribeiro (brcr) Francisco Neto (ffsn) Garsielle Valença (gval) Query by Humming (QBH)
Classificação de Texto Baseada na aula de Henrique Borges e Ícaro Medeiros Alterada por Flávia Barros.
Recuperação de Informação Arlei Calazans Luís Ricardo Fábio Hedayioglu {ajcm, lrcs, cin.ufpe.br Classificação de cardiopatias a partir de uma base.
Uma Interface em Linguagem Natural em Português para Pergunta-Resposta na Web Grupo de Inteligência Computacional Mestrado em Ciência da Computação Aluno:
ENIA 2001/SBC Fortaleza, CE 30/07 a 03/ ActiveSearch Um Agente Pró-ativo para Recuperação de Documentos Similares em Repositórios Digitais.
1 Projeto X-Finder Agents Recuperação e Indexação de páginas especializadas na Web Disciplina: Inteligência Artificial Simbólica Professora: Flávia Barros.
1 Busca na Web Equipe: Arlei Moraes Fabio Hedayioglu Luís Ricardo Recuperação Inteligente de Informação Nov/2004.
Um Sistema de recomendação de consultas baseados em query log Diogo Mendonça.
TUTORIAL. SABIN AMERICANA Esta base é formulada conforme a bibliografia de Joseph Sabin, bibliófilo americano que viveu entre 1821 e Com.
Recuperação de Informação Eduardo Amaral - efas Frederico Fernandes - fbf2 Juliano Rabelo - jcbr Flávia Barros - fab.
Engenharia de Software com o RUP - Workflow de Requisitos
Integração de dados Bernadette, Ceça, Luciano, Haroldo, Guilherme. Orientadora: Ana Carolina Salgado Universidade Federal de Pernambuco Pós-Graduação em.
Interface da Base de Dados PubMed (Curso Básico: Módulo 4)
Asynchronous Javascript and XML AJAX. AJAX – Motivação Início dos anos 90, a maioria dos web sites eram baseados em páginas HTML Cada ação do usuário.
Rhizome. Roteiro Definição Metas Características Arquitetura Tecnologias envolvidas Referências.
Transcrição da apresentação:

ActiveSearch Um Agente Pró-ativo para Recuperação de Documentos Similares em Repositórios Digitais Eduardo Silva, Frederico Fernandes, Juliano Rabelo e Flávia Barros Centro de Informática Universidade Federal de Pernambuco – Brasil NLPKE/SCM 2001

Roteiro Motivação Sistema ActiveSearch Arquitetura Protótipo Experimentos Conclusão Trabalhos Futuros NLPKE/SCM 2001

Pesquisando na Web Sistemas de Indexação por palavras-chave Ex. Altavista, Google, Radix Consulta: palavras-chave como expressões booleanas Retornam grande quantidade de documentos irrelevantes, porém são robustos e genéricos Uma alternativa: Busca por documentos semelhantes ao visualizado pelo usuário Sistemas existentes Alexa: só trabalha com documentos HTML GoogleToolbar: só trata documentos existentes em sua base de índices Kenjin: baixa precisão NLPKE/SCM 2001

ActiveSearch Objetivo: Trata diferentes formatos de documento: Encontrar documentos similares ao que o usuário está visualizando/editando no momento Trata diferentes formatos de documento: HTML, DOC, PDF Plataformas: MS Internet Explorer MS Word Netscape Navigator Processo de recuperação on-line baseado na análise do conteúdo dos documentos NLPKE/SCM 2001

ActiveSearch in use NLPKE/SCM 2001

Architecture 2 1 Application 1 3 Application 2 5 Application 3 6 4 Document’s internal representation in XML Document’s content 2 Document’s pre-processor Meta-search Queries constructor Documents searcher Query 1 Application 3 Application 2 Application 1 Web LAN Local directories Documents base Document’s Post-processor Pointers to documents 3 Interface Documents retriever 5 Documents’ content Documents’ representation 6 Documents reorganizer List of reordered documents 4 Pointers to documents NLPKE/SCM 2001

Arquitetura -excluir Pré-processador de Documentos Traduz o documento atual para uma representação interna do documento em XML Módulo de Meta-Busca Seleciona os termos mais relevantes para criar uma query Realiza meta-buscas em diferentes bases de documentos Pós-processador de Documentos Recupera e reordena os documentos de acordo com o documento atual Algoritmo de similaridade utilizado: Vector Space NLPKE/SCM 2001

Protótipo Busca por documentos semelhantes Implementado em Delphi 5.0 Ao que está sendo visualizado pelo usuário, OU A um trecho do documento selecionado pelo usuário Drag and drop Implementado em Delphi 5.0 Usa tecnologia COM: Comunicação com outras aplicações MS Word, MS Internet Explorer, etc NLPKE/SCM 2001

Prototype: Interface 1 2 3 4 5 6 1.Starts the search from the document in the active window 2. Starts a keyword-based search 3.Configures the automatic search: - searches time interval, number of returned links, used search engine 4.Cache with previous searches 5. PopUp Menu to decide where to open the returned documents 6.Similarity degree between the returned document and the current one NLPKE/SCM 2001

Experimento: ActiveSearch vs. GoogleToolbar Nos testes realizados, os dois sistemas utilizaram a mesma base de documentos engenho de busca Google 30 páginas Web foram consultadas pelos dois sistemas Jornais, universidades, futebol, Projeto Genoma, etc. 9 primeiros links retornados foram avaliados como relevantes ou não Precisão obtida: ActiveSearch: 62% GoogleToolbar: 46% NLPKE/SCM 2001

ActiveSearch: Conclusões Sistema modular para favorecer: Extensibilidade: Manipulação de outros formatos de documento Comunicação com outros aplicativos Reusabilidade: Acoplamento a outros sistemas (como um plug-in) Provê meta-buscas a várias bases de documentos Reordena os documentos retornados através de um algoritmo baseado no modelo do Vector Space A precisão do protótipo foi 16 pontos percentuais superior à da GoogleToolbar NLPKE/SCM 2001

Trabalhos Futuros Avaliação do sistema Usando um corpus maior Em Intranets e em diretórios locais Melhorar o formato da representação interna do documento Criar um perfil do usuário para melhorar a precisão do sistema NLPKE/SCM 2001