Bruno Cavalcante (bmsc) Gabriel Monteiro (gam) João Florêncio (jcpf) Lucas Marinho (lpm)

Slides:

Advertisements

Apresentações semelhantes

Medidas de Avaliação de Sistemas de Recuperação de Informação

Advertisements

SELEÇÃO DE FONTES DE INFORMAÇÃO:

Desafios em Implementar um Sistema Sensível ao Contexto (Challenges in Implementing a Context-Aware System) Autor: M. Satyanarayanan Alunos: Márcio de.

Pesquisa na Internet Aula Teórica 2.

Experiments with Clustering as a Software Remodularization Method Nicolas Anquetil and Timothy C. Lethbridge University of Ottawa, Canada WCRE 1999:

Algoritmos distribuídos para ambientes virtuais de larga escala

Aula 21/09/2011 Courouris, Dollimore, cap 10

Modelos de Recuperação de Informação

Eveline Alonso Veloso PUC-MINAS

Processos de Software Introdução

Revisao da literatura Revisao bibliografica Revisao etc

#pshare: compartilhando preços de produtos na web Dárlinton B. F. Carvalho Março de 2010.

Peer to Peer Referência:

GHHITS – Mining the Web Link Structure Universidade Federal de Pernambuco Centro de Informática Roberta Coelho Silvio Meira.

Eduardo Silva, Frederico Fernandes, Juliano Rabelo e Flávia Barros

Introdução a Teoria da Classificação

Revistas Eletrônicas disponíveis no Portal de Serviços do SIBiUSP.

Apresentado por Walfredo Cirne

-- PNOTA -- Uma Aplicação para Correção Assistida de Questões Discursivas Filipe Wall Mutz.

Simulação de Sistemas Prof. MSc Sofia Mara de Souza AULA2.

Seleção de Materiais de Informação - Critérios

Engenharia de Requisitos Requisito – sistema Caso de uso - usuário

O texto argumentativo.

Semana de Informática 2011 – IFAM Parintins

TRABALHO 10 CURSO GESTÃO ESTRATÉGICA DA PRODUÇÃO

FIGUEIREDO, Nice Menezes de. O usuário e o processo de referência

D ETECÇÃO DE C OMUNIDADES Ricardo Prudêncio. L INK M INING - T AREFAS Relacionadas a Objetos Relacionadas a Arestas Relacionadas a Grafos Ranking de Nós.

Sistemas de Recomendação

Recuperação Inteligente de Informação Tarefa 1 Equipe.

Busca Rápida Baseada em Similaridade para Redes Par-a-Par Fast Similarity Search in Peer-to-Peer Networks NOMS 2008 Autores: Thomas Bocek Ela Hunt David.

Expansão dos Casos de Uso

Sistemas de Apoio à DecisãoMárcio MoreiraUnidade 5 – Decisões Não Estruturadas – Recuperação de Informações – Slide 1 5Decisões Não Estruturadas 5.1Recuperação.

Técnicas de pesquisa avançada na Internet

Social Search Equipe: Antonio Vildes Barbosa Eduardo Bastos Rocha Victor Hugo Silva do Nascimento.

Milene Selbach Silveira

Tecnologia da informação

Mineração na Web Introdução a Recuperação de Informação

Análise de Modo e Efeitos de Falha Potencial

Redes Bayesianas - Aplicação em Recuperação de Informação Rudini Sampaio DCC / UFLA.

Recuperação de Informação

Linguagens Documentárias

Universidade Federal de Minas Gerais Estudo de Usuários 2ª Parte

O texto argumentativo.

Sistemas Tolerantes a Falhas: Conceitos e Técnicas

Indexação Profa. Lillian Alvares Faculdade de Ciência da Informação

Profa. Lillian Alvares Faculdade de Ciência da Informação Universidade de Brasília Recuperação 1.

Social Query André Jacinto

Redes Sociais Colaborativas Patrícia Ramos | 22/05/2006.

Filtragem Colaborativa

Elaboração da pesquisa científica: 4 fases

CEAP –Ciências Contábeis /1 Disc. Metodologia do Trabalho Científico Profº Luiz Alberto C. Guedes.

Recuperação Inteligente de Informação

Um Sistema Peer-to- Peer para Armazenamento Distribuído de Arquivos Daniel Mauricio Sthor Lauro Luis Costa Lucas Nascimento Ferreira Departamento de Informática.

DNS Willamys Araújo 1. Introdução A internet possui uma infinidade de sites e, para acessá-los, você digita um endereço no campo correspondente do seu.

Filtragem de Informação

ENIA 2001/SBC Fortaleza, CE 30/07 a 03/ ActiveSearch Um Agente Pró-ativo para Recuperação de Documentos Similares em Repositórios Digitais.

Pesquisa na Internet Aula Teórica 2.

1 Summarizing Text Documents: Sentence Selection and Evaluation Metrics Trabalho realizado por: Trabalho realizado por: João Casteleiro Alves João Casteleiro.

1 Busca na Web Equipe: Arlei Moraes Fabio Hedayioglu Luís Ricardo Recuperação Inteligente de Informação Nov/2004.

Um Sistema de recomendação de consultas baseados em query log Diogo Mendonça.

UpToDate é uma fonte de informação na área da saúde, baseada em evidências médicas revisadas, dedicada à síntese de conhecimentos para utilização de médicos.

Definição do tema é o assunto que se quer desenvolver

Avaliação de Interfaces Esta apresentação foi baseada no livro Design de Interação ( Preece, Rogers & Sharp) e no Tutorial sobre o livro “Design e avaliação.

Questionário é tão somente um conjunto de questões, feito para gerar os dados necessários para se atingir os objetivos do projeto. Para se elaborar um.

Laboratório de Mídias Sociais Aula 02 Análise Textual de Mídias Sociais – parte I Prof. Dalton Martins Gestão da Informação Universidade.

A entrevista de referência. Entrevistas acontecem em aproximadamente 40% das consultas em bibliotecas. Deve-se negociar sempre para evitar falhas no atendimento.

Estratégias de busca Agosto Como criar sua estratégia  Definir um título, quase um resumo  Levantar as palavras- chave por conjuntos (colunas)

Empreendedorismo Comportamento empreendedor. Perfil do Empreendedor A proporção de mulheres entre os empreendedores brasileiros é uma das mais altas entre.

Indexação: o uso do Vocabulário de Controle Externo do TCU (VCE) ISC/CEDOC Serviço de Gestão do Conhecimento Junho/2016 Beatriz Pinheiro de Melo Gomes.

Transcrição da apresentação:

Bruno Cavalcante (bmsc) Gabriel Monteiro (gam) João Florêncio (jcpf) Lucas Marinho (lpm)

Introdução P2P-RI WebSearch Social Query Query Routing Aplicações Desafios Conclusão

FACTUAL

NÃO FACTUAL

Responde 78% das consultas Factuais Somente 29% das consultas Não-Factuais

Surgimento de sites específicos

Sistema de RI com a arquitetura de P2P Ecalabilidade Tolerância a falhas Simula o comportamento de uma rede social Contêm informação dos peers conhecidos Infere a categoria de cada peer Estima precisão e cobertura por topico para os peers

Problemas dos engenhos de busca tradicionais: Engenhos de busca de propósito geral estão sujeitos a baixa precisão e/ou baixa cobertura; Diretorios proveem referências de alta qualidade, mas não acompanham o crescimento explosivo da web;

Engenhos de busca especificos: Retornam frequentemente referências de melhor qualidade do que engenhos de próposito geral, por várias razões: Detêm um banco de dados mais confiável; Refletem o esforço de organizações compremetidas em prover e atualizar com informações de boa qualidade; Menos ambiguidades e outros obstáculos linguísticos para buscas de alta precisão;

CONSULTA

Existem várias formas de fazer Roteamento de Consultas; Explicaremos a Topic-centric Query Routing; Não precisa de acesso total ao engenhos de busca específicos; Compensa a falta de livre acesso aos engenhos de busca com: Neighborhood-based topic identification; Expansão de consulta;

Neighborhood-based identification of Search Engines Topic: The front-page method; The back-link method;

Expansão de consulta: Pega os termos relevantes diretamente da web; Avalia termos importantes pelo nível de co- ocorrência; Usa a técnica pseudo-feedback;

Clustering: Recebe os documentos e termos obtidos na Expansão de Consultas; Separa os termos em agrupamentos de tópicos diferentes; Gerador de frase tópico: Frase extraída do conjunto de documentos recuperados da Expansão de consultas; Para cada cluster será gerado uma frase explicativa; A frase que contém mais termos tópicos e maior co- ocorrência será selecionada;

Search Engine Rank: Compara os termos obtidos na expansão de consulta com os termos armazenados na base de índices de engenhos de buscas; Calcula adequação dos engenhos de busca com a query da seguinte forma: Para cada cluster, seleciona-se o 3 melhores engenhos para apresentar ao usuário;

O que é? RI que considera relações e opiniões dos usuários. Desafio em encontrar, ao invés do documento certo, a pessoa certa. Paradigmas: Biblioteca x Vila

Biblioteca -> busca na web tradicional Consulta concisa com palavras chaves, concreta. Confiança na autoridade. Ex: Google, Bing, sistemas de bibliotecas. Vila -> Social Query (ou search) Consulta com linguagem natural, mais subjetiva. Confiança na intimidade. Considera momento e local da pergunta. Ex: Facebook, Aardvark, Google Social Search.Google Social Search

O que tem de bom? Complementa RI tradicional. Consultas específicas (região, tempo real, confiança por intimidade). Trazem opiniões dos usuários dos serviços e não apenas dos fornecedores. O que tem de não tão bom? Falta de privacidade. Usuários tem receio de fazer perguntas triviais ou que envolvam assuntos polêmicos. Necessita de muitos usuários e acessos constantes.

Algumas estratégias Pythia: A Privacy Aware, Peer- to-Peer Network for Social Search. Construída a partir de uma rede social pré-existente. Usuários informam os assuntos de interesse (fica oculto). Garante privacidade e faz as perguntas por flooding. Crowdsourcing Location-based Queries. Integra Twitter e Forsquare, para responder perguntas com base na localização do usuário.

Inicialização do usuário Análise da consulta Verifica se é uma pergunta. Reconhece o assunto (palavra-chave, usa tesauro). Ranking de usuários Temas escolhidos para responder. Similaridade dos perfis dos usuários. Proximidade dos nós. Proximidade na localização, etc. Direcionamento da pergunta

Outra alternativa: Q-Pilot Roteamento de consultas centrado no tópico. Recomenda melhores engenhos de busca para determinada consulta. Encontrou a categoria adequada da consulta 70% das vezes. O engenho de busca mais indicado para a consulta ficou entre os 3 primeiros, dentre 144, 40% das vezes.

+

Engenho de busca social Responde questões subjetivas Perguntas em linguagem natural Informação nas pessoas e não nos documentos

Usa dois fatores principais para escolher o usuário que responde: Probabilidade dele responder uma pergunta sobre aquele tema Afinidade entre o usuário que pergunta e o que responde

Respostas saem razoavelmente rápido(60% em menos de 10 min) 90% das perguntas são respondidas Respostas têm em média 24 palavras Perguntas têm em média 19 palavras Perguntas em grande parte subjetivas(procuro um bom restaurante)

Nem todas as respostas estão nos documentos É possível e viável procurar respostas direto com as pessoas Os esforços na área ainda são limitados O ranking e consulta a pessoas é um problema desafiador

Bulut, M. F., Yilmaz, Y. S. & Demirbas, M. - Crowdsourcing Location-based Queries Nilizadeh, S., Alam, N., Husted, N. & Kapadia, A. - Pythia: A Privacy Aware, Peer-to-Peer Network for Social Search Sugiura, A. & Etzioni, O. - Query routing for Web search engines: architecture and experiments Horowitz, D. & Kamvar, S. D. - The Anatomy of a Large-Scale Social Search Engine GoogleTechTalks Google Faculty Summit: The Anatomy of a Large Scale Social Search Engine (video link)video link