Carregar apresentação
A apresentação está carregando. Por favor, espere
PublicouVictoria Dias Estrada Alterado mais de 8 anos atrás
1
Um Sistema de recomendação de consultas baseados em query log Diogo Mendonça
2
Indice Introdução Objetivos Metodologia Estudo de Caso Conclusão
3
Introdução Contexto de site de consulta de negócios (Ex: Telelistas.net) Cliente busca por produtos e serviços como palavras chave Nem sempre a consulta é precisa (ex: consertar monitor – Assistência técnica de monitores) Existem serviços com mais de um nome (“homônimos”) - Ex. Xerox e Cópia
4
Objetivos Objetivo: Melhorar a qualidade do mecanismo de busca sugerindo queries que possam ajudar o usuário a encontrar o que ele deseja Utilizar as informações de busca e navegação dos usuários (query log) como fonte de informação
5
Metodologia Baseada no trabalho de (Baeza-Yates et al., 2006) Trabalho baseado em mecanismo de busca de documentos Adaptação para busca de produtos/serviços Documentos -> Negócios Palavras chave -> Produtos / Serviços
6
Metodologia Queries Negócios Produtos ou Serviços
7
Metodologia Modelo de Dados (Query Log)
8
Metodologia Passos Algoritmo Agrupamento das queries em clusters (feito periodicamente) K-Means Critério de similaridade (a definir) Pacote de software CLUTO Query submetida é classificada em um dos cluster Classificador (a pesquisar) Queries do cluster são ordenadas segundo um critério de similaridade e suporte (pode ser combinação linear) Suporte - Fração de cliques que a query tem em seu cluster
9
Metodologia Similaridade (Baeza-Yates et al., 2006) Term-Weight Vector (das URLs clicadas) Pop(q,u) – Popularidade da URL na query (Fração dos cliques da url na query) Tf( t, u) – Número de ocorrências do termo t na URL u Cosine Function – Proporções similares dos termos nos documentos Problema – Novo domínio Tf( t,u) é sempre 1
10
Cronograma Definir a função de similaridade - até 29/05 Descorir um classificador eficiente para o problema - até 29/05 Estudar o pacote de clustering CLUTO - até 29/05 Implementação - até 12/06 Possível teste (Toy Problem) - até 19/06 Escrever Relatório - até 4/07
11
Referências Baeza-Yates, R; Hurtado,C; Mendonza, M. Query Recommendation using Query Logs in Search Engines, 2006. CLUTO - Family of Data Clustering Software Tools. Página consultada em 20 de Maio de 2007,, 2007.
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.