A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Um Sistema de recomendação de consultas baseados em query log Diogo Mendonça.

Apresentações semelhantes


Apresentação em tema: "Um Sistema de recomendação de consultas baseados em query log Diogo Mendonça."— Transcrição da apresentação:

1 Um Sistema de recomendação de consultas baseados em query log Diogo Mendonça

2 Indice Introdução Objetivos Metodologia Estudo de Caso Conclusão

3 Introdução Contexto de site de consulta de negócios (Ex: Telelistas.net)‏ Cliente busca por produtos e serviços como palavras chave Nem sempre a consulta é precisa (ex: consertar monitor – Assistência técnica de monitores)‏ Existem serviços com mais de um nome (“homônimos”) - Ex. Xerox e Cópia

4 Objetivos Objetivo:  Melhorar a qualidade do mecanismo de busca sugerindo queries que possam ajudar o usuário a encontrar o que ele deseja  Utilizar as informações de busca e navegação dos usuários (query log) como fonte de informação

5 Metodologia Baseada no trabalho de (Baeza-Yates et al., 2006)‏ Trabalho baseado em mecanismo de busca de documentos Adaptação para busca de produtos/serviços  Documentos -> Negócios  Palavras chave -> Produtos / Serviços

6 Metodologia Queries Negócios Produtos ou Serviços

7 Metodologia Modelo de Dados (Query Log)‏

8 Metodologia Passos Algoritmo  Agrupamento das queries em clusters (feito periodicamente)‏ K-Means Critério de similaridade (a definir)‏ Pacote de software CLUTO  Query submetida é classificada em um dos cluster Classificador (a pesquisar)‏  Queries do cluster são ordenadas segundo um critério de similaridade e suporte (pode ser combinação linear)‏ Suporte - Fração de cliques que a query tem em seu cluster

9 Metodologia Similaridade (Baeza-Yates et al., 2006)‏  Term-Weight Vector (das URLs clicadas)‏ Pop(q,u) – Popularidade da URL na query (Fração dos cliques da url na query)‏ Tf( t, u) – Número de ocorrências do termo t na URL u  Cosine Function – Proporções similares dos termos nos documentos  Problema – Novo domínio Tf( t,u) é sempre 1

10 Cronograma Definir a função de similaridade - até 29/05 Descorir um classificador eficiente para o problema - até 29/05 Estudar o pacote de clustering CLUTO - até 29/05 Implementação - até 12/06 Possível teste (Toy Problem) - até 19/06 Escrever Relatório - até 4/07

11 Referências Baeza-Yates, R; Hurtado,C; Mendonza, M. Query Recommendation using Query Logs in Search Engines, 2006. CLUTO - Family of Data Clustering Software Tools. Página consultada em 20 de Maio de 2007,, 2007.


Carregar ppt "Um Sistema de recomendação de consultas baseados em query log Diogo Mendonça."

Apresentações semelhantes


Anúncios Google