Sistemas de Recomendação Fausto Jose Feitosa Barbosa Gominho (fjfbg) Vinícius Cezar Monteiro de Lira (vcml)
Roteiro Introdução Coleta de Informações Estratégias de Recomendação Técnicas de Recomendação Aplicações Conclusão
introdução
Como proceder nestes casos? Introdução Com a quantidade de informações e com a disponibilidade facilitada das mesmas pelo acesso a Internet, as pessoas se deparam com uma diversidade muito grande de opções. Muitas vezes um indivíduo possui pouca ou quase nenhuma experiência pessoal para realizar escolhas dentre várias alternativas que lhe são apresentadas. Como proceder nestes casos? Confiando nas recomendações que são passadas por outras pessoas. forma direta (word of mouth) textos de recomendação
Introdução Os Sistemas de Recomendação auxiliam no aumento da capacidade e eficácia do processo de indicação já bastante conhecido na relação social. Segundo Burke um Sistema de Recomendação é qualquer sistema que produza recomendações individualizada, ou que guie o usuário de forma a apresentar conteúdo do seu interesse dentre uma variedade de opções.
Introdução O projeto Tapestry Utilizava opiniões de pessoas de uma comunidade pequena (e.g. escritório ou grupo de trabalho) para encontrar recomendações. Filtragem Colaborativa Resnick defendeu o termo “sistemas de recomendação” como terminologia mais genérica do que filtragem colaborativa, já que sistemas de recomendação podem existir sem nenhuma colaboração entre as pessoas.
Quem usa?
Coleta de Informações
Coleta de Informação Para que se posa recomendar itens a um usuário, é necessário se ter conhecimento sobre quem é o usuário. É necessário capturar e armazenar seus dados pessoais e comportamentais. Duas das formas mais usuais de identificação: Identificação no servidor Identificação no cliente
Identificação no servidor
Identificação no cliente Utiliza cookies para identificar a máquina. Menos confiável utiliza normalmente cookies, um mecanismo pelo qual um website consegue identificar que determinado computador está se conectando mais uma vez a ele. Este método assume que a máquina conectada é utilizada sempre pela mesma pessoa. Logo, ao identificar a máquina, o website está na realidade identificando seu usuário. Trata-se de um mecanismo mais simples do que a identificação através do servidor porém menos confiável, principalmente se o computador identificado for utilizado por mais de uma pessoa. Utiliza cookies para identificar a máquina. Menos confiável
Coleta de Informação Depois de identificar o usuário, é possível coletar dados sobre este de forma explícita ou implícita. Explícita (customização) O usuário indica espontaneamente o que lhe é importante. Implícita O sistema infere as necessidades e preferências do usuário através de suas ações.
Coleta de Informação Explícita (customização) Usuário Serviços desejados faustofeitosa@gmail.com Gastronomia Turismo
Coleta de Informação Implícita Usuário Item Categoria Data Acesso faustofeitosa@gmail.com A001 Gastronomia 10/10/2012 B023 Turismo D005 14/10/2012
Estratégias de Recomendação
Estratégias de Recomendação Os principais objetivos do sistemas de recomendação são a fidelidade e consequentemente o aumento do lucro. As estratégias mais utilizadas são: Listas de recomendação Reputação do produto Suas recomendações Recomendação por associação Associação por conteúdo
Lista de Recomendação Mantêm listas de itens organizados por tipos de interesses.
Reputação do Produto Além de comprar um produto o usuário ainda o avalia. É preciso que haja veracidade das opiniões fornecidas.
Suas Recomendações A lista de itens é inteiramente dedicada ao usuário.
Recomendação por Associação Usuários que se interessaram por X também se interessaram por Y. Forma mais complexa de recomendação Analisa os hábitos do usuário para a identificação de padrões.
Associação por Conteúdo As recomendações são feitas a partir do conteúdo de determinado item, por exemplo um autor, um compositor, um editor, etc
Técnicas de recomendação
Formalização do Problema Seja C o conjunto de todos os usuários de um determinado sistema Cada elemento de C é definido através de um profile; Seja S o conjunto de todos os possíveis itens que podem ser recomendados Cada item do espaço S pode ser definido por um conjunto de características Seja u a função utilidade que mede o quão útil é um determinado item s para um determinado usuário c u:C x S → R Onde R é um conjunto totalmente ordenado Geralmente a utilidade é definida através de avaliações http://pt.wikipedia.org/wiki/Sistema_de_recomenda%C3%A7%C3%A3o
Formalização do Problema Então, para cada usuário c ∈ C, procura-se um item s' ∈ S que maximiza a utilidade do usuário. ∀ c ∈ C, s' = argmaxs∈S u(c,s) Geralmente a utilidade é definida através de avaliações. São definidas apenas nos itens previamente avaliados pelos usuários A utilidade u geralmente não é definida em todo o espaço C x S. Problema central dos sistemas de recomendação
Formalização do Problema Assim o algoritmo de recomendação deve: Ser capaz de estimar (predizer) as avaliações não realizadas para os pares usuário-item. Fazer recomendações apropriadas baseadas nestas predições. Os sistemas de recomendação são classificados de acordo com o método de predição utilizado: Filtragem Baseada em Conteúdo. Filtragem Colaborativa. Filtragem Híbridos.
Filtragem Baseada em Conteúdo Recomenda ao usuário itens que sejam semelhantes ao que ele preferiu no passado. A recomendação é feita a partir de tags "descritoras" de itens. Baseada na similaridade dos itens. É a abordagem mais simples. Um sistema de recomendação baseado em conteúdo recomenda ao usuário produtos que sejam semelhantes ao que ele preferiu no passado. A recomendação é feita a partir de tags "descritoras" de itens. Itens com características próximas destas tags são recomendados.Em um cenário de recomendação de filmes, por exemplo, um usuário que, assiste e gosta do filme "Matrix" teria recomendações do gênero ação e ficção científica. Vantagens deste tipo de sistema é que são simples para dados textuais e não necessitam de muitas informações sobre um usuário para sugerir itens. Todavia, além de serem difíceis de aplicar em contextos multimídia, podem oferecer recomendações repetitivas, recomendando sempre assuntos que o usuário já conhece.
Filtragem Baseada em Conteúdo Funcionamento: X-men Titanic O Exorcista Os Vingadores Gostei Usuário Atual Recomendado
Filtragem Baseada em Conteúdo Desvantagens: Cálculo da similaridade Definição das características dos itens Super Especialização Não proporciona apresentação de conteúdo novo ao usuário Efeito Portfólio Podem oferecer recomendações repetitivas Similaridade – Roupas e brinquedos, características como: tamanho, preço, cor, marca. Até textos possue suas dificuldades. Super Especialização - Alguém que nunca experimentou sushi, não receberá indicação de um restaurante de sushi Podem oferecer recomendações repetitivas. Efeito Portfólio - Já que eu gostei de um filme do Didi (quando criança), vai me indicar todos os outros
Filtragem Colaborativa Consiste na recomendação de itens que pessoas com gosto semelhante preferiram no passado. Relevância da recomendação é obtida pelo grau de similaridade com outros usuários. Análise de vizinhança Não exige a extração de características dos itens.
Filtragem Colaborativa Filme M Filme N Filme O Filme P Funcionamento: Similares Maria João Catarina Usuários devem avaliar itens de acordo com seu interesse. O sistema descobre usuários com padrões similares de comportamento ao do usuário atual. Processa as avaliações feitas por esse subconjunto de usuários. E recomenda itens que o usuário atual ainda não avaliou. Gosta: Filme A Filme B Filme C Gosta: Filme F Filme G Filme H Gosta: Filme A Filme B Filme C
Filtragem Colaborativa Exemplo: Recomendar um produto ao usuário Mauro: Usuários devem avaliar itens de acordo com seu interesse. O sistema descobre usuários com padrões similares de comportamento ao do usuário atual. Processa as avaliações feitas por esse subconjunto de usuários. E recomenda itens que o usuário atual ainda não avaliou. Os produtos Prod1e Prod5 seriam recomendados a Mauro.
Filtragem Colaborativa Desvantagens: Um novo item nunca é recomendado até que um usuário o avalie Um usuário exótico terá dificuldades para encontrar outros usuários com gostos similares. Necessita de uma vasta base de dados. Caso o numero de usuários seja pequeno em relação ao numero de itens, causará problema. O problema do avaliador.
Filtragem Híbrida Consiste em combinar as duas abordagens mencionadas tentando fortificá-las e superar suas desvantagens. O mais comum é combinar a filtragem colaborativa com outras técnicas. Vantagens: Recomendação de itens diretamente relacionado ao histórico Bons resultados para usuários incomuns Precisão independente do número de usuários
Aplicações
Áreas de Aplicações Comércio Eletrônico Educação e Científica Turismo Recomendação de produtos e serviços Educação e Científica Recomendação de artigos e cursos Turismo Recomendação de viagens e pontos turísticos Saúde Recomendação de tratamentos Rede Social Recomendação de casais e amigos Marketing Propaganda eletrônica
CineDica Sistema de recomendação para filmes e seriados Informações de Profile Marcar inicialmente filmes que gostou
CineDica
Last.fm Sistema de recomendação para músicas A Last.fm permite que você mantenha um registro do que ouve* em qualquer player. Com base no seu gosto musical, a Last.fm lhe recomendará mais músicas e shows. Utilização de filtragem por conteúdo
Last.fm
Youtube YouTube: Sugestão de vídeos. Lista de recomendação. Associação de conteúdo.
Amazon Inicialmente, era uma livraria online. Atualmente, é a maior empresa de comércio eletrônico dos EUA. Realiza grandes investimentos em recomendação, possuindo uma abordagem híbrida. Cerca de 38% de suas vendas provêm de suas sugestões.
Amazon Avaliações dos usuários
Amazon Sugestão de itens que o usuário possa querer comprar. Lista de recomendação. Usuários que se interessam por “X” também se interessam por “Y.”
Tendências e Conclusão
Tendências A tendência é Intensificar o uso de características comportamentais em sistemas de recomendação. Web Semântica Os computadores poderem entender o significado da informação. Eles poderão aprender sobre o que estamos interessados e nos ajudar a encontrar o que realmente queremos. Recomendar produto por email é invasivo apenas se o produto for desinteressante para o cliente
Conclusão Nós estamos sobrecarregados de informação, grande partes dessas informações não são uteis para nossas necessidades. Os sistemas de recomendação atuam de forma a sugerir algo de interesse ao usuário. Aumentam a qualidade no serviço prestado em vários segmentos: Auxiliam clientes na busca de produtos que ele desejaria comprar Melhoram a venda cruzada de produtos (compras adicionais) Recomendar produto por email é invasivo apenas se o produto for desinteressante para o cliente
Referências Cazella, Sílvio César , Maria Augusta S. N. Nunes, e Eliseo Berni Reategui. “A Ciência da Opinião: Estado da arte em Sistemas de Recomendação.” s.d. http://200.17.141.213/~gutanunes/hp/publications/JAI4.pdf (acesso em 15 de 10 de 2012). Reategui, Eliseo Berni, e Sílvio César Cazella. XXV Congresso da Sociedade Brasileira de Computação - Sistemas de Recomendação. s.d. http://200.169.53.89/download/cd%20congressos/2005/SBC%202005/pdf/arq0287.pdf (acesso em 15 de 10 de 2012).
Referências Souza, Renata Ghisloti Duarte. “Aplicando Sistemas de Recomendação em Situações Práticas.” s.d. http://www.ibm.com/developerworks/br/local/data/sistemas_recomendacao/index.html (acesso em 11 de 10 de 2012). Caraciolo, Marcel Pinheiro – Sistema de Recomendação Personalizando sua experiência de compra. s.d. http://www.slideshare.net/marcelcaraciolo/sistemas-de-recomendao-e-inteligncia-coletiva (acesso em 14 de 10 de 2012).
Fausto Jose Feitosa Barbosa Gominho Vinícius Cezar Monteiro de Lira OBRIGADO Fausto Jose Feitosa Barbosa Gominho Vinícius Cezar Monteiro de Lira