Sistema Recomendador para Comércio Eletrônico

Slides:



Advertisements
Apresentações semelhantes
Mineração de Dados Algoritmo APRIORI
Advertisements

Introdução aos Sistemas de Informação Gerencial
Curso Superior de Engenharia Elétrica
Desafios em Implementar um Sistema Sensível ao Contexto (Challenges in Implementing a Context-Aware System) Autor: M. Satyanarayanan Alunos: Márcio de.
Introdução a Algoritmos
Agenda Introdução Justificativa Objetivo Detecção de Spam
INTELIGÊNGIA COMPUTACIONAL
ANÁLISE DISCRIMINANTE
Felipe Carvalho – UFES 2009/2
Uma das tarefas descritivas da
HAC MD -junho/ Noções de algoritmos e estudo de casos das principais tarefas de Mineração de dados.
1 Mineração de Dados - Trabalho Final junho/julho de 2008 Selecionar um arquivo de dados entre os sugeridos no repósitório UCI (
Disciplina:Tópicos Avançados de Sistemas de Informação
Mineração de Dados ou Descoberta de conhecimento em BDs
Medida do Tempo de Execução de um Programa
Medida do Tempo de Execução de um Programa
Avaliação de Sistemas Operacionais
Avaliação de Desempenho Planejamento de Experimentos 2 Aula 2 Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo Instituto de.
A FAST APRIORI implementation
CLOSET: An Efficient Algorithm for Mining Frequent Closed Itemsets Jian Pei, Jiawei Han e Runying Mao Apresentação preparada por Alexandre Lorenzatti.
Mining Frequent Patterns without Candidate Generation
O processo de coletar os requisitos (escopo do cliente)
AGRADECIMENTOS: MOTIVAÇÃO: OPC é um padrão industrial aberto para transmissão de dados em tempo real, esse padrão está sendo adotado pela maioria dos fabricantes.
TIPOS DE TESTES APLICÁVEIS E NÃO APLICÁVEIS AO PROJETO
Anderson Berg Orientador: Prof. Fernando Buarque
ADMINISTRAÇÃO DE RECURSOS E MATERIAIS
II. M o d e l o s d e C o n h e c i m e n t o
Marco Antonio Montebello Júnior
ATIVIDADE U 05 GRUPO 19U.
Introdução aos conceitos de Teste de Software
Tomada de Decisão e Sistemas de Informação
Sistemas de Recomendação
Fundamentos de Engenharia de SW
Estrutura de Sistemas de Informação
Aula 03 – BCC202 Análise de Algoritmos (Parte 1) Túlio Toffolo www
Gerenciamento de Dados
Algoritmos 1º Semestre Materia: Informática Profº: Cristiano.
Redes Bayesianas - Aplicação em Risco Operacional
ITIL(Information Technologies Infrastructure Library)
O Processo de KDD Data Mining SUMÁRIO - AULA1 O processo de KDD
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG Etapas do Processo.
Experimentação Algorítmica
Teste de Software Conceitos iniciais.
Tecnologia da Informação Aplicada à Logística
O que é? É o processo de investigação técnica com intuito de identificar a qualidade, a segurança e a exatidão do software desenvolvido. A validação do.
Filtragem Colaborativa
Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do.
Introdução a Teste de Software
Sistemas de Informação
GERENCIAMENTO DE PROJETOS DE T.I
METODOLOGIA, MÉTODOS E FERRAMENTAS
Gabriel Bastos Machado
ANÁLISE DOS SERVIÇOS OFERTADOS PELA BIBLIOTECA UNIVERSITÁRIA NORTE DA ILHA VISANDO À OTIMIZAÇÃO DE SUA UTILIZAÇÃO PELA COMUNIDADE ACADÊMICA Introdução.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG O Problema Dados –Um banco de transações de compra –Cada transação é um conjunto de ítens comprados Encontrar.
Mineração de Dados: Introdução
Sumário 1 SQL Embutida 2 Processamento de Consultas
Disciplina Engenharia da Qualidade II
Profª Eliane Costa Santana
Prof. Sidney Galeote. 2 www. prasabermais. com  Visão Geral sobre a dimensão de qualidade “performance”  Custo da qualidade  Como a performance deve.
Mineração de Dados Felipe Carvalho – UFES 2009/2.
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
Detecção de tráfego Skype na Web através de Redes Neurais Artigo Original: Freire, P. E., Ziviani, A., and Salles, R. M. (2008). Detecting skype flows.
Mineração de Dados Classificação Felipe Carvalho – UFES 2009/2.
Estimativa, Teste e Inspeção de Software
PROJETO SPICE ISO Integrantes: Erickson Balzaneli
Marketing de Relacionamento CARLOS FREIRE – Estratégia de Marketing e Posicionamento Competitivo – Hooley, Saunders e Piercy – Prentice Hall.
FERRAMENTAS DA QUALIDADE
Sistema de Informações Qualidade e Armazenamento das Informações O impacto das mudanças e as Tendências em SIs Papéis Fundamentais de SI na Empresa.
CMMI Capability Maturity Model Integration
Transcrição da apresentação:

Sistema Recomendador para Comércio Eletrônico Aluno: Felipe Carvalho Perestrelo Supervisora: Kelly Braghetto 1. Introdução 3. O Algoritmo Apriori Ambas foram eliminadas dos testes seguintes. Sistemas recomendadores são utilizados em sites de internet com o objetivo de sugerir itens relevantes para o usuário. Tais sugestões estão relacionadas a processos de tomadas de decisão (neste contexto, chamadas de transações), como quais itens comprar, que música ouvir ou que notícia online assistir. São desenvolvidos com algoritmos que avaliam dados históricos de transações para gerarem as recomendações estatisticamente mais prováveis de serem aceitas pelos usuários, com o objetivo de aumentar a quantidade de transações. No caso de um comércio eletrônico, é uma ferramenta chave para o aumento de receita ajudando no cross-sell (estratégia de marketing cujo objetivo é aumentar a quantidade de itens comprados por um cliente). O objetivo deste trabalho é desenvolver um sistema recomendador para um comércio eletrônico específico focado no comércio de produtos de necessidades básicas masculinas, como produtos de higiene pessoal, meias, cuecas, etc. O algoritmo Apriori foi um dos pioneiros a realizar tarefas de associação, e até hoje é largamente utilizado pela sua eficiência. Ele é composto por basicamente duas etapas. A primeira é a geração dos conjuntos de itens frequentes (FIM - frequent itemset mining), ou seja, dos conjuntos que itens que satisfazem o suporte mínimo. A segunda parte consiste na geração das regras. O desempenho do algoritmo está ligado basicamente à primeira parte, onde podem ser geradas diversas combinações de itens e verificações de frequência, podendo ser bastante custoso. Esta etapa é, portanto, foco de estudos para melhoria do algoritmo. Grandes melhorias foram obtidas utilizando estruturas de dados mais eficientes. Tabela2: Resultado dos testes com dez mil transações. Tabela3: Resultado dos testes com vinte mil transações. Tabela4: Resultado dos testes com quarenta mil transações. 4. Desenvolvimento 2. Mineração de Dados Para o nosso trabalho foram implementadas duas versões do algoritmo, ambas em PHP. A primeira se vale das vantagens de hashing de vetores otimizado do PHP para construir os conjuntos de itens frequentes (identificada como aprioriPHP). A segunda utiliza consultas em SQL para tal tarefa (identificada como aprioriSQL). A base de dados do varejo foco do trabalho é pequena para avaliação de um trabalho de mineração de dados (cerca de 2600 transações), portanto foi utilizada uma outra base com cerca de 80 mil transações, também de um comércio eletrônico real, porém do segmento de produtos infantis. Além disso, foram avaliadas outras duas ferramentas: Weka - coletânea renomada de algoritmos para tarefas de mineração de dados -, e uma implementação acadêmica, em código aberto, de um pesquisador chamado Ferenc Bodon. Os testes foram feitos com tamanhos de bases diferentes - 1k, 10k, 20k, 40k e 80k -, e 5 versões diferentes de cada base, geradas aleatoriamente - o resultado final é a média dos tempos medidos. Também foram usados suportes mínimos diferentes - 1%, 0,5% e 0,1%. Os resultados foram: Tabela5: Resultado dos testes com oitenta mil transações. Os resultados destacam a implementação de Ferenc Bodon pelo seu desempenho. Porém, a partir da comparação das regras geradas entre a implementação do Ferenc Bodon e a aprioriSQL, para melhor análise dos resultados, notou-se que algumas regras não foram geradas por aquele sistema. O sistema aprioriSQL, entretanto, gerou todas as regras. Para a implementação do sistema foi descartada a versão aprioriPHP, sendo utilizada apenas a aprioriSQL. A entrada do sistema é o suporte mínimo e a confiança, e pode facilmente ser adaptado à estrutura básica de um comércio eletrônico. Futuramente será implementada a possibilidade de realizar as tarefas em outros níveis de granularidade, como categorias de produtos. Isso é especialmente interessante quando não temos regras suficientemente confiáveis no nível de produtos, devido a especificidade. Para o desenvolvimento do projeto, foram estudados conceitos de mineração de dados. Mineração de dados é um processo computacional que visa descobrir padrões em grandes bases de dados. Ela pode ser classificada pelas tarefas que a compõe: Descrição, Classificação, Estimação (ou Regressão), Predição, Agrupamento e Associação. Esta última é a principal tarefa utilizada em sistemas recomendadores e, portanto, a mais estudada. Ela consiste em identificar a relação entre dois atributos na forma “SE X ENTÃO Y”. Se utiliza de uma técnica chamada de regra de associação. Uma regra de associação é da forma X => Y, onde X e Y são conjuntos de itens. O suporte de cada conjunto é a porcentagem das transações em que ele está presente - a quantidade absoluta é chamada de frequência. E a confiança de uma regra X => Y é dada por (X U Y) / X. A tarefa de associação tem como entrada o conjunto de transações, o suporte mínimo e a confiança mínima. A saída é regras que satisfazem a confiança mínima. 5. Conclusão Mineração de dados é uma ciência extremamente importante para lidar com a grande quantidade de dados gerada nos dias de hoje. Em um comércio eletrônico, um sistema recomendador de produtos é uma ferramenta de grande importância para contribuir com o aumento do faturamento. O sistema implementado é de fácil adaptação à estrutura básica de um sistema de comércio eletrônico e suficientemente eficiente. Apesar de ter desempenho inferior a uma das ferramentas comparadas, gerou todas as regras possíveis, e ainda assim seu desempenho é satisfatório. Tabela1: Resultado dos testes com mil transações. Após o primeiro teste ficou evidente a diferença de desempenho entre Weka e aprioriPHP em relação às outras implementações. Weka teve um tempo de execução extremamente alto comparado com as outras implementações, e aprioriPHP teve problema com alocação de memória. Figura1: Exemplo de regras de associação. MAC0499-2013: Trabalho de Formatura Supervisionado