A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG.

Apresentações semelhantes


Apresentação em tema: "Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG."— Transcrição da apresentação:

1 Marcus Sampaio DSC/UFCG

2 Marcus Sampaio DSC/UFCG

3 Marcus Sampaio DSC/UFCG O Modelo Dados: –Um banco de dados de transações de compra –Cada transação é um conjunto de ítens comprados Encontrar todas as regras X => Y que associam um conjunto de ítens X com outro conjunto de ítens Y –Exemplo: 98% das pessoas que compram fraldas e comidas infantis também compram cerveja. –Qualquer número de ítens no consequente Y / antecedente X de uma regra –Regras com restrições (i.e., encontrar somente regras envolvendo produtos importados caros)

4 Marcus Sampaio DSC/UFCG Aplicações Perfis de clientes (Market basket analysis) Merchandizing Detecção de fraudes em seguros de saúde Organização de produtos em vitrines de lojas

5 Marcus Sampaio DSC/UFCG Confiança e Suporte Uma regra deve ter uma confiabilidade mínina (confidence), especificada pelo usuário –1 & 2 => 3 tem 90% de confiabilidade se quando um cliente comprou 1 e 2, em 90% dos casos, ele também comprou 3 Problema: poucas regras – sem validade estatística Solução: o conceito de suporte Uma regra deve ter um suporte (support) mínimo especificado –1 & 2 => 3 1, 2 e 3 devem aparecer em pelo menos uma quantidade mínima

6 Marcus Sampaio DSC/UFCG Exemplo Exemplo 1 Para suporte mínimo = 50%, e confiabilidade mínima = 50%, temos as seguintes regras –1 => 3 com 50% de suporte e 66% de confiabilidade –3 => 1 com 50% de suporte e 100% de confiabilidade

7 Marcus Sampaio DSC/UFCG Exemplo (2) Exemplo 2 Para suporte mínimo = 50%, e confiabilidade mínima = 90%, temos as seguintes regras –1 => 3 com 50% de suporte e 66% de confiabilidade – excluída –3 => 1 com 50% de suporte e 100% de confiabilidade Conclusão: regras de associação não são comutativas

8 Marcus Sampaio DSC/UFCG O Algortimo Apriori de Regras de Associação Há dois motivos fortes para mostrar como funciona um algoritmo de regras de associação –Os usuários do algoritmo ganham confiança –Algoritmos de mineração de dados geralmente são muito simples, não requerendo técnicas de inteligência artificial, como linguagens indutivas do tipo Prolog Resultados inteligentes Algoritmos tradicionais, e mais importante, com bom desempenho Veremos o seminal algoritmo Apriori

9 Marcus Sampaio DSC/UFCG Apriori (2) Algoritmo Apriori –Etapa 1: Encontrar todos os conjuntos de ítens com suporte mínimo conjuntos de ítens freqüentes Fase mais pesada, em termos de custos Muitos trabalhos de pesquisa em otimização –Etapa 2: Uso dos conjuntos de ítens freqüentes para gerar as regras Fase leve, em termos de custos

10 Marcus Sampaio DSC/UFCG Apriori (3) Suporte mínimo = 50% Confiabilidade mínima = 50% Para a regra 1 => 3: Suporte = Suporte({1, 3}) = 50% Confiabilidade = Suporte({1,3})/Suporte({1}) = 66%

11 Marcus Sampaio DSC/UFCG Apriori - Etapa 1 F k : Conjuntos de ítens freqüentes de tamanho k C k : Conjuntos de ítens candidatos de tamanho k F 1 = {conjuntos de ítens de tamanho 1} Para ( k=1; F k != ; k++) faça { C k+1 = Novos candidatos gerados de F k Para cada transação t no banco de dados faça Incremente o contador de todos os candidatos em C k+1 que estão contidos em t F k+1 = Candidatos em C k+1 com suporte mínimo } Saída: k F k

12 Marcus Sampaio DSC/UFCG Apriori - Etapa 2 Entrada: k F k Para cada F k –Para cada X, Y F k Se (Suporte(F k ) / Suporte(X)) Confiança então seleciona a regra X Y

13 Marcus Sampaio DSC/UFCG Otimização Cada subconjunto do um conjunto de ítens freqüente é também um conjunto de ítens freqüente Um conjunto de ítens candidato – F k – em C k+1 deve ser removido (pruned) se qualquer um dos seus subconjuntos não estiver contido em F k

14 Marcus Sampaio DSC/UFCG Exemplo Banco de Dados BD C1C1 F1F1 C2C2 F2F2 Varre BD Suporte > 50%

15 Marcus Sampaio DSC/UFCG Regras de Associação Generalizadas Hierarquias de ítens Associações através de hierarquias –A regra vestuário => calçados pode ser válida mesmo que vestuário => botas não seja válida vestuário outwear camisas jaquetascalças calçados sapatosbotas

16 Marcus Sampaio DSC/UFCG Regras de Associação Quantitativas Atributos numéricos (i.e. idade, rendimentos) Atributos nominais ou categóricos (i.e. temperatura alta) [Idade: ] e [Casado: Sim] => [NumCarros:2] suporte mínimo = 40% confiabilidade mínima = 50%

17 Marcus Sampaio DSC/UFCG Regras de Associação com Restrições Restrições são especificadas para focar somente em partes do BD de interesse –Exemplo: encontrar regras de associação em que os preços dos ítens são no máximo 200 reais

18 Marcus Sampaio DSC/UFCG Regras de Associação Temporais Pode descrever o rico caráter temporal dos dados Exemplo –{fralda} {cerveja} (suporte = 5%, confiabilidade = 87%) –O suporte desta regra pode saltar para 25% aos sábados de manhã

19 Marcus Sampaio DSC/UFCG Padrões de Seqüência Dadas –Uma seqüência de transações de clientes –Cada transação é um conjunto de ítens Encontrar os padrões das seqüências de transações desses clientes Exemplo: 10% dos clientes que compraram um PC fizeram um upgrade da memória do PC em uma transação subsequente –10% é o suporte dos padrões de seqüência


Carregar ppt "Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG."

Apresentações semelhantes


Anúncios Google