A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Artigo: Mining Frequent Patterns without Candidate Generation Jiawei Han, Jian Pei, and Yiwen Yin Resumo: Davis Ant. Peñaranda Zárate, Bolsista da CAPES/CNPq.

Apresentações semelhantes


Apresentação em tema: "Artigo: Mining Frequent Patterns without Candidate Generation Jiawei Han, Jian Pei, and Yiwen Yin Resumo: Davis Ant. Peñaranda Zárate, Bolsista da CAPES/CNPq."— Transcrição da apresentação:

1 Artigo: Mining Frequent Patterns without Candidate Generation Jiawei Han, Jian Pei, and Yiwen Yin Resumo: Davis Ant. Peñaranda Zárate, Bolsista da CAPES/CNPq – IEL Nacional - Brasil 1

2 Sumário Algoritmo A priori Solução proposta Algoritmo Execução Propriedades Desempenho 2

3 Algoritmo A priori É cansativo escanear repetidamente a base de dados e verificar um conjunto grande de candidatos usando Pattern matching. Congestionamento acontece na geração de conjunto de candidatos e os testes. Se fosse possível evitar gerar um conjunto grande de candidatos, o desempenho pode ser muito melhor. 3

4 Solução proposta Frequent pattern tree (FP-tree), para armazenar informação quantitativa sobre padrões frequentes. O crescimento é atingido com a concatenação do padrão sufixo com os nodos gerados de um FP-tree condicional. A técnica utilizada na mineração é baseada em partições e dividir-e-conquistar e não como o Apriori que é bottom-up na geração de combinações de itemset frequentes. 4

5 O algoritmo em termos formais Criar a raiz da árvore FP e cujo valor seja null. E para cada transação na BD fazer o seguinte. Seja [p|P], onde p é o primeiro elemento e P é o resto da lista. Executar com insertar_FP ([p|P], T) Definição de insertar_FP ([p|P], T): Se T tem um filho N e N.nome = p.nome, Então imcrementar a conta de N em 1. Sçenão criar novo nodo N com conta de 1. O enlace do pai ser enlaçado a T, e o enlace do nodo será enlaçado aos nodos com o mesmo nome. Se P não é vazio, chamar insertar_FP(P, N) recursivamente. 5

6 Execução do algoritmo ItemesItens frequentes ordenados f, a, c, d, g, i, m, pf, c, a, m, p a, b, c, f, l, m, of, c, a, b, m b, f, h, j, of, b b, c, k, s, pc, b, p a, f, c e, l, p, m, nf, c, a, m, p 6 ItemSoporte f4 c4 a3 b3 m3 p3 Soporte mínimo= 3 ItemSoporte d1 g1 i1 l2 o2 h1 ItemSoporte k1 s1 e1 n1 j1

7 Itens frequentes ordenados f, c, a, m, p f, c, a, b, m f, b c, b, p f, c, a, m, p 7 null c: 1 a:1 f:1 m:1 p:1

8 Itens frequentes ordenados f, c, a, m, p f, c, a, b, m f, b c, b, p f, c, a, m, p 8 null c: 2 a:2 f:2 m:1 p:1 b:1 m:1

9 Itens frequentes ordenados f, c, a, m, p f, c, a, b, m f, b c, b, p f, c, a, m, p 9 null c:2 a:2 f:3 m:1 p:1 b:1 m:1 b:1

10 Itens frequentes ordenados f, c, a, m, p f, c, a, b, m f, b c, b, p f, c, a, m, p 10 null c:2 a:2 f:3 m:1 p:1 b:1 m:1 b:1 p:1 c:1

11 Itens frequentes ordenados f, c, a, m, p f, c, a, b, m f, b c, b, p f, c, a, m, p 11 null c:3 a:3 f:4 m:2 p:2 b:1 m:1 b:1 p:1 c:1

12 Completitude Completitude Uma rota na árvore representa conjuntos de dados frequentes em multiplas transações sem ambiguidade. 12

13 Compactness Existe uma alta probabilidade de compartilhar os Itens por que os mais frequentes estão mais perto da raiz. O tamanho da árvore é muito menor que a base de dados original. 13

14 Propriedade: enlace-nodo Para cada qualquer item frequente a, todos os possíveis padrões frequentes que contem a podem ser obtidos seguindo os enlaces do nodo. Padrão condicional base, é o conjunto de rotas na árvore que estão antes de um item. 14

15 Propriedade: enlace-nodo ItemPadrão condicional base Árvore FP condicional p{(f:2, c:2, a:2, m:2), (c:1, b:1)} ({c:3}) m{(f:2, c:2, a:2), (f:1, c:1, a:1, b:1)} {(f:3, c:3, a:3)} b{(f:1, c:1, a:1), (f:1), (c:1)} a{(f:3, c:3)} c{(f:3)} f 15 null c:3 a:3 f:4 m:2 p:2 b:1 m:1 b:1 p:1 c:1

16 Comparação A priori-FP 16

17 Comparação A priori-FP 17

18 Comparação TreeProjection-FP 18

19 Comparação TreeProjection-FP 19


Carregar ppt "Artigo: Mining Frequent Patterns without Candidate Generation Jiawei Han, Jian Pei, and Yiwen Yin Resumo: Davis Ant. Peñaranda Zárate, Bolsista da CAPES/CNPq."

Apresentações semelhantes


Anúncios Google