A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Desenvolvimento e Implantação de um Sistema para Recomendação de Tags utilizando Clustering e Classificação Textual para o Konnen Flávio Henrique Moura.

Apresentações semelhantes


Apresentação em tema: "Desenvolvimento e Implantação de um Sistema para Recomendação de Tags utilizando Clustering e Classificação Textual para o Konnen Flávio Henrique Moura."— Transcrição da apresentação:

1 Desenvolvimento e Implantação de um Sistema para Recomendação de Tags utilizando Clustering e Classificação Textual para o Konnen Flávio Henrique Moura Stakoviak

2 Roteiro Conceitos Clustering + Classificação Textual Resultados Considerações Finais

3 Roteiro Conceitos Clustering + Classificação Textual Resultados Considerações Finais

4 Conceitos Sistemas de Marcação Social Folksonomia Recuperação da Informação Clustering Sistemas de Recomendação

5 Conceitos Sistemas de Marcação Social Folksonomia Recuperação da Informação Clustering Sistemas de Recomendação

6 Sistemas de Marcação Social Tags Motivação – Recuperar Informação futuramente – Compartilhar – Expressar opiniões

7 Sistemas de Marcação Social (cont.)

8 Conceitos Sistemas de Marcação Social Folksonomia Recuperação da Informação Clustering Sistemas de Recomendação

9 Folksonomia Liberdade ao Usuário Marcações Populares nas Tags Organização da Web

10 Folksonomia (cont.) Problemas – Sobrecarga de Informações – Diferentes Tags para um mesmo conteúdo – Sistemas não tem interligações

11 Conceitos Sistemas de Marcação Social Folksonomia Recuperação da Informação Clustering Sistemas de Recomendação

12 Recuperação da Informação Auxiliar o usuário a busca por informações Etapas – Aquisição – Preparação – Indexação – Busca – Ordenação

13 Recuperação da Informação (cont.) Técnicas auxiliares – WebCrawler – Stop Words – Lematização

14 Conceitos Sistemas de Marcação Social Folksonomia Recuperação da Informação Clustering Sistemas de Recomendação

15 Clustering – é um método de descoberta de conhecimento que identifica agregações ou relações entre objetos, sendo um método útil para o agrupamento de documentos similares (WIVES, 1999)

16 Clustering (cont.) Etapas de Clustering – Representação de Padrões – Mediação da Proximidade – Identificação do Clustering (Técnicas) – Abstração dos Dados – Validação dos Clusters

17 Clustering (cont.) Técnicas de Clustering – Clustering Hierárquico – Algoritmo Particional – Density based – Model based

18 Clustering (cont.) Técnicas de Clustering – Clustering Hierárquico – Algoritmo Particional – Density based – Model based

19 Conceitos Sistemas de Marcação Social Folksonomia Recuperação da Informação Clustering Sistemas de Recomendação

20 Sistema de Recomendação

21 Sistemas de Recomendação (cont.) Tags – Uniformizar as marcações – Melhora a eficiência dos resultados das buscas – Folksonomia

22 Roteiro Conceitos Clustering + Classificação Textual Resultados Considerações Finais

23 Clustering + Classificação Textual Base de dados K agrupamentos Documento a ser analisado Lista de termos Peso de cada termo em cada cluster

24 Clustering + Classficação Textual (cont.) Lista de classificação de Termos Lista de classificação de Tags Histórico de Tags do Usuário ∩ ∩

25 Clustering + Classficação Textual (cont.) Lista de Tags Recomendadas

26 Roteiro Conceitos Clustering + Classificação Textual Resultados Considerações Finais

27 Resultados Konnen

28 Resultados (cont.) Módulo de Conteúdo Konnen Módulo de Recomendação Módulo Core Módulo de Segurança Outros módulos

29 Resultados (cont.) Konnen em desenvolvimento Estrutura em constante evolução Falta de conteúdo real para simulação

30 Resultados (cont.) Bibsonomy Servidor Local Utility.StopWords WebCrawler Utility.Util:GenerateData() Utility.User Utility.Tag Utility.ContentTag Utility.Content / Page Lematização Utility.Util:PrepareData() Utility.StopWords LemmaSharp.Ilemmatizer Utility.Content / Page

31 Resultados (cont.) Duração das Etapas (996 registros) Tempo WebCrawler 3 minutos Lematização 22 minutos

32 Resultados (cont.) MínimoMáximoMédia Número de tags por post 1231,35 Número de posts por usuário189939,84 Número de tags por usuário ,56

33 Resultados (cont.) Número de tags atribuídas por usuários às postagens

34 Resultados (cont.) Módulo de Conteúdo Konnen Módulo de RecomendaçãoClustering

35 Resultados (cont.) Documento: « Visual analytics tools for analysis of movement data » Etapas: – 5 execuções para cada valor de cluster = { 5, 10, 20, 25, 30 } – 5 melhores resultados

36 Resultados (cont.) Para 5 clusters TempoIteraçõesRecomendações 1ª execução4,633 data, analysis, reasoning, automatic, method 2ª execução 4,892 analysis, data, human, time, automatic 3ª execução 4,853 human, data, case, method, support 4ª execução 4,663 data, analysis, large, method, automatic 5ª execução 4,723 data, method, large, study, understanding

37 Resultados (cont.) Para 10 clusters TempoIteraçõesRecomendações 1ª execução8,503data, analysis, scale, support, automatic 2ª execução 14,472 analysis, data, large, reasoning e servisse 3ª execução 8,023 analysis, data, mobility, framework, human 4ª execução 14,694 data, analysis, tool, tools, method 5ª execução 8,343 data, analysis, framework, knowledge, visual

38 Resultados (cont.) Para 20 clusters TempoIteraçõesRecomendações 1ª execução28,604data, analysis, support, case, large 2ª execução 37,994 knowledge, data, analysis, case e human 3ª execução 36,214 data, tools, analysis, case, semantic 4ª execução 19,654 data, tools, analysis, support, techinique 5ª execução 10,203 data, analysis, large, study, human

39 Resultados (cont.) Para 25 clusters TempoIteraçõesRecomendações 1ª execução12,113data, analysis, human, semantic, visual 2ª execução 22,654 data, analysis, human, tools, visual 3ª execução 22,624 data, analysis, large, database, studies 4ª execução 11,933 data, analysis, support, collection, human 5ª execução 22,595 data, analysis, gps, human, visual

40 Resultados (cont.) Para 30 clusters TempoIteraçõesRecomendações 1ª execução27,064human, data, analysis, mobility, pattern 2ª execução 26,574 data, analysis, interactive, human, making 3ª execução 14,454 data, analysis, human, method, mobility 4ª execução 14,753 data, analysis, human, knowledge, mobility 5ª execução 27,383 data, analysis, human, semantic, visual

41 Resultados (cont.) Fr eqüência dos colocados: – 1o : data(18), analysis(3), human(2), knowledge(1) – 2o : analysis(16), data(6), tools(2), method(1) – 3o : human (5), large (5), analysis(4), case, reasoning, scale, mobility, tool, gps – 4o : method (3), case (3), study(2), support(2), knowledge (2), semantic(2), human(2), tools(2), automatic(1), time(1), reasoning(1), framework(1), collection(1), mobility(1) – 5o : visual(5), human(4), automatic(3), method(2), support(1), understanding(1), servisse(1), large(1), semantic(1), techinique(1), pattern(1), making(1)

42 Resultados (cont.) Melhores recomendações: – data, analysis, human/large, method/case, visual Tempo de execução muito alto Usuário web quer tempo de resposta baixo

43 Resultados (cont.) Para 50 documentos e 3 clusters: – Tempo de execução: 1,38 segundos – Recomendação: automatic, knowledge, gps, method, pattern Qualidade da recomendação fraca

44 Roteiro Conceitos Clustering + Classificação Textual Resultados Considerações Finais

45 Boa performance Excelente qualidade das recomendações Funciona em qualquer ambiente

46 Considerações Finais Depende de uma base com um bom vocabulário Usuários online: pré-classificação dos documentos

47 Desenvolvimento e Implantação de um Sistema para Recomendação de Tags utilizando Clustering e Classificação Textual para o Konnen Flávio Henrique Moura Stakoviak


Carregar ppt "Desenvolvimento e Implantação de um Sistema para Recomendação de Tags utilizando Clustering e Classificação Textual para o Konnen Flávio Henrique Moura."

Apresentações semelhantes


Anúncios Google