Flávio Henrique Moura Stakoviak

Slides:



Advertisements
Apresentações semelhantes
IFTO ESTRUTURA DE DADOS AULA 05 Prof. Manoel Campos da Silva Filho
Advertisements

Auditoria de Processo Marcelo Waihrich Souza
Medidas de Avaliação de Sistemas de Recuperação de Informação
Experiments with Clustering as a Software Remodularization Method Nicolas Anquetil and Timothy C. Lethbridge University of Ottawa, Canada WCRE 1999:
APRESENTAÇÃO DE TCCS MITIE MAEMURA.
Vamos contar D U De 10 até 69 Professor Vaz Nunes 1999 (Ovar-Portugal). Nenhuns direitos reservados, excepto para fins comerciais. Por favor, não coloque.
1 As Tecnologias da Informação na Administração Pública Indicadores Estatísticos Instituto de Informática Rosa Maria Peças Conferência A acessibilidade.
Tipos de Sites Web gerados pelo VS2005
Criar uma Aplicação Web em ASP.NET v Tipos de Sites Web gerados pelo VS2005 File-system Web sites Ficheiros armazenados num directório local É utilizado.
CARACTERIZAÇÃO E IMPLEMENTAÇÃO DE MECANISMOS DE RESILIÊNCIA A ATAQUES Alex Borges Outubro de
Resultados da Pesquisa "Identificação de Valores de Jovens Brasileiros – Uma Nova Proposta", realizada pela Profª. Dra. Rosa Maria Macedo, da PUC de São.
BD em.NET: Passo a passo conexão com SQL Server 1º Semestre 2010 > PUCPR > BSI Bruno C. de Paula.
Pesquisa Bibliográfica Disciplina de Metodologia da Pesquisa Profª Tereza Yoshiko Kakehashi 1.
Análise de Casos de Uso.
1 INQUÉRITOS PEDAGÓGICOS 2º Semestre 2003/2004 ANÁLISE GERAL DOS RESULTADOS OBTIDOS 1.Nº de RESPOSTAS ao inquérito 2003/2004 = (42,8%) 2.Comparação.
Gerenciamento de tempo do projeto
Testes de Troca de Arquivos no Bacen Jud 2.0
Aula 5 : Sinalização Horizontal
Curso de ADMINISTRAÇÃO
Marfin sobre o Documentador;. Marfin sobre o Documentador;
Método de Clusterização baseado em Densidade Algoritmo DBSCAN
1 MODELAGEM COM A UML (UNIFIED MODELING LANGUAGE) BREVE HISTÓRICO CARACTERÍSTICAS CONCEITOS DE PROGRAMAÇÃO ORIENTADA A OBJETOS MODELAGEM DE ANÁLISE E DE.
1 Objetos Relacionados a um banco de dados. 2 Introdução Visual Basic dispõe de um conjunto de objetos, que através de suas propriedades e métodos, nos.
S TÉFANI P IRES Mineração de Dados – Trimestre Prof. Marcus Sampaio 02/12/2008 Mineração de Dados.
Classificação (Ordenação) de dados
Auditoria de Segurança da Informação
Arquivo atualizado em 29/set/13. VESTIBULARES DAS UNIVERSIDADES PÚBLICAS DE SP.
O que é 5(S)? ? 5(S) É a prática de hábitos que permitem mudanças nas relações... É a base de qualquer programa de qualidade. 1.
Consideremos como exemplo um Item de Contrato com os seguintes dados: E tenha sido cadastrado apenas um tipo de turma: SIGAE PNQ WEB EducandosValores RECURSO25.
SISTEMA DE CONTROLE DE REMANEJAMENTO E RESERVA TÉCNICA - SISCORT
Fraction Action FRACÇÕES.
Classes e objetos P. O. O. Prof. Grace.
MÉTODO DE OVULAÇÃO BILLINGS (MOB) ROTEIRO: IRMÃ MARTA BERING*
Provas de Concursos Anteriores
Análise de Casos de Uso Alexandre Motnteiro.
Desenvolvimento de Projetos e Aplicações Web
Hamburgo, Alemanha Definir o caminho que irá permitir a Lions Clubs International alcançar o seu potencial pleno como organização.
IDENTIFICAÇÃO, MODELAGEM E ANÁLISE DE PROCESSOS Luís Gonzaga Trabasso
Ministério de Minas e Energia
Inteligência Artificial
Programa de Capacitação em Projetos Culturais
Aprendizagem de Máquina - Agrupamento
Aluno: Mário Monteiro Orientador: Sérgio Soares 1.
Resultantes de Sistemas de Forças Cap. 4
Object Oriented Software Construction (MEYER, Bertrand)
Engenharia Civil e Ambiente ANÁLISE ESTRUTURAL, 5 de Dezembro / 33 ANÁLISE ESTRUTURAL ENGENHARIA CIVIL E AMBIENTE.
Anderson Berg Orientador: Prof. Fernando Buarque
1 António Arnaut Duarte. 2 Sumário: primeiros passos;primeiros passos formatar fundo;formatar fundo configurar apresentação;configurar apresentação animação.
SISTEMAS OPERACIONAIS
GAPH Integração de Hardware do Usuário ao CoreConnect Leandro Heleno Möller e Leonel Pablo Tedesco Prototipação Rápida e Computação.
Salas de Matemática.
Taxonomia Profa. Lillian Alvares,
Coordenação Geral de Ensino da Faculdade
Ordenação Externa de Arquivos – Um exemplo
É u m e l e m e n t o f u n d a m e n t a l
1/40 COMANDO DA 11ª REGIÃO MILITAR PALESTRA AOS MILITARES DA RESERVA, REFORMADOS E PENSIONISTAS - Mar 06 -
Técnicas de Modelagem para Aplicações em Computação Gráfica
Projeto de Banco de Dados
1 2 Observa ilustração. Cria um texto. Observa ilustração.
DIEGO RICARDO DE ARAUJO DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO INSTITUTO DE CIÊNCIA EXATAS UNIVERSIDADE FEDERAL DE JUIZ DE FORA Seleção de Características.
SairPróximo Itens de Seleção Probabilidades e Combinatória Cálculo de Probabilidades. Regra de Laplace. ITENS DE SELEÇÃO DOS EXAMES NACIONAIS E TESTES.
SairPróximo Itens de Seleção Probabilidades e Combinatória Cálculo Combinatório. Problemas de Contagem. ITENS DE SELEÇÃO DOS EXAMES NACIONAIS E TESTES.
Recuperação de Informação
Redes Neuronais/Neurais/ Conexionistas Introdução
+14 Setembro 2014 Indicador > +20 Indicador 0 para +20 Indicador 0 para -20 Indicador < -20 Total da UE: +1 Indicador > +20 Indicador 0 para +20 Indicador.
Banco de Dados Parte 04 Ceça. Ceça Moraes 2 Conteúdo  Os três níveis da arquitetura  Mapeamentos  Arquitetura cliente-servidor.
Curso: Cerimonial, Protocolo e Eventos
CALENDÁRIO 2013 MÓDULO II.
Módulo Compras Relatórios e Relações 1. Objetivo 2 Conhecer os relatórios e as relações do sistema disponibilizadas no módulo Compras.
Recuperação Inteligente de Informação
Transcrição da apresentação:

Flávio Henrique Moura Stakoviak Desenvolvimento e Implantação de um Sistema para Recomendação de Tags utilizando Clustering e Classificação Textual para o Konnen Flávio Henrique Moura Stakoviak

Roteiro Conceitos Clustering + Classificação Textual Resultados Considerações Finais

Roteiro Conceitos Clustering + Classificação Textual Resultados Considerações Finais

Conceitos Sistemas de Marcação Social Folksonomia Recuperação da Informação Clustering Sistemas de Recomendação

Conceitos Sistemas de Marcação Social Folksonomia Recuperação da Informação Clustering Sistemas de Recomendação

Sistemas de Marcação Social Tags Motivação Recuperar Informação futuramente Compartilhar Expressar opiniões

Sistemas de Marcação Social (cont.)

Conceitos Folksonomia Sistemas de Marcação Social Recuperação da Informação Clustering Sistemas de Recomendação

Folksonomia Liberdade ao Usuário Marcações Populares nas Tags Organização da Web

Folksonomia (cont.) Problemas Sobrecarga de Informações Diferentes Tags para um mesmo conteúdo Sistemas não tem interligações

Conceitos Recuperação da Informação Sistemas de Marcação Social Folksonomia Recuperação da Informação Clustering Sistemas de Recomendação

Recuperação da Informação Auxiliar o usuário a busca por informações Etapas Aquisição Preparação Indexação Busca Ordenação

Recuperação da Informação (cont.) Técnicas auxiliares WebCrawler Stop Words Lematização

Conceitos Clustering Sistemas de Marcação Social Folksonomia Recuperação da Informação Clustering Sistemas de Recomendação

Clustering Clustering é um método de descoberta de conhecimento que identifica agregações ou relações entre objetos, sendo um método útil para o agrupamento de documentos similares (WIVES, 1999)

Clustering (cont.) Etapas de Clustering Representação de Padrões Mediação da Proximidade Identificação do Clustering (Técnicas) Abstração dos Dados Validação dos Clusters

Clustering (cont.) Técnicas de Clustering Clustering Hierárquico Algoritmo Particional Density based Model based

Clustering (cont.) Técnicas de Clustering Algoritmo Particional Clustering Hierárquico Algoritmo Particional Density based Model based

Conceitos Sistemas de Recomendação Sistemas de Marcação Social Folksonomia Recuperação da Informação Clustering Sistemas de Recomendação

Sistemas de Recomendação Sistema de Recomendação

Sistemas de Recomendação (cont.) Tags Uniformizar as marcações Melhora a eficiência dos resultados das buscas Folksonomia

Roteiro Clustering + Classificação Textual Conceitos Resultados Considerações Finais

Clustering + Classificação Textual Documento a ser analisado K agrupamentos Base de dados   Lista de termos   Peso de cada termo em cada cluster    

Clustering + Classficação Textual (cont.) Lista de classificação de Termos Lista de classificação de Tags Histórico de Tags do Usuário ∩ ∩

Clustering + Classficação Textual (cont.) Lista de Tags Recomendadas

Roteiro Resultados Conceitos Clustering + Classificação Textual Considerações Finais

Resultados Konnen

Módulo de Recomendação Resultados (cont.) Módulo Core Módulo de Segurança Outros módulos Módulo de Conteúdo Módulo de Recomendação Konnen

Resultados (cont.) Konnen em desenvolvimento Estrutura em constante evolução Falta de conteúdo real para simulação

Resultados (cont.) WebCrawler Utility.Util:GenerateData() Utility.User Utility.Tag Utility.ContentTag Utility.Content / Page Bibsonomy Servidor Local Utility.StopWords Lematização Utility.Util:PrepareData() Utility.StopWords LemmaSharp.Ilemmatizer Utility.Content / Page

Resultados (cont.) Duração das Etapas (996 registros) Tempo WebCrawler   Tempo WebCrawler 3 minutos Lematização 22 minutos

Número de tags por usuário Resultados (cont.)   Mínimo Máximo Média Número de tags por post 1 23 1,35 Número de posts por usuário 899 39,84 Número de tags por usuário 1000 341,56

Número de tags atribuídas por usuários às postagens Resultados (cont.) Número de tags atribuídas por usuários às postagens

Módulo de Recomendação Resultados (cont.) Módulo de Recomendação Clustering Módulo de Conteúdo Konnen

Resultados (cont.) Documento: «  Visual analytics tools for analysis of movement data » Etapas: 5 execuções para cada valor de cluster = { 5, 10, 20, 25, 30 } 5 melhores resultados

Resultados (cont.) Para 5 clusters Tempo Iterações Recomendações   Tempo Iterações Recomendações 1ª execução 4,63 3 data, analysis, reasoning, automatic, method 2ª execução 4,89 2 analysis, data, human, time, automatic 3ª execução 4,85 human, data, case, method, support 4ª execução 4,66 data, analysis, large, method, automatic 5ª execução 4,72 data, method, large, study, understanding

Resultados (cont.) Para 10 clusters Tempo Iterações Recomendações   Tempo Iterações Recomendações 1ª execução 8,50 3 data, analysis, scale, support, automatic 2ª execução 14,47 2 analysis, data, large, reasoning e servisse 3ª execução 8,02 analysis, data, mobility, framework, human 4ª execução 14,69 4 data, analysis, tool, tools, method 5ª execução 8,34 data, analysis, framework, knowledge, visual

Resultados (cont.) Para 20 clusters Tempo Iterações Recomendações   Tempo Iterações Recomendações 1ª execução 28,60 4 data, analysis, support, case, large 2ª execução 37,99 knowledge, data, analysis, case e human 3ª execução 36,21 data, tools, analysis, case, semantic 4ª execução 19,65 data, tools, analysis, support, techinique 5ª execução 10,20 3 data, analysis, large, study, human

Resultados (cont.) Para 25 clusters Tempo Iterações Recomendações   Tempo Iterações Recomendações 1ª execução 12,11 3 data, analysis, human, semantic, visual 2ª execução 22,65 4 data, analysis, human, tools, visual 3ª execução 22,62 data, analysis, large, database, studies 4ª execução 11,93 data, analysis, support, collection, human 5ª execução 22,59 5 data, analysis, gps, human, visual

Resultados (cont.) Para 30 clusters Tempo Iterações Recomendações   Tempo Iterações Recomendações 1ª execução 27,06 4 human, data, analysis, mobility, pattern 2ª execução 26,57 data, analysis, interactive, human, making 3ª execução 14,45 data, analysis, human, method, mobility 4ª execução 14,75 3 data, analysis, human, knowledge, mobility 5ª execução 27,38 data, analysis, human, semantic, visual

Resultados (cont.) Freqüência dos colocados: 1o : data(18), analysis(3), human(2), knowledge(1) 2o : analysis(16), data(6), tools(2), method(1) 3o : human (5), large (5), analysis(4), case, reasoning, scale, mobility, tool, gps 4o : method (3), case (3), study(2), support(2), knowledge (2), semantic(2), human(2), tools(2), automatic(1), time(1), reasoning(1), framework(1), collection(1), mobility(1) 5o : visual(5), human(4), automatic(3), method(2), support(1), understanding(1), servisse(1), large(1), semantic(1), techinique(1), pattern(1), making(1)

Resultados (cont.) Melhores recomendações: data, analysis, human/large, method/case, visual Tempo de execução muito alto Usuário web quer tempo de resposta baixo

Resultados (cont.) Para 50 documentos e 3 clusters: Tempo de execução: 1,38 segundos Recomendação: automatic, knowledge, gps, method, pattern Qualidade da recomendação fraca

Roteiro Considerações Finais Conceitos Clustering + Classificação Textual Resultados Considerações Finais

Considerações Finais Boa performance Excelente qualidade das recomendações Funciona em qualquer ambiente

Considerações Finais Depende de uma base com um bom vocabulário Usuários online: pré-classificação dos documentos

Flávio Henrique Moura Stakoviak Desenvolvimento e Implantação de um Sistema para Recomendação de Tags utilizando Clustering e Classificação Textual para o Konnen Flávio Henrique Moura Stakoviak