A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Bruno Florencio Pinheiro Orientador: Renato Fernandes Corrêa

Apresentações semelhantes


Apresentação em tema: "Bruno Florencio Pinheiro Orientador: Renato Fernandes Corrêa"— Transcrição da apresentação:

1 Bruno Florencio Pinheiro Orientador: Renato Fernandes Corrêa
Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE Bruno Florencio Pinheiro Orientador: Renato Fernandes Corrêa

2 Roteiro Introdução Objetivo Motivação Coleção de Documentos Aplicação
Trabalhos Futuros

3 Introdução Sistemas de Recuperação da Informação (SRI) são aplicações com o objetivo de satisfazer a necessidade de informação do usuário através de consultas. Mapas de documentos são redes neurais artificiais do tipo Mapas Auto-organizáveis treinados com vetores documentos.

4 Objetivo Agregar um mapa de documento ao SRI com o intuito de auxiliar o usuário em suas buscas. Disponibilizar a consulta tanto através de palavras-chaves, como através da navegação pelo mapa.

5 Motivação Crescente número de documentos (teses e dissertações) em meio digital. Tornar universal o acesso a esses documentos. Dificuldade do usuário em expressar a sua necessidade da informação através de palavras-chaves.

6 Coleção de Documentos Biblioteca Digital de Teses e Dissertações da UFPE (BDTD-UFPE) Acervo do material produzido nos programas de pós-graduação da universidade. Cerca de 6 mil documentos. Vinculada a BDTD nacional e ao NDLTD (Networked Digital Library of Theses and Dissertations)

7 Aplicação Arquitetura

8 Aplicação Aquisição dos documentos Através do protocolo OAI-PMH
Colheita de arquivos XMLs contendo metadados dos documentos Extração dos dados através da biblioteca JColtrane

9 Aplicação Indexação Uso da biblioteca em Java, Lucene.
Operações de Stemming, eliminação de pontuação, dígitos e stopwords. Geração do índice invertido através do modelo espaço vetorial.

10 Aplicação Construção do Mapa
Representação dos documentos como vetores compondo uma matriz esparsa. Treinamento do mapa auto-organizável com essa matriz. Rotinas de treinamento realizadas em MATLAB, resultado do trabalho de (CORRÊA, 2008).

11 Aplicação Construção da Interface
Terminado o treinamento, rotula-se os neurônios com as palavras-chaves mais significativas. Geração de uma imagem representando o mapa no formato 10 x 12 Relação das áreas da imagem com a lista de documentos pertencentes a mesma.

12 Aplicação

13 Trabalhos Futuros Comparar e analisar o desempenho de variantes do SOM, além de outros modelos aplicados ao sistema.

14 Referências CARDOSO JUNIOR, M. J. M. Clio-i: Interoperabilidade entre repositórios digitais utilizando o protocolo OAI-PMH Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife. JCOLTRANE. Portal de informações e tutoriais da ferramenta JColtrane. Disponível em: < WIKI LUCENE. Enciclopédia digital da ferramenta Lucene. Disponível em:< CORRÊA, R. F. Sistemas Baseados em Mapas Auto-organizáveis para Organização Automática de Documentos Texto. Tese de Doutorado. Centro de Informática da UFPE, Recife, 2008.

15 OBRIGADO! Agradecimentos
À FACEPE pelo fomento através da bolsa PIBIC e o apoio financeiro ao projeto “Mapeador de Teses e Dissertações da UFPE (MTD-UFPE)”. À atenção de todos. OBRIGADO!


Carregar ppt "Bruno Florencio Pinheiro Orientador: Renato Fernandes Corrêa"

Apresentações semelhantes


Anúncios Google