Indexação automática de documentos utilizando técnicas de mineração de textos Proposta para trabalho de conclusão de curso Fabio Montefuscolo Rafael Câmara
Introdução O que é indexação? É a “construção de representações de documentos”; Qual o propósito da Indexação? Incluir essas representações em algum tipo de bases de dados para ajudar na recuperação de informação; Quem faz a indexação? Um profissional relacionado a Ciência da Informação, denominado Indexador;
Motivação Indexar documentos é um processo demorado e trabalhoso; A quantidade de documentos vem crescendo a cada dia, dificultando o trabalho do indexador; Informação em excesso é difícil de ser organizada e encontrada;
Objetivos Gerais Construir uma aplicação capaz de identificar descritores de um documento científico através de técnicas de mineração de texto;
Objetivos específicos Extrair o máximo de descritores possíveis de um documento; Fazer com que a aplicação ajude a melhorar a produtividade do indexador; Ampliar a aplicação para enriquecer o tesauro existente com novos descritores;
Metologias Coletar um conjunto de documentos textuais; Desenvolver protótipos adicionando funcionalidades do sistema e melhorando os algoritmos de mineração de textos;
Ferramentas Tesauro existente; Ferramentas CASE; Bibliotecas e API;
Validação Auxílio de um profissional da informação, um indexador; Comparação dos resultados obtidos pela aplicação com os resultados obtidos manualmente;
Cronograma
Referências BRUZINGA, Graziane Silva; MACULAN, Benildes C. M. S.; LIMA, Gercina A. B. O. Indexação Automática e Semântica: estudo da análise do conteúdo de teses e dissertações. In: Encontro Nacional de Pesquisa em Ciência da Informação. Salvador: UFBA, Disponível em:. Acesso em: 14 abril ROSAS, Patrícia. Instruções Redatoriais e a Indexação em publicação periódica. Rio de Janeiro: Disponível em:. Acesso em: 14 abril DANTAS, Paulo E.C. Indexação bibliográfica em bases de dados:O que é? Para que serve? Onde estamos?. Arq. Bras. Oftalmol, São Paulo, v. 67, n. 4, jul/ago Disponível em:. Acesso em: 14 abril 2008.
Referências TARDELLI, Adalberto O. An implementation of Trigram Phrase Matching for text similarity problems. Medical Care Compunetics. IOPress Incorporated, Disponível em:. Acesso em: 14 abril ARAÚJO JR., Rogério H. de. Precisão no processo de busca e recuperação da informação: uso da mineração de textos. Ci. Inf., Brasília, v. 35, n. 3, p , set./dez Disponível em:. Acesso em: 14 abril MARTHA, Hamilton S. Recuperação De Informação Em Campos De Texto Livre De Prontuários Eletrônicos Do Paciente Baseada Em Semelhança Semântica E Ortográfica. Tese (Mestrado) – Universidade Federal de São Paulo. Programa de Pósgraduação em Informática em Saúde. Disponível em:. Acesso em: 14 abril 2008.