Indexação automática de documentos utilizando técnicas de mineração de textos Proposta para trabalho de conclusão de curso Fabio Montefuscolo Rafael Câmara.

Slides:



Advertisements
Apresentações semelhantes
A CONTRIBUIÇÃO DA UNESP PARA O DINAMISMO ECONÔMICO DOS MUNICÍPIOS  A UNESP, desempenha um papel importante no dinamismo econômico dos municípios onde.
Advertisements

PÚBLICO ALVO O curso é destinado a professores que estejam atuando com o Ensino de Música na Educação Básica. Objetivos Analisar e discutir os pressupostos.
Central de Aquisições e Contratações Públicas: O uso dos padrões e-Ping na estruturação do planejamento das contratações Brasília, 18 de junho de 2013.
A implantação do Centro Nacional de Pesquisas do Mar IFSC Apresentação: Widomar P. Carpes Jr. Diretor Geral do Campus Itajaí novembro
GEOMETRIA PARA ALUNOS SURDOS POR MEIO DO TANGRAM
Universidade Federal do Rio Grande do Norte Centro de Ensino Superior do Seridó Programa Institucional de Bolsas de Iniciação à Docência Matemática - Licenciatura.
PROJETO DE CAPACITAÇÃO E ESTÍMULO À REALIZAÇÃO DOS EXAMES MÉDICOS PERIÓDICOS NOS ÓRGÃOS E ENTIDADES DO SIPEC.
Atividade Acadêmica: Educação Ambiental
Informações a transmitir na divulgação do novo sistema Objectivos da implementação do SGAD; Consequências dos resultados da avaliação. Importância para.
Antes de decidir, pense no estudante. Audiência Pública nº 02/2014 Secretaria de Regulação e Supervisão da Educação Superior – SERES Diretoria de Regulação.
MEMBROS: Josicélia Dumet Fernandes - UFBA e Coordenadora da Comissão anterior 2007/2009 Marta Lenise do Prado - UFSC e memória da Comissão anterior.
IDEALIZADO PARA CUIDAR.
Redação de Texto Científico Acadêmico
BVS Saúde Pública Brasil I Reunião do Comitê Técnico da BVS Brasil 8 de outubro de BIREME, São Paulo, SP.
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ Campus Londrina PROCEDIMENTOS DE AVALIAÇÃO Serão realizadas 3 provas escritas. P1 (1,0 ponto)= 11/abril(EM)
Comportamento de busca informacional na Biblioteca Digital de Teses e Dissertações (BDTD) da UFMG por alunos da pós-graduação lato sensu e stricto sensu.
AULA DO DIA 23 DE ABRIL DE 2013 MESTRADO EM EDUCAÇÃO, LINGUAGEM E TECNOLOGIAS DISCIPLINA – METODOLOGIA DA PESQUISA PROFESSORAS – KÊNIA E MIRZA MÉTODO METODOLOGIA.
Características do comportamento “Delimitar problema de pesquisa”, derivadas a partir de monografias de estudantes de graduação em Psicologia Área de conhecimento:
PRÁTICA CIENTIFICA ANÁLISE DE ARTIGO CIENTÍFICO: “PROPOSTA DE SOLUÇÃO PARA O PROBLEMA DAS P-MEDIANAS NA LOCALIZAÇÃO DE UNIDADES DE SAÚDE 24 HORAS” Brasília,
INDEXAÇÃO E REPRESENTAÇÃO DE DOCUMENTOS VISUAIS E AUDIOVISUAIS Félix del Valle Gastaminza.
Princípios, Normas e Política de indexação
Escreva aqui o título e o subtítulo do seu TCC Universidade Federal do Recôncavo da Bahia, Insira a data.
Curso Superior de Tecnologia em Redes de Computadores Trabalho de conclusão de curso Seminário de Andamento Aluno: André Barbieri Orientador: Carlos Vinícius.
Elementos preliminares de monografias  O objetivo de pesquisa  A revisão bibliográfica  O problema (idéia de pesquisa)  O método de pesquisa  A justificativa.
METODOLOGIA CIENTÍFICA E TÉCNICAS DE PESQUISA
AS METODOLOGIAS DE ENSINO E AS PRÁTICAS DE LETRAMENTO: UM OLHAR SOBRE A PRÁTICA PEDAGÓGICA DE UM PROFESSOR ALFABETIZADOR DO MUNICÍPIO DE TUBARÃO-SC Acadêmicas:
15 anos15 anos. Onde encontrá-lo? Podemos encontrar todos os Procedimentos provenientes do SGQ disponibilizados em nossa rede pelo caminho : Z:\S G Q\Procedimentos.
Sabe quem está chegando? A família Real de Marte, uma simpática família extra-terrestre. E sabe o que eles acharam de mais intrigante em suas primeiras.
TÍTULO (Fonte Arial 32, negrito, maiúscula, com alinhamento centralizado) INTRODUÇÃO Apresentar o problema científico a ser solucionado e sua importância.
PRODUÇÃO INTELECTUAL NA UFRGS Capacitação no Uso do SABi
Tipos de Pesquisa ObjetivosAplicações Vantagens e Desvantagens.
Normalização ISO 10002:2005 Tratamento de Reclamações
Indexação automática de documentos utilizando técnicas de mineração de textos Trabalho de conclusão de curso Fabio Montefuscolo Rafael Câmara.
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ Campus Londrina Nome da disciplina: Metodologia da Pesquisa Aplicada Ementa: 1) Conceitos fundamentais sobre.
Diretório de Eventos em Ciências da Saúde - DirEve Sarah Maria Viola de Oliveira Fontes de Informação Referenciais - FIR PFI/BIREME/OPS/OMS São Paulo,
Política de Regulação Cursos de Medicina Brasília, 5 de fevereiro de Avanços.
Curso - Avaliação e Aprendizagem Atividades no município abril/maio.
IV JUNIC IV SEMINÁRIO DE PESQUISA 2009 Programa Institucional de Bolsa de Iniciação Científica –PMUC Acadêmico Natalia Paris Rodrigues Comunicação Social.
ANÁLISE ERGONÔMICA DOS POSTOS DE TRABALHO (Material Adaptado do Programa de Pós-Graduação da Engenharia de Produção e Sistemas da Universidade Federal.
1 ISO (ALGUNS ASPECTOS RELEVANTES) Prof. M.Sc Jefferson L. C. Salles.
Autores Orientadores Camila Cavalcanti (IGEO), Victor Freitas (GPDES), Richard Gomes (FND), Thiago Barbosa (GPDES ), Guilherme Azeredo (FND), Rafael Paschoa.
Noções de amostragem Bioestatística. É a ciência que fornece os princípios e os métodos para coleta, organização, resumo, análise e interpretação de dados.
RI-Br: Proposta de um Sistema Web de Repositório Institucional Breno A. L. Andrade, Moara S. Brito, Pablo F. Matos e Alberto S. Rebouças
ANÁLISE DA EVOLUÇÃO CONCEITUAL DE "BIBLIOTECA ELETRÔNICA, DIGITAL, VIRTUAL E POLIMÍDIA, NO PERÍODO DE 1993 A 2004 NA LITERATURA DE CIÊNCIA DA INFORMAÇÃO.
Gestão de Pessoas Profª. Mara. Objetivos da Gestão de Pessoas: Ajudar a organização a alcançar seus objetivos e realizar sua missão. Proporcionar competitividade.
OLIVEIRA, JANE S.; QUEIROZ SALETE L. Comunicação e Linguagem Científica: guia para estudantes de química, Campinas: Átomo, 2007, 109 p. Capítulo 4: LOCALIZANDO.
Disciplina: Processos Psicológicos Básicos
09/03/2009Curso de LIS - Apresentação Localizador de Informação em Saúde - LIS Luciano Soares Duarte Supervisor Fontes de Informação Referenciais - FIR/PFI.
ORGANIZAÇÃO DA INFORMAÇÃO: Metodologias de Resumos e Indexação
Atividades para a Biblioteca Virtual em Saúde Pública na FSP/USP.
Conjunto significativo de pesquisas conhecidas pela denominação "estado da arte" ou "estado do conhecimento". pesquisa bibliográfic a.
ALVARO PEREIRA. A apresentação do percurso da pesquisa Detalha o caminho percorrido pelo pesquisador na coleta e na análise dos dados e encontra-se dividido.
Educação a Distância Universidade de São Paulo Metodologia da Pesquisa e redação cientifica para Licenciatura Ana Carolina da Silva N° USP: Tamara.
Texto de: Nair Yumiko Kobashi. Um pouco de história dos processos de representação da informação: 2º Milênio A.C. -> tábuas de argila protegidas por uma.
Introdução a Análise de Redes Sociais de Informação Aula 01 Dalton Martins Laboratório de Políticas Públicas Participativas Gestão da.
Faculdade de Tecnologia SENAC Pelotas/RS Curso Superior de Tecnologia em Redes de Computadores Projeto Integrador II Seminário de Andamento Monitorando.
EMPRESAS, ESCRITÓRIOS E PROFISSIONAIS DA CONTABILIDADE DO VALE DO ARARANGUÁ: ESTUDO SOBRE O PERFIL E TECNOLOGIAS UTILIZADAS NOS MUNICÍPIOS DE PASSO DE.
Artigo Científico Francielly Gonçalves dos Santos Francielly Gonçalves dos Santos Nayara Kirie Mendes Alves Nayara Kirie Mendes Alves Neirivaldo Quintão.
Sistema de cadastramento de associados em dispositivos móveis Luthiano Rodrigues Venecian Prof. orientador: Augusto Caringi.
Sistema para agendamento e controle de pacientes para a Clínica Escola de Fisioterapia (CEF) da Unisul Ciências Exatas e da Terra Johannes S Silveira Ferreira.
Divulgação de periódicos retrospectivos publicados pela UFBA: disponibilização na Biblioteca Digital do Sistema de Bibliotecas da UFBA Vania Cristina Sousa.
Indexação automática de documentos utilizando técnicas de mineração de textos Proposta para trabalho de conclusão de curso Fabio Montefuscolo Rafael Câmara.
Controle interno municipal: identificando os problemas e apontando soluções TRIBUNAL DE CONTAS DO ESTADO.
"Ninguém é capaz de escrever bem se não sabe bem o que vai escrever" (CAMARA JR., 1978)
Metodologia de pesquisa em Didática e ensino- aprendizagem de Línguas Estrangeiras Diferentes produções textuais exigidas nos programas de pós-graduação.
Avaliação dos indicadores de prescrição e de acesso a medicamentos no sistema único de saúde de um município da região da AMUREL Juliana Medeiros de Souza.
Recuperação da Informação Peter Ingwersen.  Universidade de Copenhagen (Dinamarca)  Peter Ingwersen tornou-se professor de pesquisa em 2001 e Professor.
Monografias Projeto Científico. 2 Monografia e Projeto Científico O projeto científico pode ser uma tese ou monografia; É a base da monografia; Não existe.
Ciclo documentário. Objetivos das atividades documentais Selecionar, na massa de informações veiculadas, elementos de conhecimento, Fornecer a qualquer.
ORÇAMENTO BASE ZERO.
Transcrição da apresentação:

Indexação automática de documentos utilizando técnicas de mineração de textos Proposta para trabalho de conclusão de curso Fabio Montefuscolo Rafael Câmara

Introdução  O que é indexação? É a “construção de representações de documentos”(LANCASTER,2004).  Qual o propósito da Indexação? Incluir essas representações em algum tipo de bases de dados para ajudar na recuperação de informação (LANCASTER,2004).  Quem faz a indexação? Um profissional relacionado a Ciência da Informação, denominado Indexador;

Introdução  Tipos de indexação Indexação por extração Os termos de indexação são palavras do próprio documento elegidas. Indexação por atribuição Os termos de indexação a partir de uma fonte externa, na maioria das vezes um vocabulário controlado.

Introdução  O que é um vocabulário controlado? É uma ferramenta que agrupa conceitos e termos de forma hierárquica e que representam áreas temáticas.

Motivação  Indexar documentos é um processo demorado, trabalhoso e, por isso, custoso.  A quantidade de documentos vem crescendo a cada dia, dificultando o trabalho do indexador.  Informação em excesso é difícil de ser organizada e encontrada.

Objetivos Gerais  Construir uma aplicação capaz de identificar descritores de um documento científico através de técnicas de mineração de texto.

Objetivos específicos  Extrair o máximo de descritores coerentes possíveis de um documento.  Fazer com que a aplicação ajude a melhorar a produtividade do indexador.  Ampliar a aplicação para enriquecer o tesauro existente com novos descritores.

Métodos  Remoção de caracteres especiais.  Aplicação da técnica de Stemming.  Remoção de Stop Words.  Leitura do texto por 'janelas'.  Leitura do texto por bigramas.  Análise da hieraquia de descritores.

Materiais e Ferramentas  Vocabulário controlado MeSH.  Lista de Stop Words (NLTK).  Implementação do Porter Stemmer.  IDE Eclipse;  Subversion (Assembla).  Wiki (Assembla).

Desenvolvimento  Módulos de navegação para XML do vocabulário controlado MeSH.  Módulo para normalização de termos (Stemming, stop words).  Alocação do conteúdo do MeSH em memória.

Desenvolvimento  Módulo de leitura dos documentos utilizando janelamento.  Módulo de leitura dos documentos através de bigramas.  Módulos para seleção de descritores encontrados.  Heurísticas para cortes de descritores pouco relevantes.

Resultados  Contrução da aplicação usando os métodos apresentados.  Obtenção da melhor combinação de métodos para indexação.  419 documentos indexados pela aplicação.

Avaliação dos resultados  Medidas Precisão Cobertura F-Measure

Avaliação dos Resultados Técnicas sem corte e seus resultados Comparação entre os possíveis cortes em diferentes técnicas

Avaliação dos Resultados Resultados com as técnicas de filtragem e bigramas Comparações entre janelas

Referências  BRUZINGA, Graziane Silva; MACULAN, Benildes C. M. S.; LIMA, Gercina A. B. O. Indexação Automática e Semântica: estudo da análise do conteúdo de teses e dissertações. In: Encontro Nacional de Pesquisa em Ciência da Informação. Salvador: UFBA, Disponível em:. Acesso em: 14 abril  ROSAS, Patrícia. Instruções Redatoriais e a Indexação em publicação periódica. Rio de Janeiro: Disponível em:. Acesso em: 14 abril  DANTAS, Paulo E.C. Indexação bibliográfica em bases de dados:O que é? Para que serve? Onde estamos?. Arq. Bras. Oftalmol, São Paulo, v. 67, n. 4, jul/ago Disponível em:. Acesso em: 14 abril 2008.

Referências  TARDELLI, Adalberto O. An implementation of Trigram Phrase Matching for text similarity problems. Medical Care Compunetics. IOPress Incorporated, Disponível em:. Acesso em: 14 abril  ARAÚJO JR., Rogério H. de. Precisão no processo de busca e recuperação da informação: uso da mineração de textos. Ci. Inf., Brasília, v. 35, n. 3, p , set./dez Disponível em:. Acesso em: 14 abril  MARTHA, Hamilton S. Recuperação De Informação Em Campos De Texto Livre De Prontuários Eletrônicos Do Paciente Baseada Em Semelhança Semântica E Ortográfica. Tese (Mestrado) – Universidade Federal de São Paulo. Programa de Pósgraduação em Informática em Saúde. Disponível em:. Acesso em: 14 abril 2008.