Introdução a Teoria da Classificação

Slides:



Advertisements
Apresentações semelhantes
Ana Luisa Maia.
Advertisements

01/08/2011 Professor Leomir J. Borba- –
Medidas de Avaliação de Sistemas de Recuperação de Informação
Operações sobre o Texto
Software Básico Silvio Fernandes
Introdução à Ciência da Computação Linguagens de Programação.
Software Básico Silvio Fernandes Universidade Federal Rural do Semi-Árido Departamento de Ciências Ambientais Ciência da Computação Aula 06: Funções.
Curso: Banco de Dados I Análise de Sistemas PUC Campinas
UNICEUMA – CENTRO UNIVERSITÁRIO DO MARANHÃO
Evolução dos SGBD’s (2ª Parte).
Obtendo informações sobre o Portal Localizando uma publicação.
Pesquisa Bibliográfica Disciplina de Metodologia da Pesquisa Profª Tereza Yoshiko Kakehashi 1.
Análise de Casos de Uso.
Software Básico Silvio Fernandes Universidade Federal Rural do Semi-Árido Departamento de Ciências Exatas e Naturais Ciência da Computação Aula.
Software Básico Silvio Fernandes
RECUPERAÇÃO PARALELA LÍNGUA PORTUGUESA 17/03/2009
Teste em Esquemas de Dados Maria Cláudia Figueiredo Pereira Emer Universidade Federal do Paraná Departamento de Informática Seminário.
Análise de Requisitos Use Case Renata Araujo Ricardo Storino
Professora: Aline Vasconcelos
Divisão de Biblioteca e Documentação FMUSP
Base SCOPUS 2011 Divisão de Biblioteca e Documentação FMUSP.
ARTIGO CIENTÍFICO.
UNIVERSIDADE FEDERAL DE SANTA CATARINA - UFSC PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA E GESTÃO DO CONHECIMENTO EGC – GESTÃO DO CONHECIMENTO E FERRAMENTAS.
Introd. à pesquisa - aula 2
I – Informação Digital Escola Politécnica da USP MBA EPUSP em Gestão e Engenharia do Produto EP018 O Produto Internet e suas Aplicações Tecnologias de.
Denise Perdigão BASE DE DADOS Denise Perdigão
Introdução a Programação Orientada a Objetos
Profa Luciane Vital Indexação de multimeios
Administração de Sistemas de Informação Banco de Dados
Metodologia Científica
Tutorial de pesquisa Bases da área de saúde.
Inteligência Artificial
Recuperação Inteligente de Informação Tarefa 1 Equipe.
Universidade São Marcos Curso: Gestão de Negócios Internacionais
INF 1010 Estruturas de Dados Avançadas
Programação Orientada à Objetos
Resumos Profa. Lillian Alvares Faculdade de Ciência da Informação
Tipos de Sistemas de Organização do Conhecimento
Sistemas de Apoio à DecisãoMárcio MoreiraUnidade 5 – Decisões Não Estruturadas – Recuperação de Informações – Slide 1 5Decisões Não Estruturadas 5.1Recuperação.
Navegando através das Fontes e Serviços de Informação da Biblioteca Virtual em Saúde - BVS BIREME/OPAS/OMS.
Pesquisa Científica na Internet
Projeto de Banco de Dados
Construindo tesauros Prof. José Antonio M. Nascimento.
Recuperação de Informação
Vocabulários Controlados
Banco de Dados Parte 04 Ceça. Ceça Moraes 2 Conteúdo  Os três níveis da arquitetura  Mapeamentos  Arquitetura cliente-servidor.
Processo de Aquisição Adilson de Almeida Cezar Meriguetti
MÓDULO 4 Como usar PubMed
Biblioteca eletrônica  Folheamento  Tema  Autor  Tipo de publicação  Título  Busca  Simples  Avançada Clique no item desejado.
ÁREA DE TRABALHO DO WINDOWS
EBSCOhost Pesquisa avançada.
Linguagens Documentárias
Nome alunos 1 Título UC. Título – slide 2 Conteúdo Conteúdo 2.
Artigo Científico Funções Básicas:
Indexação Profa. Lillian Alvares Faculdade de Ciência da Informação
Profa. Lillian Alvares Faculdade de Ciência da Informação Universidade de Brasília Recuperação 1.
INTRODUÇÃO À PROGRAMAÇÃO EM LÓGICA Profa. Joseluce de Farias Cunha
Introdução a Banco de Dados Aula 04
FICHAMENTO.
IEEE Melhores Práticas para Descrições de Projeto de Software (DPS)
Proposta de Trabalho Final Disciplina: Projeto de BD Manuela Klanovicz Ferreira Melissa Rafaelli.
Indexação e linguagens documentárias – uma pequena revisão introdutória José Antonio M. Nascimento.
SISTEMAS DE INFORMAÇÃO
Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de Ciência da Informação Gestão da Informação Recomendações para o desenvolvimento.
Indexação e Resumos: teoria e prática
Eliana Kátia Pupim Doutoranda em CI pela UNESP Marília.
TRATAMENTO E FLUXO DE DOCUMENTOS NAIR Y. KOBASHI RESUMOS: TEORIA E M É TODOS ECA-USP 2011.
Tratamento Temático da Informação
Aula Origens da Linguagem Documentária Documentação (déc. 50 a 70) crescimento do conhecimento científico e tecnológico Dificuldades para armazenar.
Indexação: o uso do Vocabulário de Controle Externo do TCU (VCE) ISC/CEDOC Serviço de Gestão do Conhecimento Junho/2016 Beatriz Pinheiro de Melo Gomes.
Transcrição da apresentação:

Introdução a Teoria da Classificação Suzana Dantas Internet e RI - aula 1

Sistema de Recuperação da informação (SRI) Um Sistema de Recuperação da Informação é uma organização para armazenar e tornar disponível informação, explorando-a de modo positivo, com um índice de assunto dos documentos existentes na coleção, permitindo recuperar as referências Internet e RI - aula 1

Origem Existência de computadores – potencial para implementação de “bases de dados” • conjuntos de ficheiros • Software para manter e pesquisar a informação Sistemas desenvolvidos – SGBD • armazenamento e processamento • informação em linguagens muito restritas – Armazenamento e RI - pesquisa de documentos • necessidade sentida nas bibliotecas nos anos 50 • reforço: proliferação de documentos eletrônicos • mais reforço: WWW Internet e RI - aula 1

Conceitos Recuperação de Informação Atividades principais – no sentido da recuperação de documentos ou de textos Atividades principais – indexação ( modo de representar documentos e perguntas) – consulta (modo de analisar itens com vista à resposta a perguntas) Atividades relacionadas - diversificação na forma de pesquisa - ex. browsing - apresentação visual de resultados Entidades primitivas – documentos, termos de indexação Internet e RI - aula 1

Nomes Índice: nome genérico para catálogos, bibliografias, índices de artigos, etc… Registro de documento cabeçalho: nome do autor, cabeçalho do assunto descrição: autor, título, edição, editor, paginação localização Internet e RI - aula 1

Indexar Indexar significa incluir um documento num repositório de informações Inclui identificar, determinar assuntos e selecionar termos para representar os índices Utiliza uma linguagem de indexação Internet e RI - aula 1

Métodos de Indexação Por palavra Por assunto utiliza as palavras encontradas no título ou no documento KWIC : Keyword in Context Por assunto supõe a análise do conteúdo temático do documento, a decisão sobre os conceitos presentes e a tradução em uma linguagem apropriada (artificial ou controlada) Internet e RI - aula 1

Revocação e Precisão As medidas mais comuns para avaliar a qualidade de um sistema de busca e recuperação de informação são conhecidas com revocação e precisão Revocação mede a proporção de documentos relevantes recuperados Precisão mede quantos documentos relevantes foram recuperados Internet e RI - aula 1

Revocação e Precisão Normalmente sistemas de BRI possuem uma curva de Recall x Precision Internet e RI - aula 1

Revocação e Precisão B C A D Itens recuperados Itens não Itens não relevantes Itens relevantes Internet e RI - aula 1

Revocação e Precisão Revocação Precisão Relevantes Recuperados/Total de itens relevantes A/(A+D) Precisão Relevantes Recuperados/Total Recuperados A/(A+B) Internet e RI - aula 1

Fatores que governam Exaustividade Especificidade Extensão com que determinado documento é indexado (número de conceitos utilizados) grau de profundidade da indexação Especificidade Exatidão dos descritores depende da linguagem de indexação Internet e RI - aula 1

Relação Maior exaustividade aumenta a revocação e diminui a precisão Maior especifidade diminui a revocação e aumenta a precisão Internet e RI - aula 1

Linguagens de Indexação Vocabulário coleção de termos de indexação descritores: palavras cabeçalhos de assuntos símbolos de classificação Sintaxe artifícios empregados para revelar as relações entre os conceitos e as regras para estabelecer os descritores e a ordem de citação Internet e RI - aula 1

Elementos Promotores Revocação: aumentam o número de documentos de uma classe, alargando a definição do descritor e reduzindo o tamanho do vocabulário Precisão: reduzem o tamanho das classes, restringem a definição dos descritores e aumentam o tamanho do vocabulário Internet e RI - aula 1

Provendo Revocação Controle de sinônimos Controle de quase-sinônimos Agrupamento de várias formas de uma palavra (radical comum, singular e plural) Agrupamento de conceitos semelhantes ou relacionados Elos hierárquicos Internet e RI - aula 1

Promovendo Precisão Coordenação Distinção de homônimos Ponderação Elos (links) Papéis ou funções (roles) Internet e RI - aula 1

Extensão da Recuperação da Informação Novos meios em documentos – técnicas usadas em texto são extensíveis – documentos são cada vez mais heterogéneos • Documentos em linguagens diversas – noção de documento esbate-se – pesquisas tendem a requerer técnicas híbridas • Para tarefa específica – necessário identificar os seus requisitos de indexação e pesquisa Internet e RI - aula 1

Processo de recuperação Busca (searching) índice Operações de query Modelo texto indexação ranking Texto operações Interface usuário texto Pergunta (query) usuário Internet e RI - aula 1