Recuperação da Informação Peter Ingwersen.  Universidade de Copenhagen (Dinamarca)  Peter Ingwersen tornou-se professor de pesquisa em 2001 e Professor.

Slides:



Advertisements
Apresentações semelhantes
PROJETO DE PESQUISA Alexandre Godoy Dotta
Advertisements

Profa. Dra Maria Luiza de Almeida Campos
Relembrando... A Investigação como processo tem seis etapas sucessivas: Construção do problema Entendimento do problema: a partir de quais perspectivas.
Modelo de planejamento bimestral da EJA Tempo formativo: ________________________ Eixo: _________________ Período: ___/___/___ a ____/___/___ Professores.
Conceitos de Linguística
Diagrama de Fluxo de Dados – DFD
Modelos de Recuperação de Informação
Linguística Documentária Marilda Lopes Ginez de Lara 2011
Quadro geral das Ciências da Educação.
Sérgio Elias Vieira Cury
Prof. Dra. Maria Virginia Llatas
Faculdade de Ciências Sociais de Aplicadas de Petrolina – FACAPE
Grupo de Pesquisa Ontologia e Taxonomia
Introdução a Teoria da Classificação
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL
Denise Perdigão BASE DE DADOS Denise Perdigão
Aspectos Avançados em Engenharia de Software Aula 3 Fernanda Campos
I have a dream…. Belinda Maia.
NÃO É ASSIM TÃO DIFÍCIL CONVIVER EM HARMONIA!
Tesauros José Antonio M. Nascimento.
Professora: Rosana Santos
Linguística, Semântica e Terminologia
CREM Centro de Recursos Educativos e Multimédia
DIAGRAMA DE CASO DE USO Prof. Fabíola Gonçalves C. Ribeiro.
Taxonomia Profa. Lillian Alvares,
Faculdade de Ciência da Informação Universidade de Brasília
Tipos de Sistemas de Organização do Conhecimento
Grupo D Patrícia Martins Tatiana Leitão Telma Veríssimo
… um caminho para o sucesso! BIBLIOTECA ESCOLAR Águeda, setembro de 2012.
Fundamentação histórica do Estudo de usuários
Pesquisa Científica na Internet
Como Utilizar a Biblioteca Escolar ?
Projeto de Banco de Dados
Construindo tesauros Prof. José Antonio M. Nascimento.
Classification in Object-Oriented Systems Peter Wegner Carlos Eduardo da Silva César Frederico dos Santos.
Classificação Profa. Lillian Alvares, Faculdade de Ciência da Informação, Universidade de Brasília.
Vocabulários Controlados
Linguagens Documentárias
Artigo Científico Funções Básicas:
Introdução A pesquisa é um procedimento reflexivo e crítico de busca de respostas para problemas ainda não solucionados.
PROFESSORA ANGELICA ROCHA DE FREITAS
ORIENTAÇÕES CURRICULARES PARA O ENSINO FUNDAMENTAL I
Análise Internacional Comparada de Políticas Curriculares
Tesauro, Taxonomia e Ontologia: uma evolução?
Plano de Aula Definição Atitude Científica Fatos e Teorias
Para entender as linguagens documentárias
SOFTWARES EDUCACIONAIS – CÓD PROF. MSC. RONNISON REGES VIDAL.
Letramento Letramentos Educação.
TÉCNICAS DE MEMORIZAÇÃO
Projeto de Banco de Dados
Comunicação e Redação Empresarial
Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de Ciência da Informação Gestão da Informação Recomendações para o desenvolvimento.
LINGUAGENS, CÓDIGOS E SUAS TECNOLOGIAS PORTUGUÊS ASSUNTOS 1º/2º APLICAÇÕES DE 2009 A 2013 % Leitura e interpretação de textos10626% Estrutura textual.
PREPARAÇÃO DE UM ARTIGO CIENTÍFICO
Classificação facetada: um exemplo na área de Comunicação 09 de maio de 2014.
Vamos conhecer melhor a nossa Biblioteca!?
Ciência da Informação em contexto Peter Ingwersen.
LEITURA EM ANÁLISE DOCUMENTÁRIA Profa. Giovana Deliberali Maimone.
Indexação e Resumos: teoria e prática
Tefko Saracevic.  Professor Emérito da Escola de Comunicação e Ciência da Informação de Rutgers da Universidade Estadual de Nova Jersey (EUA). Saracevic.
BNCC: currículo, educação e língua portuguesa
Tratamento Temático da Informação
Recuperação da Informação Peter Ingwersen.  Universidade de Copenhagen (Dinamarca)  Peter Ingwersen tornou-se professor de pesquisa em 2001 e Professor.
Informação documentária Profa. Giovana Deliberali Maimone.
Revisado por Phil Daro, USA Common Core Standards Análise da Base Nacional Comum Curricular de Matemática.
Aula Origens da Linguagem Documentária Documentação (déc. 50 a 70) crescimento do conhecimento científico e tecnológico Dificuldades para armazenar.
Tefko Saracevic.  Professor Emérito da Escola de Comunicação e Ciência da Informação de Rutgers da Universidade Estadual de Nova Jersey (EUA). Saracevic.
Indexação: o uso do Vocabulário de Controle Externo do TCU (VCE) ISC/CEDOC Serviço de Gestão do Conhecimento Junho/2016 Beatriz Pinheiro de Melo Gomes.
Recuperação da Informação Peter Ingwersen.  Universidade de Copenhagen (Dinamarca)  Peter Ingwersen tornou-se professor de pesquisa em 2001 e Professor.
ORGANIZAÇÃO DA INFORMAÇÃO Elaine Svenonius (2001).
Transcrição da apresentação:

Recuperação da Informação Peter Ingwersen

 Universidade de Copenhagen (Dinamarca)  Peter Ingwersen tornou-se professor de pesquisa em 2001 e Professor Titular a partir de janeiro de 2006, em Information Retrieval (Recuperação de Informação).  Ele realizou pesquisa experimental sobre os aspectos cognitivos da interação usuário-sistema baseado em tarefas e serviu em vários projetos Esprit como consultor especialista para a Comissão da UE.

Capítulo 3 – Recuperação da Informação

Questões essenciais de recuperação da informação  Recuperação da Informação: preocupa-se com os processos que envolvem a representação, armazenamento, busca e acesso a informações que são relevantes para a questão pretendida (desejada) pelo usuário humano.

Questões essenciais de recuperação da informação  Recuperação da Informação é considerado campo de pesquisa “núcleo” em Ciência da Informação.  Objetivos:  Compreeder os processos de recuperação de informação;  Facilitar a comunicação efetiva entre sistema de informação e usuário humano.

Questões essenciais de recuperação da informação Forma Questão Representação Códigos de representação: Linguísticos (verbal / oral) Imagéticos Audiovisuais Tácteis (Braille) Codificação/decodificação Recuperação de documentos / Recuperação textual Mas também pode-se recuperar imagens, sons, etc. Termos de indexação / estruturas gráficas, etc.

Questões essenciais de recuperação da informação  Essencialmente, o problema é encontrar a informação desejada em forma de texto, ou outras mídias, que satisfaça o usuário.  Por isso, certas informações são mais relevantes do que outras para uma questão específica.  Um texto específico pode ter significados diferentes para as perguntas (questões) de informação.

Questões essenciais de recuperação da informação  CONCEITOS importantes para todos os processos de IR (Information Retrieval): 1. Aboutness (sobre o que? / Tematicidade) 2. Relevância e avaliação

Questões essenciais de recuperação da informação  Aboutness Sobre o que é este documento, texto ou imagem? Aboutness está associado ao conteúdo dos DOCUMENTOS. Objetivo da representação DOCUMENTÁRIA é a recuperação.

Questões essenciais de recuperação da informação  Relevância Relevância pode ser definida como a medida ou grau de correspondência ou utilidade existente entre um texto ou documento e uma questão ou informação desejada (C. J. Van RIJSBERGEN, 1990). A informação relevante pode estar explícita no texto (escrita) ou implícita (pela percepção pode ser lida e interpretada).

Questões essenciais de recuperação da informação  Concepção simplista de Interação em IR Representação Textual Autor do Texto Técnicas de IR em sistemas Funções intermediárias Problemas (questões) de informação (usuário) Ambiente do problema / questão Pedido Pergunta Dados bibliográficos Nome de autor e data Atributos como título, resumo e termos de indexação Sistema Lógico de Busca Booleana (and, or, and not)

Abordagens de pesquisa em IR – uma visão geral  As abordagens de pesquisa em IR (Recuperação da Informação) podem ser divididas em: 1. Tradicional 2. Orientada ao usuário, e 3. Cognitiva. Sobre tais “abordagens” pode-se perguntar: Quais são os objetivos?; Tipos de resultados e consequências?; Compreensão de informação?; Uso de apoio a disciplinas?.

Abordagens de pesquisa em IR – uma visão geral TradicionalOrientada ao usuárioCognitiva Objetivos de pesquisa Técnicas de refinamento em IR, problemas de relevância, métodos de representação, etc. Compreensão do comportamento do usuário e informações desejadas, modelagem de usuários, etc. IR como processo do estado cognitivo, Interação complexa, IR baseado em conhecimento, etc. Resultados, Consequências Técnicas de correspondência parcial, classificação automática de falhas, etc. Modelos de usuários, projeto simplista de interface, Interação usuário-intermediário, etc. Projeto intermediário, Inteligência em IR, Suporte adaptativo em IR, valores semânticos, etc. Compreensão de informação Informação científica apenas Usuários científicos Informações consideradas vitais para a sociedade Níveis de usuários de uma sociedade Informações para o entendimento de mundo do usuário Variedade individual Apoio à disciplinas Matemática, Linguística, Ciência da Computação, etc. Psicologia cognitiva, psico-linguística, Sociologia Ciências cognitivas, Sociologia AI IR

Capítulo 4 – Pesquisa tradicional em IR

Pesquisa tradicional em IR  Objetivos deste tipo de pesquisa Estudo de representação textual (classificação, indexação, processos de linguagem natural), técnicas de recuperação e componentes mecânicos de fontes e sistemas em laboratórios. Ênfase na maximização do desempenho da recuperação informacional por meio de comparações de técnicas, teorias e projetos experimentais de modo controlado em bases de dados de coleções.

Pesquisa tradicional em IR  Resultados e consequências Refinamento de métodos e modelos de análise de textos, representação e técnicas de recuperação de informações. IR é entendido como um processo paradigmático, isto é, que projetistas de sistemas, indexadores e autores, bem como pesquisadores (usuário intermediário e usuário final) compartilham as mesmas visões científicas, terminologias, etc.

Pesquisa tradicional em IR  Compreensão de informação Tradicionalmente, Informação é entendida como informação científica (e associada com o significado do texto).

Pesquisa tradicional em IR  Uso e apoio a disciplinas Linguística, Matemática, Lógica e Ciência da Computação são suportes básicos das pesquisas em IR. Métodos aplicados a problemas de representação em texto linguístico (sintático); Matemática e Ciência da Computação, incluindo AI (Inteligência Artificial) em anos mais recentes, estão relacionados aos projetos e técnicas em IR.

Pesquisa tradicional em IR  Teorias de classificação  Categorização de todo o conhecimento do mundo. CDD (Classificação Decimal de Dewey) – 1876 CDU (Classificação Decimal universal) – Otlet e La Fontaine – 1895 Tesauros – sistemas de áreas específicas.

Pesquisa tradicional em IR  CDD Um dos aspectos originais desse esquema foi a utilização do sistema decimal para a divisão de cada classe em subclasses e para a notação. Outra inovação foi a inclusão de um índice alfabético bastante desenvolvido.

Pesquisa tradicional em IR CDD Para facilitar o uso do esquema, Dewey elaborou instruções claras e simples para adaptar a classificação aos aspectos locais.  A CDD tem por base a seguinte estrutura: As classes principais que correspondem, grosso modo, às disciplinas fundamentais do conhecimento, a saber:  100 Filosofia  200 Religião  300 Ciências Sociais  500 Ciência  600 Tecnologia  700/800 Artes  900 História (400 Filologia não representa uma disciplina fundamental).  000 Generalidades

Pesquisa tradicional em IR  CDU Esquema de classificação baseado na Classificação Decimal de Dewey. Foi sugerida inicialmente por Henry La Fontaine e Paul Otlet, na Primeira Conferência Internacional de Bibliotecários, realizada em 1895, na cidade de Bruxelas. É uma classificação extremamente flexível e é revista constantemente.

As principais divisões da CDU são:  0 Generalidades. Informação. Organização.  1 Filosofia. Psicologia.  2 Religião. Teologia.  3 Ciências Sociais. Economia. Direito. Política. Assistência Social. Educação.  4 Classe vaga.  5 Matemática. Ciências Naturais.  6 Ciências Aplicadas. Medicina. Tecnologia.  7 Arte. Belas-artes. Recreação. Diversões. Desportos.  8 Linguagem. Linguística. Literatura.  9 Geografia. Biografia. História. Pesquisa tradicional em IR

TESAURO DE FOLCLORE E CULTURA POPULAR BRASILEIRA Pesquisa tradicional em IR

Característica mais importantes de um sistema de classificação: - os sistemas devem ser exaustivos em seus domínios (campos do conhecimento). - classes devem ser mutuamente excludentes; - nenhum documento pode ser colocado em duas categorias. Pesquisa tradicional em IR

Uso de vocabulários controlados. Uso da linguagem natural inerente ao texto do documento ou a mistura de ambos. Linguagem Natural – linguagem expressa no cotidiano das pessoas (naturalmente polissêmica). Linguagem Documentária – linguagem construída (CDD, CDU, Tesauros, etc.) (Monossêmica). Teoria de Indexação, questões de vocabulário controlado

A teoria dos tesauros está associada ao controle de vocabulário. O foco está nas relações conceituais e nas relações estabelecidas entre os termos: relações genéricas, isto é, termos genéricos em relação aos termos específicos (parte-todo ou gênero espécie). Termos Genéricos e Específicos Teoria de Indexação, questões de vocabulário controlado

 Relação Hierárquica (Gênero-Espécie) folhas coníferas (tipologia das folhas) folhas caducas folhas não-caducas Árvore TG TE

Teoria de Indexação, questões de vocabulário controlado  Relação Hierárquica (Partitiva) Sistema Nervoso Sistema Nervoso Central (Conceito partitivo) Cérebro (Conceito partitivo) Medula Espinhal (Conceito partitivo) TG TEs

Teoria de Indexação, questões de vocabulário controlado  Relação de equivalência - relação entre sinônimos  Sinonímia - é uma relação de equivalência entre, ao menos, duas palavras. EX.: Pássaros USE Ornitologia Ornitologia UP Pássaros *UP = usado para

Técnicas de agrupamento em IR  Método de agrupar automaticamente objetos semelhantes.  Um “cluster”: grupo de textos ou informações com conteúdos semelhantes.  Método particular de “clustering” (agrupamento) dá uma definição mais detalhada de um grupo e provê técnicas de geração dos mesmos.

Técnicas de agrupamentos em IR Clusters de nível mais elevado Clusters de nível mais baixo Pergunta/Questão Exportação dinamarquesa para a Índia (1) Dinamarca-Í ndia, importação e guia de transporte (2) Estatística de exportação: Índia ( 3) Dinamarca- Índia, guia de exportação (4) Exportação dinamarquesa para a Índia ( 1) Estatística de exportação: Índia (3) Dinamarca-Índia, importação e guia de transporte (2) Dinamarca-Índia, guia de exportação (4) Dinamarca Índia Exportação Posição: Relevância decrescente Dinamarca- Índia, guia de exportação (4) Exportação dinamarquesa para a Índia (1) Estatística de exportação: Índia ( 3) Dinamarca- Índia, importação e guia de transporte (2)

Técnicas de agrupamentos em IR Exportação dinamarquesa para a Índia (1) Estatística de exportação : Índia ( 3) Dinamarca - Índia, guia de exportação (4) Dinamarca - Índia, importação e guia de transporte (2) Índia Índia exportação Índia: importação e transporte Índia Dinamarca Guia