Linguagens Documentárias

Slides:



Advertisements
Apresentações semelhantes
Análise e Projeto de Sistemas I
Advertisements

SELEÇÃO DE FONTES DE INFORMAÇÃO:
Profa. Dra Maria Luiza de Almeida Campos
A ORGANIZAÇÃO DA VIDA DE ESTUDOS NA UNIVERSIDADE
ISO Processos do Ciclo de Vida do Software
Ciência da Informação e Documentação Departamento de Ciência da Informação e Documentação Disciplina: Gestão da Informação e do Conhecimento Prof.: Lillian.
INTRODUÇÃO A INFORMÁTICA
Adélia Barros Requisitos Adélia Barros
Ontologias para Melhorar Precisão e Cobertura de Buscas na Web
Introdução a Teoria da Classificação
Conceitos Básicos Dado: fato do mundo real que está registrado e possui um significado implícito no contexto de um domínio de aplicação Exemplos: endereço,
Análise Estruturada O mais amplamente usado dos métodos de modelagem de requisitos Modelos que retratam fluxo e o conteúdo da informação (dados e controle)
TSDD Teste de segurança durante o desenvolvimento.
Profa Luciane Vital Indexação de multimeios
Informação e Documentação em Museus
Estilos e Abordagens.
Abrangência do Planejamento
Tesauros José Antonio M. Nascimento.
Análise do Conteúdo e a Análise Documental
Seminário de Engenharia de Usabilidade
Macrotesauros em Biotecnologia para Amazônia. Caracterização do Problema Crescimento da oferta de informação Sistemas de organização do conhecimento Promovam.
Linguística, Semântica e Terminologia
Sistemas de Organização do Conhecimento
Taxonomia Profa. Lillian Alvares,
Faculdade de Ciência da Informação Universidade de Brasília
Tipos de Sistemas de Organização do Conhecimento
O Ensino de Ciências e suas Relações com o Contexto Social
Premissas A representação da informação estatística necessita de linguagem própria e regras diferentes da representação de informação textual O tratamento.
Introdução e Fundamentos Engenharia de Requisitos
Construindo tesauros Prof. José Antonio M. Nascimento.
TEORIA DO CONCEITO A Teoria do Conceito possibilitou bases mais sólidas para o entendimento do que consideramos conceito para fins de representação/recuperação.
CURSO TÉCNICO EM SEGURANÇA DO TRABALHO
SISTEMA TEORIA DE SISTEMAS ABORDAGEM SISTÊMICA.
Classificação Profa. Lillian Alvares, Faculdade de Ciência da Informação, Universidade de Brasília.
Vocabulários Controlados
Trabalhos Científicos Usuais: Caracterização e Estrutura
CONHECIMENTOS ESPECÍFICOS PROFESSORA: LILIAN MICHELLE
1 - Introdução à Modelagem Matemática
ISO NBR Eduardo Silvestri Ribeiro
ELABORAÇÃO DE ARTIGO PARA PUBLICAÇÃO EM PERIÓDICO
DISCIPLINA Pesquisa de Tecnologias Emergentes - PTE Profa. Eliane
Indexação Profa. Lillian Alvares Faculdade de Ciência da Informação
Faculdade de Ciência da Informação Universidade de Brasília
Introdução a Banco de Dados Aula 04
Requisitos de Software
Revisão de literatura A revisão de literatura tem papel fundamental no trabalho acadêmico, pois é através dela que você situa seu trabalho dentro.
Engenharia de Software
Os Formalismos de Representação do Conhecimento Primeiros estudos: Ontologia e Terminologia.
OSM Organização, Sistemas e Métodos
Fundamentos da Seleção
Tesauro, Taxonomia e Ontologia: uma evolução?
Indexação e linguagens documentárias – uma pequena revisão introdutória José Antonio M. Nascimento.
Para entender as linguagens documentárias
Certificação e Auditoria
Formulários.
INTELIGÊNCIA EMPRESARIAL Aula 6 – Componentes dos Sistemas de Apoio à Decisão.
Leitura e Documentação
LEITURA EM ANÁLISE DOCUMENTÁRIA Profa. Giovana Deliberali Maimone.
O resumo Claire Guinchat e Michel Menou. Introdução  O resumo é uma operação que permite diminuir sensivelmente o volume de informação.  São textos.
Indexação e Resumos: teoria e prática
Tefko Saracevic.  Professor Emérito da Escola de Comunicação e Ciência da Informação de Rutgers da Universidade Estadual de Nova Jersey (EUA). Saracevic.
A natureza das linguagens documentárias HUTCHINS (1975)
Tratamento Temático da Informação
A natureza das linguagens documentárias HUTCHINS (1975)
Recuperação da Informação Peter Ingwersen.  Universidade de Copenhagen (Dinamarca)  Peter Ingwersen tornou-se professor de pesquisa em 2001 e Professor.
Informação documentária Profa. Giovana Deliberali Maimone.
Aula Origens da Linguagem Documentária Documentação (déc. 50 a 70) crescimento do conhecimento científico e tecnológico Dificuldades para armazenar.
Tefko Saracevic.  Professor Emérito da Escola de Comunicação e Ciência da Informação de Rutgers da Universidade Estadual de Nova Jersey (EUA). Saracevic.
María Pinto Molina “Hacia um modelo de representación documental: la técnica de resumir”
Indexação: o uso do Vocabulário de Controle Externo do TCU (VCE) ISC/CEDOC Serviço de Gestão do Conhecimento Junho/2016 Beatriz Pinheiro de Melo Gomes.
Transcrição da apresentação:

Linguagens Documentárias Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília

Contexto Organização da Informação... ... procura criar métodos e instrumentos para elaborar informação documentária... ... Indexar, resumir e construir linguagens de representação são os termos técnicos que denominam essas operações

Contexto A questão é: Como organizar a informação para que o conhecimento fique disponível?

Contexto Pelas Linguagens Documentárias, pois... ...elas estão contidas no contextos de produção e de busca de informação... ... é parte constitutiva da preocupação com a recuperação da informação.

Contexto Uma das condições para plena recuperação de informação é o uso de Linguagens Documentárias

Contexto As Linguagens Documentárias são instrumentos privilegiados de mediação que apresentam dupla função:

Contexto a) representar o conhecimento b) promover interação entre usuário e conteúdo.

Principais intersecções interdisciplinares Linguística: o princípio estrutural da organização da linguagem Terminologia: a modelagem do conceito e dos sistemas de conceitos, onde, glossários e dicionários terminológicos especializados são seus produtos Lógica: a identificação das formas de raciocínio e de organização de conjuntos

Campos para atuação... Não é exclusivo dos Bibliotecários e Documentalistas; Áreas de aplicação: Filosofia, Informática, Inteligência Artificial, Engenharia, Psicologia entre outros....

Contexto As LD constituem uma espécie de código de tradução que tem, entre suas funções, a normalização das representações documentárias como meio de viabilizar sua comunicação.

Contexto Essa tradução que permite a transformação de informações dos textos em linguagem natural e/ou especializada para uma linguagem documentária controlada, envolve a questão da significação: Como representar adequadamente as informações sem comprometer o seu significado?

Resultados da tradução

Contexto LD são instrumentos que não permitem a recuperação da dinamicidade dos textos um dos seus objetivos é o de fornecer uma versão extremamente econômica dos textos originais por intermédio, do destaque das informações consideradas centrais nos documentos.

Contexto LD e textos são construções de natureza distinta, por isso.. ... na operação de conversão perde-se a especificidade do texto original em prol da generalização.

Definições

Definições São linguagens artificialmente construídas que visam “traduzir” sinteticamente conteúdos documentais, utilizadas nos sistemas documentários para indexação, armazenamento e recuperação da informação.

Definições É um conjunto controlado de termos usado para representar os assuntos dos documentos.

Definições O objetivo da LD é o controle de vocabulário, isto é, controlar a terminologia de área ou áreas do conhecimento por meio do estabelecimento de um conceito/interpretação definido aos termos de acordo com as necessidades de uso do sistema.

Definições A utilização de uma LD para escolha do termo correto para descritor reduz a diversidade e a ambiguidade da terminologia e estabelece a eficácia com que o indexador pode descrever o assunto dos documentos, já que vários autores podem se utilizar de diferentes palavras para expressar uma mesma idéia.

Definições Só podem cobrir conceitos de um domínio específico do conhecimento humano, não havendo assim, linguagens documentárias gerais.

Definições Visam a uniformização do uso de linguagens especializadas... ...proporcionando uma representação padronizada do conteúdo informacional... ... bem como uma recuperação da informação mais pertinente.

Definições As palavras (que descrevem as informações ou descritores) são os elementos que compõem as linguagens documentárias. São extraídos da linguagem natural

Terminologia Tipos de linguagem Linguagem Natural Linguagem Documentária, também conhecida como: Linguagem Controlada Linguagem de Indexação Linguagem Descritoras Codificações Documentárias

Medidas de Eficácia

Revocação e Precisão = Revocação = Precisão Todos os documentos Documentos relevantes Documentos retornados Relevantes retornados = Revocação = Precisão

Revocação ou Recall Relação entre o número de documentos relevantes sobre determinado tema, recuperados pelo sistema, e o número total de documentos sobre o tema, existentes nos registros do mesmo sistema.

Precisão ou relevância Refere-se à qualidade dos documentos recuperados pelo sistema, para atendimento dos pedidos relativos a temas específicos, encaminhados por usuários diversos. Documentos relevantes retornados dividido pelo número total de retornados

Linguagens Pré-Coordenadas e Linguagens Pós-Coordenadas

Linguagens Pré-Coordenadas

Linguagens pré-coordenadas Combinação feita na etapa de entrada das palavras, na indexação. Os assuntos são representados por um conjunto de termos já combinados. Exemplo: Álbum de fotografia

Linguagens pré-coordenadas Devem contemplar todas as possibilidades de combinação entre os termos para formar assuntos complexos. São palavras, termos ou frases escolhidas para expressar um conceito ou uma combinação de conceitos de indexação

Linguagens pré-coordenadas Adota: VER: remete ao termo adotado como entrada (sinônimos, termos específicos para termos genéricos) VER TAMBÉM: remete a assuntos relacionados. Complementa a informação para o usuário

Linguagens pré-coordenadas Trazem problemas à indexação, devido, principalmente, impossibilidade de prever todas as alternativas de relacionamento entre conceitos.

Linguagens pré-coordenadas O número e a precisão dos termos de uma lista podem levar a crer numa busca facilitada. Não são flexíveis para permitir uma busca por qualquer termo que compõe o cabeçalho.

Linguagens pré-coordenadas Podem ser de dois tipos: Classificatórias (Classificações) Alfabéticas (Cabeçalhos de assunto)

Desvantagens Necessitam de entradas múltiplas para explicitar todos os conceitos significativos Difíceis de atualizar, pouco dinamismo Menor flexibilidade na indexação Relações estáticas Menor revocação

Linguagens Pós-Coordenadas

Linguagens pós-coordenadas Combinação feita no momento da saída, na recuperação da informação. Utilização de operadores booleanos: E, OU, NÃO Exemplo: álbum E fotografia para recuperar “álbum de fotografia”

Vantagens Dinâmicas, novos termos podem ser incluídos com maior rapidez Relações multidimensionais entre termos Todos os termos são pontos de acesso Maior flexibilidade na indexação

Desvantagens Geram falsa recuperação, necessitam de artifícios para evitá-la Exigem maior esforço na busca

Linguagem Natural (LN) e Linguagem Documentária (LD)

semânticos e sintáticos LN LD A parte oral é mais importante. São fundamentalmente escritas. São gerais São especializadas São estabelecidas e adaptadas através de longos períodos de tempo e por muitas pessoas. São estabelecidas em poucos anos por um número reduzido de pessoas A sinonímia e a polissemia são fatos naturais das LN. Aceitam ambigüidades Não aceitam ambiguidades. Não comportam polissemias e e se esforçam por evitar as sinonímias. São naturalmente aceitas e adquiridas pelos usuários Devem ser aceitas pelos usuários. Interessam os aspectos fonológicos, semânticos e sintáticos Interessam somente os aspectos São naturais São artificiais

Não têm uma função específica LN LD São menos eficientes que as LD nas operações de recuperação da informação São mais eficientes que as LN São instrumentos de comunicação Têm sua própria estrutura Sua estrutura baseia-se na estrutura da LN sobre a qual elas são formadas Necessitam de hierarquias para evitar malformações gramaticais Necessitam de hierarquias para evitar malformações gramaticais. São sensíveis a mudanças culturais Não têm uma função específica Têm um propósito específico e um nível de funções

LD: Vantagens e desvantagens Se bem construído, o vocabulário controlado poderá oferecer alta precisão e revocação, e também ampliar a confiança do usuário frente a um possível resultado negativo Um rígido vocabulário controlado poderá não refletir os objetivos da base de dados As relações hierárquicas e as remissivas do vocabulário controlado auxiliam tanto o indexador, quanto o usuário na identificação de conceitos relacionados Necessidade de treinamento no uso dos vocabulários controlados tanto para os intermediários, quanto para os usuários finais

LD: Vantagens e desvantagens Redução no tempo de consulta à base, pois a estratégia de busca será melhor elaborada com o uso do vocabulário controlado Desatualização do vocabulário poderá conduzir a resultados falsos Aumenta a precisão

LD: Vantagens e desvantagens Controle total do vocabulário de indexação, minimizando os problemas de comunicação entre os indexadores e os usuários Custos: a produção e manutenção da base de dados terão despesas maiores com a equipe de indexadores. Terá ainda que, manter pessoal especializado na atualização do vocabulário Promove a consistência/coerência na indexação

Linguagem Natural

LN: Vantagens e desvantagens Permite o imediato registro da informação numa base de dados, sem necessidade de consulta a uma linguagem de controle Os usuários, no processo de busca, precisam fazer um esforço intelectual maior para determinar os sinônimos, as grafias Processo de busca é facilitado com a ausência de treinamentos específicos no uso da linguagem de controle Haverá uma alta incidência de respostas negativas ou de relações entre os termos usados na busca (por ausência de padronização) Termos de indexação são extraídos diretamente dos documentos que vão compor a base de dados Custos de acesso tendem a aumentar com a entrada de termos aleatórios

LN: Vantagens e desvantagens Termos específicos citados nos documentos podem ser encontrados Uma estratégia de busca que arrole todos os principais conceitos e seus sinônimos deve ser elaborada para cada base de dados Elimina os conflitos de comunicação entre os indexadores e os usuários, pois, ambos terão acesso aos mesmos termos Perda de confiança do usuário numa possível resposta negativa

Tipos de LD

Tipos Sistemas de classificação Listas de cabeçalhos de assuntos Pré-coordenadas Pós-coordenadas Sistemas de classificação Listas de cabeçalhos de assuntos Glossários Dicionários Vocabulários controlados Tesauro Taxonomias Ontologias

Referência KOBASHI, Nair Yumiko. Fundamentos semânticos e pragmáticos da construção de instrumentos de representação de informação. DataGramaZero: Revista de Ciência da Informação, v.8, n.6, dez, 2007.