A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Indexação: tipologia e avaliação

Apresentações semelhantes


Apresentação em tema: "Indexação: tipologia e avaliação"— Transcrição da apresentação:

1 Indexação: tipologia e avaliação
Profa. Dra. Vânia Mara Alves Lima CBD/ECA/USP 2015

2 Indexação “Operação pela qual se escolhe os termos mais apropriados para descrever o conteúdo de um documento”(GUINCHAT & MENOU, 1994). prevê: conhecimento do conteúdo do documento; escolha dos conceitos a serem representados; tradução dos conceitos selecionados; incorporação dos elementos sintáticos eventuais. (CHAUMIER, 1973)

3 Definição de Indexação
Etapa do processo de Análise documentária onde se procura identificar e descrever o conteúdo de um documento com termos representativos dos seus assuntos (descritores) os quais constituem uma linguagem documentária.

4 Descritor Ao atribuir um descritor a um documento, o indexador declara que esses descritor possui um alto grau de relevância para o conteúdo do documento; quer dizer ele declara que o significado do descritor está fortemente associado a um conceito incorporado ao documento e que é adequado à área temática.

5 Para os termos que representam novos conceitos, deve-se verificar sua precisão e aceitabilidade em instrumentos de referência: dicionários, enciclopédias de autoridade reconhecida nas suas especialidades; tesauros especializados elaborados de acordo com as normas ISO; tabelas de classificação. Quando não encontra o conceito específico pode representá-lo provisoriamente por termos mais genéricos.

6 Indexação por extração
palavras ou expressões que realmente ocorrem num documento são selecionadas para representar seu conteúdo temático. Indexação por atribuição envolve a atribuição de termos a um documento a partir de uma fonte que não é o próprio documento. Estão na linguagem documentária.

7 > revocação < precisão
Exaustividade Indexar um documento sobre a igreja dos profetas em Congonhas do Campo, MG sob os descritores: Arquitetura religiosa; Igrejas, Edifícios religiosos, Barroco, Profetas, Congonhas do Campo, Minas Gerais > revocação < precisão

8 > precisão < revocação
Especificidade Quanto mais especializada a clientela mais específica deve ser a indexação. Um tópico deve ser indexado sob o termo mais específico que o abranja completamente. O mesmo documento deveria ser indexado em: Igrejas barrocas Congonhas do Campo, MG > precisão < revocação

9 Consequências para a Recuperação da informação
Quanto mais seletiva for a indexação mais necessidade haverá de combinar termos numa relação tipo [OR] a fim de melhorar a revocação. Igrejas barrocas OR Conventos Igrejas barrocas Conventos

10 Quanto mais termos forem combinados numa relação tipo [AND] menor o número de itens recuperados.
Igrejas barrocas AND Conventos Igrejas barrocas Conventos

11 Indexação redundante Exemplo:
quando usamos FRUTAS e LARANJAS. Se atribuirmos termos genéricos toda vez que atribuirmos um termo específico ficará difícil diferenciar artigos genéricos de artigos específicos. Quem procura FRUTAS espera encontrar itens sobre frutas em geral e não itens sobre frutas específicas. Laranjas Frutas

12 Regras de indexação (Lancaster, 1993)
1- Inclua todos os tópicos reconhecidamente de interesse do serviço de informação que sejam tratados substantivamente no documento. 2- Indexe cada um desses tópicos tão especificamente quanto permita o vocabulário do sistema (LD) e o justifique as necessidades ou interesses dos usuários. 3- Se um dado tópico merece ou não ser indexado depende de três fatores: A quantidade de informação apresentada sobre o assunto. O grau de interesse do assunto. A quantidade de informação já existente sobre o assunto.

13 Controle de qualidade Fatores que o garantem:
a imparcialidade do indexador; o conhecimento do indexador sobre o campo coberto pelos documentos a serem indexados; as vantagens do contato direto com o usuário; e a receptividade das linguagens documentárias para novos termos.

14 A qualidade dos serviços de disseminação da informação depende da linguagem utilizada pelo sistema para a indexação e recuperação dos documentos. Porque: permite que se traduza a linguagem do autor sem que se perca a ideia principal; permite que se traduza a linguagem do usuário de modo que satisfaça suas necessidades de informação.

15 Tipologia de indexação
Indexação pré-coordenada Indexação pós-coordenada

16 Indexação pré-coordenada
Onde os termos são previamente combinados de acordo com regras sintáticas estabelecidas pela linguagem documentária. Exemplos: Túneis - Escavação Túneis - Projeto Planejamento territorial urbano - Ocupação do solo Planejamento territorial urbano – História Amazônia - Queimadas Tipos de LDs: Listas de cabeçalhos de assunto e Sistemas tradicionais de Classificação (CDD, CDU, LC)

17 Indexação pós-coordenada
Onde os termos serão combinados de acordo com a sintaxe da lógica de busca. Exemplo um mesmo texto recebe os seguintes descritores: Poluição do ar Monóxido de carbono Rodízio de veículos Tipos de LDs: Vocabulários controlados (Tesauros)

18 Sistema pré-coordenados: estabelecem a coordenação dos vários tópicos referentes a um assunto composto no momento de indexação, e com grande subjetividade determinam uma prioridade na citação desses elementos. Sistema pós-coordenado: as entradas normalmente são conceitos únicos (termos indexadores) e na saída permite-se a comparação das entradas de assunto, com o objetivo de determinar coincidências que revelem documentos pertinentes ao assunto composto pesquisado.

19 Sistema pré-coordenado
Ordem de Citação dos Conceitos Entrada 1: Banco de dados - Ecologia Cabeçalhos de Assuntos Entrada 2: Ecologia - Banco de dados A coordenação de termos envolve uma ordem de citação dos termos.

20 Características de Sistemas Pré-Coordenados
É difícil representar a multifuncionalidade dos termos. Os termos somente podem ser listados numa determinada sequência (A,B,C,D,E) que implica que o primeiro termo é mais importante do que os outros. Não dá pra combinar os termos no momento da busca. Exemplo: Trabalhadores migrantes – Moçambique – África do Sul Moçambique – Trabalhadores migrantes - África do Sul É economicamente inviável.

21 Ordens de citação com prioridades para os conceitos
Cutter: ordem do mais significativo; Kaiser: concreto – processo (Tubos – Soldagem) concreto – localidade – processo (Café – Brasil – Exportação) Coates: coisa – parte – material – ação Exemplo 1: Fabricação de sacos multifolhados de papel Kraft Ação: fabricação Coisa: sacos Propriedade: multifolhados de papel Kraft Ordem de citação: sacos – papel – Kraft – multifolhados – fabricação

22 Sistema pós-coordenado (surge na década 1940)
Entradas: Banco de dados Ecologia Permite que a busca combine os descritores de qualquer maneira. A entrada é feita por cada um dos termos sem a necessidade de coordenação e prioridade na ordem de citação

23 A diferença entre os sistemas pré e pós- coordenados
Está no momento de combinação dos termos pelo usuário durante a estratégia de busca em sistemas de recuperação da informação. No Sistema pré-coordenando ela ocorre no momento da representação. No Sistema pós-coordenado ela ocorre no momento da busca.

24 Comparação entre os sistemas pré- coordenados e pós-coordenados
SISTEMA PÓS-COORDENADO: LAGOS CONTAMINAÇÃO DA ÁGUA PEIXES COMPOSTOS DE MÉRCÚRIO SISTEMA PRÉ-COORDENADO: PEIXES – LAGOS – COMPOSTOS DE MERCÚRIO – CONTAMINAÇÃO DA ÁGUA (LANCASTER, 1995)

25 A ordem de citação pela prioridade poderia funcionar para organizar a estratégia de busca em bases de dados : Exemplo: “Pousada de férias em ilhas brasileiras para pesca submarina”: Ordem de citação: coisa – parte – material – ação ilhas brasileiras – pousadas de férias – pesca submarina.

26 Falhas na Indexação Na Análise:
Deixar de reconhecer um tópico que se reveste de interesse potencial para o grupo usuário atendido. Interpretar erroneamente de que trata o documento levando a atribuição de termos inadequados.

27 Na Tradução: Deixar de utilizar o termo mais específico disponível para representar um assunto. Empregar um termo que seja inadequado para o conteúdo temático devido à falta de conhecimento especializado ou por causa de desatenção.

28 Devido Desconhecimento da terminologia da área.
Subjetividade do indexador. Importante: A partir da análise do documento pelo indexador, é realizado um processo de comunicação interativo entre três variáveis: leitor, texto e contexto. O leitor é a variável mais influente porque precisa realizar a compreensão da leitura mediante a sua cognição.

29 São 3 pontos de vista O autor trata o assunto em função dos seus objetivos e finalidades e das suas concepções pessoais. Os usuários consideram o produto fornecido pelo autor em função de suas preocupações próprias e das suas necessidades de informação que estão em constante mutação e são heterogêneas. O sistema deve responder a uma variedade de usuários que não são iguais e têm níveis distintos de exigência. Portanto, é necessário método e regras de descrição de conteúdo e a utilização de uma LD.

30 Existem diferentes concepções de indexação
Concepção simplista Considera os assuntos como entidades objetivas absolutas, que podem derivar de uma abstração linguística ou de somas utilizando métodos estatísticos. Aqui a indexação pode ser totalmente automatizada.

31 Concepção orientada para o conteúdo
Envolve uma interpretação do conteúdo do documento que vai além dos limites da estrutura superficial léxica ou gramatical. Envolve a identificação de assuntos que não estão explicitamente colocados na estrutura textual superficial do documento, mas que são facilmente identificados por indexador humano.

32 Concepção orientada pela demanda
Considera o assunto como instrumento para transferência de conhecimento, portanto, direcionado para uma finalidade pragmática de informação e conhecimento. Aqui os assuntos devem ser ajustados para funcionar como instrumentos de mediação e transmissão desse conhecimento para qualquer pessoa interessada. O indexador questiona-se: como posso tornar esse conteúdo ou parte dele, visível para o usuário potencial Que termos deverei utilizar para levar esse conhecimento até o leitor interessado

33 O documento mais pertinente à questão de busca feita pelo usuário é aquele cuja indexação proporcionou a identificação de conceitos mais pertinentes ao seu conteúdo, produzindo uma correspondência precisa entre o assunto pesquisado e os índices.

34 O indexador Deve ter em mente as consultas que podem ser feitas ao sistema de informação. Escolher os conceitos que forem considerados os mais apropriados para uma determinada comunidade de usuários. Adaptar tanto os instrumentos de indexação como os próprios procedimentos em função dos pedidos de informação. Usar os descritores adequados já existentes na linguagem documentária.

35 Avaliação da Indexação
A indexação é avaliada como bem sucedida quando permite a quem realiza as buscas localizar itens de que precisa sem ter de examinar muitos de que não precisa. Em teoria a avaliação deveria ser feita a partir de uma comparação do método utilizado com as normas.

36 Critérios de avaliação
Cobertura: quantos documentos sobre um assunto, publicados durante determinado período se acham incluídos na base de dados? Recuperabilidade: quantos documentos sobre o assunto, incluídos na base de dados, são encontrados com o emprego de estratégias de busca “razoáveis”? Previsibilidade: ao utilizar informações da base de dados, com que eficiência o usuário pode aferir quais os itens que serão e os que não serão úteis? Atualidade: os itens publicados recentemente são recuperáveis, ou atrasos na indexação/redação de resumos provocam uma situação em que os itens recuperados mostram resultados de pesquisas “antigo” ao invés dos “novos”

37 Bibliografia ABNT. NBR Métodos para análise de documentos: determinação de seus assuntos e seleção de termos de indexação. Rio de Janeiro: ABNT, 1992. CHAUMIER, J. As técnicas documentais. Lisboa: Europa América, 1973. GUINCHAT,C.; MENOU, M. Introdução geral às ciências e técnicas da informação e documentação. Brasília: IBICT, 1994. LANCASTER, F.W. Indexação e resumos: teoria e prática. Brasília: Briquet de Lemos, 1993.


Carregar ppt "Indexação: tipologia e avaliação"

Apresentações semelhantes


Anúncios Google