A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Representação de documentos: do índice à informação documentária Disciplina: Indexação Teoria e Métodos – CBD0284 Profa. Vânia Mara Alves Lima Profa. Cibele.

Apresentações semelhantes


Apresentação em tema: "Representação de documentos: do índice à informação documentária Disciplina: Indexação Teoria e Métodos – CBD0284 Profa. Vânia Mara Alves Lima Profa. Cibele."— Transcrição da apresentação:

1 Representação de documentos: do índice à informação documentária Disciplina: Indexação Teoria e Métodos – CBD0284 Profa. Vânia Mara Alves Lima Profa. Cibele A C M Santos 2015 1

2 História do Índice  Índices primitivos:pinturas e gravações pré-históricas  Mostram a vida cotidiana e os rituais  Encontrados desenhos de mãos e dedos indicadores apontando aspectos a destacar. 2

3 Primeiras linguagens escritas  Na forma pictográfica como os hieróglifos egípcios por volta de 3.000 A.C  primeiros alfabetos como o sistema etrusco, sistema fenício e o alfabeto grego 3

4 Primeiros índices  No império Hitita foram encontradas tábuas que pertenciam a um arquivo de contratos, documentos oficiais, profecias, leis e textos históricos datados de 1800 A.C.  Cada tábua tinha um número, e haviam tábuas que indicavam o número, título e a primeira linha de informação das outras tábuas. 4

5  1425 A.C. no Egito obra chamada Amduat com figuras sobre a jornada do Deus Sol Ra durante as 12 horas do período noturno.  Possuía um capítulo separado contendo 12 seções com algumas linhas indicando o conteúdo restante da obra. 5

6 Primeiro catálogo  660 A.C. na Assíria introduzido por Ashurbanipal 6

7 400 A.C  Já existia uma indústria de livros manuscritos crescente  As bibliotecas tornaram-se instituições necessárias. 7

8 Biblioteca de Alexandria  Política: adquirir todos os documentos que fossem possíveis.  Zenoto inventou a ordem alfabética para a organização dos acervos  Calímaco desenvolveu a organização temática na bibliografia sobre literatura grega dividida em poesia e prosa com subdivisões por autores de tragédia, comédia, e outros  Cada autor tinha uma breve biografia e a lista de suas obras em ordem alfabética. 8

9 Primeiro problema  Dificuldade com as entradas que envolviam mais de uma categoria.  Solução encontrada por Calímaco: utilização das remissivas nos catálogos bibliográficos,  Mas ainda precisamos de soluções mais adequadas para as bases de dados e a informação eletrônica disponível na internet. 9

10 Idade Média  Surgem nos manuscritos mãos e dedos indicadores nas letras iniciais ou nas margens dos livros destacando uma passagem específica que deveria ser lida.  Esta ideia representa o atendimento à necessidade não apenas do índice, mas a indicação da parte mais importante de cada página. 10

11 Bibliotecas monásticas  Tornaram-se centros de preservação da memória e da cultura  propiciaram o crescimento de listas, levantamentos e comentários sobre os documentos. 11

12 Regras dominicanas (1260)  Permanecem válidas até a atualidade.  escolher um lugar bom, seguro, livre de alagamentos e bem ventilado para a construção do prédio da biblioteca,  a biblioteca deve ter prateleiras suficientes e adequadas para cada tipo de material,  deve ter um catálogo (representação descritiva e indexação) e manter-se atualizado. 12

13 Invenção da imprensa Século 15: os trabalhos passaram a ter muitas cópias que eram distribuídas por todo o mundo. Desenvolvimento dos catálogos alfabéticos.

14 Século XVII  A igreja deixa de ter o controle da informação.  o século 17 existiam jornais, revistas, livros com imagens, livros infantis, o que ocasionou o surgimento da indexação, a princípio voltada para os livros (índices). 14

15 Século XVIII  1870, surge na Inglaterra a Sociedade do Índice que conquistou membros de outros países como Alemanha, Irlanda e Estados Unidos.  O grupo desenvolveu vários projetos e defendia a indexação por assunto, particularmente de periódicos científicos.  Tinham uma proposta ambiciosa de um índice bem completo que cobrisse o maior número possível de fontes, o que só foi possível desenvolver com a web.  Acaba em 1882. 15

16 Indexador  altamente qualificado, analítico e com capacidade de reduzir as palavras do autor para uma expressão significativa,  considerando o que o usuário pode procurar em um índice, e utilizar os termos que o leitor procuraria com mais facilidade (princípios defendidos pela linguística documentária). 16

17 1957 – Sociedade dos Indexadores (Inglaterra)  Atualmente congrega sociedades de vários países do mundo.  A indexação é uma profissão onde é necessário ter habilidades específicas, está regulada por normas e exige a atualização constante do indexador.  Curiosidade: hoje temos o retorno do dedo indicador apontando para as informações mais importantes ( isto já ocorre com os índices escondidos nos metadados das informações na internet. 17

18 Documentação  1665 - edição do "Le Journal des Sçavans" (Paris) Academia Francesa de Ciências  Periódico apresentava os resumos dos trabalhos científicos, filosóficos e artísticos produzidos no período.  Otlet e La Fontaine início do século 20 18

19 Luhn (1958)  Proposta de indexação e elaboração automática de resumos  Durante quase duas décadas foi o paradigma norteador de inúmeros projetos que visavam modificar radicalmente os métodos tradicionais de armazenamento, tratamento e recuperação de informações.  Critérios estatísticos (ocorrência/frequência) de tratamento de textos  Eficientes para identificar formas significantes, mas pouco úteis para determinar significados e, portanto, para reconhecer mensagens e condensá-las. 19

20 Novas hipóteses  É necessário a atribuir valor aos aspectos comunicacionais dos sistemas documentários e aos instrumentos que possam promover níveis crescentes de interação entre sistema e usuário, tais como os tesauros. 20

21 Jean Claude Gardin (França, 1958)  Os aspectos documentários de maior interesse são os processos relacionados à passagem do texto original para a sua representação através de linguagens documentárias.  “Toda linguagem documentária é constituída por um conjunto de termos (o léxico), por relações entre as unidades lexicais, determinadas a priori (o eixo paradigmático) e por uma sintaxe que articula os encadeamentos entre os termos da linguagem (o eixo sintagmático)”. 21

22 Contribuições da Línguística  para resolver os problemas de representação dos itens documentários e das perguntas dos usuários ao sistema,  por serem os processos de análise documentária e de uso da linguagem documentária muito semelhantes àqueles presentes na tradução automática. 22

23 Contribuições da Inteligência artificial  Compreensão automática de textos  Módulos de geração de resumos, utilizados como mecanismos de validação da compreensão de textos de natureza diversa: textos jornalísticos, mensagens de telex, narrativas.  Criação de estruturas conceituais ad hoc que pretendem refletir, de modo pertinente, a dinâmica da criação científica contemporânea, por excelência interdisciplinar. 23

24 Base de dados inteligente (Barceló, 1991)  A solução de um dado problema depende muito mais de conhecimento estruturado do que de um conjunto de dados empíricos apresentados em forma bruta, ou mesmo de um conjunto de referências apenas justapostas.  Desse modo sua proposta, mais do que uma base de dados relacional clássica instaura- se como um sistema de produção de novos dados, a partir da articulação de conhecimentos já disponíveis em um dado domínio. 24

25 Proposta de Sistema Especialista  Sistema composto de: um conjunto de conceitos que descrevem conhecimentos relevantes relacionados a um problema; uma representação "ativa" desses conceitos, o que permite ligar conceitos e perguntas do usuário; um conjunto de regras que gerencia a representação conceitual ; um conjunto de operadores lógicos que articula a linguagem de representação; três tipos de meta-conhecimentos: a) conhecimentos sobre o problema a ser resolvido; b) conhecimentos sobre a estrutura do sistema; c) conhecimentos sobre a estratégia para resolver o problema.  Que adota a técnica do hiperdocumento na sua interface com o usuário. 25

26 Ato documentário  Um ato de comunicação que tem a finalidade de promover a circulação da informação.  Requer visão clara dos parâmetros específicos em que ocorre a situação comunicativa:  objetivos institucionais, tipos de usuários e de demandas, estrutura organizacional, etc..  Estabelecimento de políticas que determinam e controlam o conjunto das operações a serem praticadas.  Requer metodologias 26

27 Informação documentária  Sua elaboração não depende do corpus documental ou do sistema documentário no interior do qual se realiza  Compreende um conjunto de operações, esquematizáveis em três fases: ler um texto; selecionar, no mesmo, o conteúdo informacional considerado pertinente para usos determinados; representar, ou seja, dar forma às informações selecionadas, de modo a transformá-la em algo manipulável. 27

28 Exemplo  Fundação Dorina Nowill lança biblioteca digital na quinta “Até agora, quando uma pessoa com deficiência visual queria ler um livro do acervo da Fundação Dorina Nowill, ela ligava lá ou mandava um e-mail e depois recebia em casa, pelo correio, um CD com a obra. Ou ia buscar na sede da entidade. A partir de quinta-feira, 27, tudo ficará mais fácil. Será inaugurada a Dorinateca, que permitirá um acesso mais ágil e independente a essas obras que estarão disponíveis em três formatos: audiolivro, digital acessível Daisy e para impressão em Braille. O usuário poderá fazer o download de até três títulos por mês no site da biblioteca e não tem que “devolver” a obra. Ele terá a posse do arquivo, mas não poderá repassá-lo. Até o fim do ano, a biblioteca terá 4.400 títulos. O audiolivro mais procurado em 2015 na fundação foi Inferno, de Dan Brown.”  http://cultura.estadao.com.br/blogs/babel/babel-fundacao-dorina-nowill-para- cegos-lanca-biblioteca-digital/ http://cultura.estadao.com.br/blogs/babel/babel-fundacao-dorina-nowill-para- cegos-lanca-biblioteca-digital/ 28

29 Indexação  Compactação do texto-base caracterizada por meio de palavras ou de sintagmas.  Mediada pela linguagem documentária - que generaliza as informações do texto, integrando o a "classes" já previstas no referido instrumento.  a indexação não opera com as informações particulares do texto. 29

30 Linguagem documentária  É sempre uma hipótese de organização de um domínio.  É um conjunto do paradigmas de determinado domínio.  Cada ramo do pensamento científico delimita a classe de fatos que quer explicar, com os meios materiais e conceituais dos quais pode dispor. 30

31 Exemplo  PSICOLOGIA  - DIAGNÓSTICO PSICOLÓGICO  - DISTÚRBIOS PSICOLÓGICOS  - ETOLOGIA HUMANA  - FAMÍLIA (PSICOLOGIA)  - HISTÓRIA DA PSICOLOGIA  - METAPSICOLOGIA  - PROCESSOS PSICOLÓGICOS  - PSICODINÂMICA  - PSICOLOGIA APLICADA  - PSICOLOGIA BASEADA EM EVIDÊNCIAS  - PSICOMETRIA  - SAÚDE MENTAL  - SOCIOMETRIA  - TEORIAS DA PSICOLOGIA  - TRATAMENTO PSICOLÓGICO  - PSICOLOGIA DO SELF  - PSICOLOGIA EVOLUCIONISTA 31

32 Linguagem documentária  Os termos da linguagem documentária são unidades semânticas orientadas para a univocidade,  seu significado é delimitado por operações de fixação semântica.  As informações documentárias submetidas a essas linguagens veiculam, desse modo, conteúdos prefixados. 32

33 Problema  As unidades da linguagem documentária, embora sejam fixadas semanticamente, pelo fato de designarem "classes", e não informações particulares, elas tendem a veicular informação que apresenta certo grau de imprecisão, à semelhança das palavras da linguagem natural. 33

34 Processo de Análise Documentária  2 objetos  O texto como unidade de análise  A LD como instrumento comutador  Como abordar tais objetos?  Qual é o corpo teórico necessário para discutir a AD? Quais são os procedimentos necessários para se observar o documento?  Que tipos de técnicas poderiam otimizar o processo de fabricação da informação documentária? 34

35 Representação  Linguística e na Semiótica: "representar“ é "estar em lugar de, isto é, estar numa tal relação com um outro que, para certos propósitos, é compreendido por alguma mente como se fosse a outra coisa."  Ciência da Comunicação, "representação" é um conceito mediador entre o emissor e o receptor. É entendido, também, como o processo e o produto social da construção de sentidos, por meio de qualquer sistema de significação.  Documentação, o termo "representação" é associado, de um lado, à descrição de aspectos que identifiquem materialmente os documentos (catalogação) e, de outro, ao processo e ao produto da condensação de conteúdos de textos, ou seja, à indexação e à elaboração de resumos (processos) e aos próprios índices e resumos (produtos). 35

36 Na Análise documentária  Representação é o seu produto, isto é a passagem do texto original para uma informação documentária.  É uma operação semântica, mesmo que ela não obedeça, na maioria das vezes, a nenhuma espécie de regra precisa, e que cada organismo de documentação, e mesmo cada analista, se limite a buscar no documento a ocorrência de uma certa regularidade interna, fundada muito mais na experiência ou no hábito do que em algum tipo de procedimento explícito." (GARDIN, 1. C. 1974. p. 81-82 ) 36

37 Representação documentária/Informação documentária  Forma de representação simbólica que é resultado de operações de natureza semântica.  É uma representação particular porque deve responder às exigências impostas pela recuperação da informação, mantendo, com o texto original, uma relação de similaridade. 37

38 Necessário discutir  Os processos de significação, tais como são propostos pela Semântica.  A semântica do código permitirá discutir as relações de significação entre as unidades constitutivas das linguagens documentárias.  Linguística documentária 38

39 Linguagem documentária  Código comutador - conhecido também por outras denominações:  Linguagem de Indexação, Sistema de Classificação, Linguagem de Informação, Listas de Cabeçalhos de Assuntos  composta por um conjunto limitado de termos, prescreve as formas de entrada e de busca a serem utilizadas pelo indexador ou pelo usuário, num sistema documentário.  Suas unidades são selecionadas das Linguagens de Especialidade, da Linguagem de uso corrente e das Terminologias de Domínio. 39

40 Linguagem documentária e Terminologia  As linguagens documentárias operam, por sua vez, em campos do conhecimento especializado, para descrever e tornar recuperáveis os textos aí produzidos  A terminologia tem como objetivo fundamental a seleção e criação de termos para noções de domínios específicos, e sua fixação por meio da definição.  A operação de construção de linguagens documentárias supõe, necessariamente, os instrumentos terminológicos como fontes de referência. 40

41  A LD envolve 3 paradigmas designacionais: 41 Núcleo de ideias (Linguagens de especialidades) Classificações científicas (Terminologias) Linguagem Natural LD

42 As LDs compartilham:  com as terminologias, a característica de serem construídas para fins específicos, mas não apresentam a sua precisão;  com a linguagem natural a função comunicativa, mas não comportam o poder expressivo desta. 42

43 Análise de Conteúdo (AC)  Conjunto de procedimentos de análise e interpretação de textos de natureza diversa (artigos de jornais, obras literárias, testemunhos, discursos políticos etc.) baseados na descrição e quantificação de palavras, temas ou frases desses textos. a) formulação de dados; b) redução dos dados; c) inferência; d) análise Os dados são normalizados e traduzidos para uma linguagem de dados. 43

44 Linguagem de dados para AC  devem exibir duas propriedades fundamentais: serem exaustivos e mutuamente excludentes (representar todas as unidades de registro consideradas significativas).  Seus termos devem ser classes de entidades capazes de discriminar e representar, inequivocamente, os dados do objeto em análise.  Não admite categorias ambíguas, porque estas podem comprometer a confiabilidade dos procedimentos descritívo e, por extensão, a interpretação do fenômeno em estudo. 44

45 Problemas AC  a) por não definir, com o devido rigor, as categorias utilizadas para descrever os dados coletados nos textos;  b) pela falta de uniformidade desses dados, na medida em que eles podem ser palavras materialmente presentes num texto ou unidades maiores de conteúdo (frases ou mesmo páginas), representadas pelas referidas categorias não definidas com rigor, como anteriormente apontado. 45

46 Diferenças AC e AD  os corpora da Análise de Conteúdo podem ser constituídos de textos de natureza diversa, desde os textos científicos até as manifestações estéticas, enquanto a Análise Documentária restringe seu campo de ação à análise de textos de especialidade, de natureza técnico-científica;  a Análise de Conteúdo extrai dos textos fragmentos (palavras, temas e frases) que possam "revelar“ opiniões e valores, ou seja, aquilo que está subentendido no texto; desse modo, a sua preocupação é com o extra texto, isto é, com as condições de produção do texto.  a Análise Documentária, por outro lado, preocupa- se com a identificação da estrutura informacional dos textos, ou seja, com o próprio texto, a fim de elaborar representações condensadas que permitam ao leitor identificar seu conteúdo informacional. 46

47 Análise do discurso (Pêcheux)  Os discursos, por serem articulados no interior de condições de produção determinadas, são definidos como objetos que exibem traços estáveis de manifestação da ideologia.  Deve considerar três questões: a relação do discurso com sua enunciação, condições de produção e de recepção; o discurso como o lugar, ao mesmo tempo, do social e do individual; a articulação entre narrativa e discurso, isto é, o discurso constituído sobre estruturas narrativas que o sustentam 47

48 Análise logicista  No modelo de Gardin os textos são objetos construídos, delimitados necessariamente pelos pontos de partida e de chegada, sendo os raciocínios (inferenciais e/ou dedutivos) "esquematizáveis" sob a forma de proposições descritivas e interpretativas.  A esquematização - processo e produto da Análise Logicista - é, por sua vez, a representação condensada do objeto analisado, do qual foram mantidos tão somente os componentes e as articulações essenciais. 48

49 DOCUMENTOS TRATAMENTO DOCUMENTÁRIO REPRESENTAÇÃO DESCRITIVA ANÁLISE DOCUMENTÁRIA LINGUAGEM DOCUMENTÁRIA FICHAS CATALOGRÁFICAS ÍNDICE DE ASSUNTOS BASE DE DADOS USUÁRIO RESUMOS

50 Análise documentária  Uma área (todo) na qual se insere a indexação propriamente dita (parte), refletindo a representação documentária, fase final do tratamento, em que se utilizam os instrumentos documentários (linguagens) para a geração de produtos documentários (índices, notações classificatórias, resumos). ( GARDIN,1981; PINTO,1993; RUIZ PEREZ, 1992) 50

51 Etapas da Análise documentária  Análise: a decomposição de um todo em seus elementos constitutivos, buscando um sentido informativo.  Síntese: reconstrução do documento de forma abreviada, destacando seus pontos ou passagens de maior expressividade temática  Representação: processo similar à tradução, no qual o conteúdo temático passa a ser expresso de maneira padronizada conforme parâmetros previamente estabelecidos. 51

52 Exercício  Elaborar a informação documentária para representar e recuperar os artigos nos links abaixo:  http://sao-paulo.estadao.com.br/noticias/geral,desmatamento-formiga-ameaca-area-de- protecao-e-billings-na-zona-sul-de-sp--imp-,1749061 http://sao-paulo.estadao.com.br/noticias/geral,desmatamento-formiga-ameaca-area-de- protecao-e-billings-na-zona-sul-de-sp--imp-,1749061  http://revistapesquisa.fapesp.br/2015/07/20/anticorpo-brasileiro-sera-usado-para-criar-nova- droga-contra-o-cancer/ http://revistapesquisa.fapesp.br/2015/07/20/anticorpo-brasileiro-sera-usado-para-criar-nova- droga-contra-o-cancer/  http://revistapesquisa.fapesp.br/2015/08/13/quando-os-cientistas-escreviam-bastante-para- jornais/ http://revistapesquisa.fapesp.br/2015/08/13/quando-os-cientistas-escreviam-bastante-para- jornais/  http://revistapesquisa.fapesp.br/2015/08/13/imagens-para-a-historia/ http://revistapesquisa.fapesp.br/2015/08/13/imagens-para-a-historia/ 52

53 Referência  Beare, G. Past, present and future. The indexer, v.25, n.4, p.257-264, 2007.  KOBASHI, N. Y. Análise Documentária e representação da informação. Informare, Cad. Prog. Pós-Grado Cio rnf., Rio de Janeiro, v.2, n.2 p. 5-27,jul./dez. 1996. 53


Carregar ppt "Representação de documentos: do índice à informação documentária Disciplina: Indexação Teoria e Métodos – CBD0284 Profa. Vânia Mara Alves Lima Profa. Cibele."

Apresentações semelhantes


Anúncios Google