A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Tendências em indexação

Apresentações semelhantes


Apresentação em tema: "Tendências em indexação"— Transcrição da apresentação:

1 Tendências em indexação
Disciplina: Indexação – Teoria e métodos CBD0284 ECA/USP Profa. Dra. Cibele A. C. Marques dos Santos

2 representação de conteúdo dos documentos eletrônicos
Vocabulário representação de conteúdo dos documentos eletrônicos assegurar a consistência e o controle de vocabulário complexidade do processo de indexação questões relativas à indexação manual e indexação automatizada setembro de 18

3 Para padronização da representação de conteúdo é necessário utilizar
Vocabulário Para padronização da representação de conteúdo é necessário utilizar normas de valores linguísticos, sintáticos e semânticos classificações, tesauros, taxonomias ontologias, mapas conceituais, anéis de sinônimos. setembro de 18

4 Normalização norma ANSI/NISO Z39.19 norma britânica BS8723
diretrizes para construção, formatação e gerenciamento de tesauros monolíngues, revisão de expansão do conceito de tesauro e processos automatizados. norma britânica BS8723 diretrizes para o desenvolvimento de tesauros monolíngues atualizada pela norma ISO :2011e ISO em desenvolvimento setembro de 18

5 Normalização Metadados Inclusão de marcadores temáticos
Padrões internacionais, equipe interdisciplinar , desenhados para ajudar os motores de busca a encontrar e recuperar as páginas Web. Inclusão de marcadores temáticos Indexação de assuntos – palavras-chaves regras explícitas para a organização e hierarquização Vocabulário Controlado (tesauro, taxonomia) Conceitos com características compartilhadas Categorias linguístico-funcionais Normalização (ANSI/NISO Z39.19 – ISO :2011) Ontologias, mapas conceituais, nuvens de tags setembro de 18

6 Taxonomia classificação, espécie em relação a leis genéricas ou princípios de subdivisão da ciência, de uma ciência particular ou um assunto, relações de classificação classificação sistemática dos organismos vivos. Exemplo: Organismo --> Sistemas --> Órgãos -->Tecidos --> Células --> Organelas --> Moléculas setembro de 18

7 Taxonomia O uso genérico do termo mapeamento tem sido enfatizado nas taxonomias e ontologias com novas técnicas O tesauro começa a ficar quase invisível para os usuários. Taxonomia tem sido usada com pelo menos 5 sentidos: 1) Diretórios Web: usado na Internet e nas intranets. Uma forma de classificação, com um menu de termo superior, o segundo nível é mostrado e com os diversos níveis. os termos podem estar repetidos nos diferentes níveis criando caminhos alternativos para pesquisa. setembro de 18

8 Taxonomia 2) Taxonomias para indexação automática:
Em site comercial o usuário é apresentado a 2 níveis de classificação. O que o usuário não vê é a taxonomia atrás da classificação, onde cada termo carrega conjuntos de algoritmos de palavras e frases, sinônimos, variações sintáticas, pesos. Soluções deste tipo são interessantes onde a indexação manual não é viável economicamente. setembro de 18

9 Taxonomia Exemplos: Open Directory Project (www.dmoz.com)
Taxonomia com mais de organizados por mais de editores voluntários. Factiva ( Serviço comercial de taxonomias: setembro de 18

10 Taxonomia 3) Taxonomias criadas por categorização automática:
alguns softwares fazem análise de texto, criam categorias e classificam os documentos a partir das categorias criadas. podem ser disponibilizados no formato de diretórios Web, ou em mapas bi-dimensionais, com os termos relacionados linkados. Exemplo: setembro de 18

11 Taxonomia 4) Cabeçalhos e filtros:
a taxonomia é criada ou importada e usada numa formulação de busca. Os homógrafos podem ser especificados para perderem a ambigüidade e os sinônimos inseridos em suas hierarquias. É um tesauro formatado para facilitar a navegação. Exemplo: setembro de 18

12 Taxonomia 5)Taxonomias corporativas:
Mapeamento e diretrizes para os repositórios institucionais e seus conteúdos. Novo tipo de tesauro/ontologia usado para mapeamento de alto nível em portais corporativos guiando o capital intelectual da organização. setembro de 18

13 Taxonomia Ex. GlaxoSmithKline
corporação internacional tem um “megatesauro” com conceitos básicos (termos preferidos), (sinônimos – inclusive equivalentes de produtos químicos) e termos relacionados. associaram-se a uma empresa de software americana especializada em ontologias para o desenvolvimento de novo software para a taxonomia. setembro de 18

14 Ontologia ciência ou estudo do ser, parte da metafísica relacionado com o ser ou a essência das coisas, ou o ser no abstrato. definições foram apropriadas pela área da ciência da informação com significados modificados. O sentido original e o sentido apropriado pela área são corretos. É questão de terminologia de área de domínio. setembro de 18

15 Ontologias documento ou arquivo que define formalmente as relações entre termos e conceitos, uma especificação de uma conceituação, para compartilhamento de definições necessárias à criação de um vocabulário comum. Nos novos sentidos destes termos existe uma interrelação que deve ser levada em conta. setembro de 18

16 Ontologias Vickery (1997) primeiro uso do termo ontologia para a área de engenharia e ciência da informação. “Uma ontologia pode ser definida como uma explicitação formal de uma conceituação compartilhada” Conceitualização: refere-se a um modelo abstrato de um fenômeno do mundo que é identificado por conceitos relevantes deste fenômeno. setembro de 18

17 Ontologias Explicita: Formal: Compartilhada:
significa que os tipos de conceitos usados, em contraste com o seu uso de explicitamente definidos. Formal: refere-se ao fato que a ontologia pode ser lida por máquina. Compartilhada: reflete a noção de que a ontologia captura o conhecimento consensual que não é privado ou individual e aceito por um grupo. setembro de 18

18 Ontologias Uma ontologia descreve uma área usando a noção de conceitos, relações, funções e axiomas. Os conceitos em uma ontologia são organizados em taxonomias, onde mecanismos de relações podem ser aplicados. setembro de 18

19 Ontologias Duas das mais antigas e maiores ontologias do mundo são WordNet and CYC. WordNet: termos agrupados em cinco categorias: verbos, adjetivos, advérbios e funções de palavras e seus significados são relacionados através de sinônimos, antônimos, hipônimos (relações hierárquicas), merônimos (parte de relacionamentos que contém conceitos) e relações morfológicas. WordNet é uma ferramenta léxica, disponível gratuitamente na Internet setembro de 18

20 Ontologias A ontologia da CYC foi produzida pela companhia que trabalhou com a GlaxoSmithKline. o conhecimento é representado por uma variante de predicado lógico. setembro de 18

21 Ontologias Ontologias de domínio específico foram construídas para aplicações com tradução por máquina, mapeamento empresarial, re-uso do conhecimento e recuperação da informação. 1) Ontologia organizacional descreve um meta-modelo de informação ex. estrutura e formato de fontes de informação. 2) Ontologia de domínio é usada para descrever o conteúdo de uma fonte de informação. 3) Ontologia empresarial é usada para modelar os processos de negócios. Propõe um modelo de atendimento às necessidades de conhecimento para processos empresariais. setembro de 18

22 A Web Semântica foi proposta por Berners-Lee.
“A Web Semântica não é separada da Web, mas uma extensão da atual, na qual a informação é dada por um significado bem definido, melhor aplicado a computadores e elaborado por trabalho cooperativo” setembro de 18

23 A WebSemântica roda em XML e RDF.
É um sistema online, com o conceito de Web universal, sistema descentralizado sem discriminação de informação comercial ou acadêmica, cultura, linguagem ou mídia. A WebSemântica roda em XML e RDF. setembro de 18

24 Redes semânticas baseadas na Árvore de Porfírio
setembro de 18

25 Redes semânticas setembro de 18

26 Mapas Conceituais Psicologia cognitiva de Ausubel
Aprendizagem ocorre por assimilação de novos conceitos e proposições na estrutura cognitva Aprendizagem significativa   setembro de 18

27 São diagramas que indicam relações entre conceitos
Mapas Conceituais Joseph Novak década de 70 São diagramas que indicam relações entre conceitos setembro de 18

28 Modelo de aprendizagem
Mapas Conceituais Modelo de aprendizagem Estrutura cognitiva está constantemente se reestruturando durante a apresendizagem significativa; O processo é dinâmico; O conhecimento vai sendo construído. setembro de 18

29 Mapas Conceituais – C.I linguagem para descrição e comunicação de conceitos. Estrutura que vai desde os conceitos mais abrangentes até os menos inclusivos. Representações gráficas de conceitos em um domínio específico com interações entre os conceitos. Conceitos são conectados por arcos, formando proposições mediante frases simplificadas. setembro de 18

30 Mapas Conceituais Regras de construção:
Não há um único modo de traçar um mapa conceitual. Um mapa conceitual é uma coisa dinâmica, refletindo a compreensão de quem faz no momento em que faz. setembro de 18

31 Mapas Conceituais Etapas:
seleção: escolha do assunto e identificação das palavras-chave ou frases relacionadas ordenação: organização de conceitos do mais abstrato para o mais concreto agrupamento: reunir conceitos em um mesmo nível de abstração e com forte inter-relacionamento arranjo: organização de conceitos na forma de um diagrama link e preposição: conexão de conceitos com linhas e nomeação de cada linha com uma proposição (Lima, 2004) setembro de 18

32 Mapas Conceituais Mapas Conceituais setembro de 18

33 Cmaptools http://cmap.ihmc.us/ Inspiration http://www.inspiration.com/
Mapas Conceituais Softwares Cmaptools Inspiration Kidsinspiration C-tools setembro de 18

34 Folksonomia Maneira de indexar informações. Esta expressão foi cunhada por Thomas Vander Wal. É uma analogia à taxonomia, mas inclui o prefixo folks, palavra da língua inglesa que significa pessoas. Construção a partir da lingua natural da comunidade que a utiliza. Enquanto na taxonomia clássica primeiro são definidas as categorias do índice para depois encaixar as informações em uma delas (e em apenas uma), a folksonomia permite a cada usuário da informação classificar com uma ou mais palavras-chaves ou tags (marcadores). Por meio das tags, o usuário pode recuperar as informações e compartilhá-las. Pode visualizar as tags de outros usuários, assim como identificar o grau de popularidade de cada tag no sistema, e acessar as informações relacionadas. setembro de 18

35 Folksonomia O primeiro site a usar folksonomia foi o del.icio.us ( e, em seguida, o flickr e o youTube. O gmail oferece, no lugar de pastas, o recurso de tags para organizar os s. Mas não é um exemplo clássico de folksonomia, pois não permite compartilhar as tags entre usuários do sistema. A rede social Last FM usa a folksonomia para efetuar a classificação de faixas e artistas. O Library Thing é um catalogo cooperativo que utiliza a folksonomia ( Blogs e microblogs utilizam marcadores. O Twitter utiliza #hashtags. setembro de 18

36 Controle da linguagem e estrutura semântica
Glossários e dicionários Lista de autoridades Lista de sinônimos Cabeçalhos de assunto Classificações Taxonomias/Folksonomia Tesauros Mapas conceituais Rede semânticas Ontologias setembro de 18

37 Ranganathan Para a construção de um esquema de classificação ou para sua extensão pode-se utilizar os Cânones de Classificação, Sequência Útil e os Postulados e Princípios para Sequência de Facetas. setembro de 18

38 Ranganathan As Leis Fundamentais consistem em:
Leis da Biblioteconomia, Leis da Interpretação, Lei da Imparcialidade, Lei da Simetria, Lei da Parcimônia, Lei da Variação Local, Lei da Osmose. setembro de 18

39 Categorias para organização de classes, sub-classes, cadeias e renques é preciso reuni-los em categorias, facetas em categorias fundamentais, buscando o nível seminal, aquela que dá origem a classes, chegando ao nível fenomenal mais próximo do nível seminal. setembro de 18

40 Categorias chegar ao nível produtivo que funcione para classificação que seja útil para a maioria. categorias referem-se a cinco idéias fundamentais, as mais genéricas possíveis e passíveis de se manifestarem de diversas formas, capazes de hospedar todos os objetos da natureza até então conhecidos pelo homem e classificá-los de acordo com sua natureza conceitual. são elas: tempo, espaço, energia, matéria e personalidade. (GOMES, MOTTA E CAMPOS, 2006) setembro de 18

41 Impacto das facetas Análise de facetas retomada recentemente
Sistemas de organização do conhecimento estruturados em elementos facetados. Sites comerciais utilizando abordagem facetada Compreensão diferenciada da ideia de facetas (BROUGHTON, 2007) setembro de 18

42 Impacto das facetas Fast: Faceted Application of subject terminology – derivado da LCSH Sites comerciais setembro de 18

43 Abordagem clássica Meio de organizar os conceitos em uma área de domínio. Conceitos de grupo baseados em características compartilhadas. Usadas com receptáculos de conceitos Categorias linguístico / funcionais Linguagens pré-coordenadas setembro de 18

44 Abordagens Categorias de Ranganathan (PMEST).
Categorias do CRG: (coisa, tipo, parte, propriedade, material, processo, operação, paciente, produto, agente, espaço, tempo). Taxonomia e classificação - texto setembro de 18

45 Modelos moleculares Modelagem molecular permite um equivalente moderno a analogia com o Meccano feita por Ranganathan. O sistema molecular representa a natureza dos componentes, seu relacionamento, posições relativas, relações internas e externas com partículas, sintaxe ou regras de combinação. setembro de 18

46 Modelos moleculares Ontologias Mapas conceituais
Label clouds / nuvens de tags Outros sistemas facetados modernos (inclusive tesauros modernizados, com possibilidade de navegação) FATKS setembro de 18

47 Referências ZENG, M. L . Standards for Controlled Vocabularies. Denver, (Apresentado em 7th NKOS Workshop, 2005). ALVARENGA, L; SOUZA, R. R . A Web Semântica e suas contribuições para a ciência da informação. Ciência da Informação., v.33, n1, 2004 BROUGHTON, V. Meccano, molecules and the organization of knowlegde: the continuing contribution of S. R. Ranganathan. (Apresentado em ISKO UK, nov. 2007). Disponível em: MÉNDEZ RODRÍGUES, E . Modelos de metadatos. In: Méndez Rodrígues, E. Metadados y recuperación de información: estándares, problemas y aplicabilidad em bibliotecas digitales. Gijón: Trea, cap. 3. LIMA, G. A. B. Mapa conceitual como ferramenta para organização do conhecimento em sistema de hipertextos e seus aspectos cognitivos. Belo Horizonte, Perspectiva em Ciência da Informação, v. 9, n. 2, p , jul. / dez Disponível em: BAX, M. P e SOUZA, R. R. Uma proposta de uso de agentes e mapas conceituais para representação de conhecimentos altamente contextualizados. Disponível em: setembro de 18


Carregar ppt "Tendências em indexação"

Apresentações semelhantes


Anúncios Google