A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Internet e RI - aula 11 Introdução a Teoria da Classificação Suzana Dantas.

Apresentações semelhantes


Apresentação em tema: "Internet e RI - aula 11 Introdução a Teoria da Classificação Suzana Dantas."— Transcrição da apresentação:

1 Internet e RI - aula 11 Introdução a Teoria da Classificação Suzana Dantas

2 Internet e RI - aula 12 Sistema de Recuperação da informação (SRI) Um Sistema de Recuperação da Informação é uma organização para armazenar e tornar disponível informação, explorando-a de modo positivo, com um índice de assunto dos documentos existentes na coleção, permitindo recuperar as referências

3 Internet e RI - aula 13 Origem Existência de computadores – potencial para implementação de bases de dados conjuntos de ficheiros Software para manter e pesquisar a informação Sistemas desenvolvidos – SGBD armazenamento e processamento informação em linguagens muito restritas – Armazenamento e RI - pesquisa de documentos necessidade sentida nas bibliotecas nos anos 50 reforço: proliferação de documentos eletrônicos mais reforço: WWW

4 Internet e RI - aula 14 Conceitos Recuperação de Informação – no sentido da recuperação de documentos ou de textos Atividades principais – indexação ( modo de representar documentos e perguntas) – consulta (modo de analisar itens com vista à resposta a perguntas) Atividades relacionadas - diversificação na forma de pesquisa - ex. browsing - apresentação visual de resultados Entidades primitivas – documentos, termos de indexação

5 Internet e RI - aula 15 Nomes Índice: nome genérico para catálogos, bibliografias, índices de artigos, etc… Registro de documento cabeçalho: nome do autor, cabeçalho do assunto descrição: autor, título, edição, editor, paginação localização

6 Internet e RI - aula 16 Indexar Indexar significa incluir um documento num repositório de informações Inclui identificar, determinar assuntos e selecionar termos para representar os índices Utiliza uma linguagem de indexação

7 Internet e RI - aula 17 Métodos de Indexação Por palavra utiliza as palavras encontradas no título ou no documento KWIC : Keyword in Context Por assunto supõe a análise do conteúdo temático do documento, a decisão sobre os conceitos presentes e a tradução em uma linguagem apropriada (artificial ou controlada)

8 Internet e RI - aula 18 Revocação e Precisão As medidas mais comuns para avaliar a qualidade de um sistema de busca e recuperação de informação são conhecidas com revocação e precisão Revocação mede a proporção de documentos relevantes recuperados Precisão mede quantos documentos relevantes foram recuperados

9 Internet e RI - aula 19 Revocação e Precisão Normalmente sistemas de BRI possuem uma curva de Recall x Precision

10 Internet e RI - aula 110 Revocação e Precisão Itens não relevantes Itens relevantes Itens recuperados Itens não recuperados A C B D

11 Internet e RI - aula 111 Revocação e Precisão Revocação Relevantes Recuperados/Total de itens relevantes A/(A+D) Precisão Relevantes Recuperados/Total Recuperados A/(A+B)

12 Internet e RI - aula 112 Fatores que governam Exaustividade Extensão com que determinado documento é indexado (número de conceitos utilizados) grau de profundidade da indexação Especificidade Exatidão dos descritores depende da linguagem de indexação

13 Internet e RI - aula 113 Relação Maior exaustividade aumenta a revocação e diminui a precisão Maior especifidade diminui a revocação e aumenta a precisão

14 Internet e RI - aula 114 Linguagens de Indexação Vocabulário coleção de termos de indexação descritores: palavras cabeçalhos de assuntos símbolos de classificação Sintaxe artifícios empregados para revelar as relações entre os conceitos e as regras para estabelecer os descritores e a ordem de citação

15 Internet e RI - aula 115 Elementos Promotores Revocação: aumentam o número de documentos de uma classe, alargando a definição do descritor e reduzindo o tamanho do vocabulário Precisão: reduzem o tamanho das classes, restringem a definição dos descritores e aumentam o tamanho do vocabulário

16 Internet e RI - aula 116 Provendo Revocação Controle de sinônimos Controle de quase-sinônimos Agrupamento de várias formas de uma palavra (radical comum, singular e plural) Agrupamento de conceitos semelhantes ou relacionados Elos hierárquicos

17 Internet e RI - aula 117 Promovendo Precisão Coordenação Distinção de homônimos Ponderação Elos (links) Papéis ou funções (roles)

18 Internet e RI - aula 118 Extensão da Recuperação da Informação Novos meios em documentos – técnicas usadas em texto são extensíveis – documentos são cada vez mais heterogéneos Documentos em linguagens diversas – noção de documento esbate-se – pesquisas tendem a requerer técnicas híbridas Para tarefa específica – necessário identificar os seus requisitos de indexação e pesquisa

19 Internet e RI - aula 119 Processo de recuperação indexação Texto operações índice Interface usuário Operações de query ranking Busca (searching) Modelo texto usuário Pergunta (query)


Carregar ppt "Internet e RI - aula 11 Introdução a Teoria da Classificação Suzana Dantas."

Apresentações semelhantes


Anúncios Google