Modelos de Recuperação de Informação

Slides:



Advertisements
Apresentações semelhantes
Medidas de Avaliação de Sistemas de Recuperação de Informação
Advertisements

Modelo de Redes de Crenças
Modelo Probabilístico
Operações sobre o Texto
Introdução à Análise de Sistemas
Operações sobre as Consultas
Profa. Dra Maria Luiza de Almeida Campos
Visão Geral Portal das Finanças. Declarações Electrónicas Portal das Finanças Agregação e evolução Portal das Finanças Agregação.
Indexação Automática de Documentos
Diagrama Entidade-Relacionamento – DER
Especificação de Consultas
Propriedades de Documentos
Recuperação de Imagens
Eveline Alonso Veloso PUC-MINAS
Eveline Alonso Veloso PUC-MINAS
Conceitos Gerais relacionados a Recuperação de Informação
Lógica Fuzzy Aplicada a Sistemas de Diagnóstico
Currículo e Formação Docente
ENCCEJA MATEMÁTICA.
4. TEORIA DOS CONJUNTOS FUZZY - 1
Reconhecimento de Padrões Dissimilaridade
Estrutura de indexação Modelos de RI
Introdução a Teoria da Classificação
UNIVERSIDADE FEDERAL DE SANTA CATARINA - UFSC PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA E GESTÃO DO CONHECIMENTO EGC – GESTÃO DO CONHECIMENTO E FERRAMENTAS.
Bruno Augusto Vivas e Pôssas
OS TRÊS PONTOS BÁSICOS DA INTERPRETAÇÃO 1º - O Texto Realizar, no mínimo, duas leituras do texto. 1ª leitura Compreender o conjunto do texto. 2ª.
PARÂMETROS DE MATEMÁTICA PARA A EDUCAÇÃO BÁSICA DE PERNAMBUCO
Tesauros José Antonio M. Nascimento.
Inteligência Artificial
Introduction to Information Retrieval Introduction to Information Retrieval CS276 Information Retrieval and Web Search Christopher Manning and Prabhakar.
Autoria de Aplicações Hipermídia Daniel Schwabe Departamento de Informática PUC-Rio [ Parte 6 ]
Tipos de Sistemas de Organização do Conhecimento
Comunicação e Interação
Orientação Importante:
ORKURIOSO Equipe Arthur Gonçalves - agc Fábio Rocha - frp
Sistemas de Apoio à DecisãoMárcio MoreiraUnidade 5 – Decisões Não Estruturadas – Recuperação de Informações – Slide 1 5Decisões Não Estruturadas 5.1Recuperação.
Bruno Florencio Pinheiro Orientador: Renato Fernandes Corrêa
Premissas A representação da informação estatística necessita de linguagem própria e regras diferentes da representação de informação textual O tratamento.
Mineração da Web Recuperação de Informação
Mineração na Web Introdução a Recuperação de Informação
Recuperação de Informação Clássica
Recuperação de Informação
Mineração da Web Recuperação de Informação
Redes Bayesianas - Aplicação em Recuperação de Informação Rudini Sampaio DCC / UFLA.
Engenharia de Software
Recuperação de Informação
Marcílio C. P. de Souto DIMAp/UFRN
Trabalhos Científicos Usuais: Caracterização e Estrutura
Linguagens Documentárias
Profa. Lillian Alvares Faculdade de Ciência da Informação Universidade de Brasília Recuperação 1.
Introdução a Banco de Dados Aula 04
Projeto Final MCI 2004 Filtragem de s Agente de Classificação de SPAM.
Aplicações dos Modelos de Recuperação da Informação na Extração de Conteúdos na Web Metodologia de Ciência da Computação Professora: Odette Mestrinho Passos.
PROFESSORA ANGELICA ROCHA DE FREITAS
Estrutura de arquivos – Cap 4.1.2
Locus Localização Eudes Cavalcanti.
Agora... Sobre a aula de hoje!!!
CIn-UFPE1 Recuperação de Informação Modelos de Recuperação de Documentos Flávia Barros.
CIn-UFPE1 Recuperação de Informação Modelos de Recuperação de Documentos Flávia Barros.
Uniminas- União Educacional de Minas Gerais Curso Pedagogia Gestão e Tecnologia Educacional Professores:Gilca Vilarinhos Juliene Vasconcelos Zeila Miranda.
Uma proposta para organizar Avaliação:
CBD-0279 Introdução ao Uso dos Metadados no Ambiente das Unidades de Informação Prof. Dr. Ivan Siqueira USP – ECA – CBD 2015.
TUTORIAL. SABIN AMERICANA Esta base é formulada conforme a bibliografia de Joseph Sabin, bibliófilo americano que viveu entre 1821 e Com.
Socialização e sociedade da informação
Sylvia Campos da Luz e Silva Universidade Federal de Pernambuco Centro de Informática Pós-Graduação em Ciência da Computação.
Proposta de desenvolvimento da marca Sebrae Data
Medidas de Avaliação. Para a maioria dos sistemas computacionais é necessário criar medidas para aferir sua eficácia e eficiência; A medida mais comum.
John Lyons.   Os principais sistemas de sinais empregues pelo ser humano para a transmissão de informação, se bem que não são os únicos, são as línguas.
Felipe do Espírito Santo Análise de sistemas - AS Conceito de Engenharia de Sistemas.
COMPILAÇÃO E RECUPERAÇÃO DE INFORMAÇÕES TÉCNICO-CIENTÍFICAS E INDUÇÃO AO CONHECIMENTO DE FORMA ÁGIL NA REDE AGROHIDRO MARIA FERNANDA MOURA 1 ;
Transcrição da apresentação:

Modelos de Recuperação de Informação Eveline Alonso Veloso PUC-MINAS

Referências BAEZA-YATES, Ricardo e RIBEIRO-NETO, Berthier. Modern Information Retrieval. 1ª edição, New York: ACM Press, 1999, capítulo 2.

Indexação Sistemas de recuperação de informação tradicionais; utilizam termos de indexação para; representar; e posteriormente recuperar documentos.

Indexação termo de indexação: palavra-chave ou grupo de palavras relacionadas; que possui(possuem) algum significado. Seu significado ajuda a identificar; os principais temas tratados pelos documentos onde o termo aparece.

Recuperação de Informação Recuperação baseada em termos de indexação é simples; porém apresenta algumas questões relacionadas com a tarefa de recuperação de informação.

Recuperação de Informação – Dificuldades Recuperação de informação utilizando termos de indexação adota como base fundamental a idéia de que; a semântica de documentos e da necessidade de informação do usuário; pode naturalmente ser expressa através de um conjunto de termos de indexação.

Recuperação de Informação – Dificuldades Claramente essa é uma simplificação do problema de recuperação de informação; porque muita da semântica do documento e da necessidade de informação do usuário; é perdida quando os representamos por um conjunto de termos.

Recuperação de Informação – Dificuldades Encontrar documentos que atendam à consulta do usuário; é uma tarefa difícil em um espaço impreciso de termos de indexação. Além disso, a maioria dos usuários não tem nenhum treinamento em como formular apropriadamente sua consulta. Em conseqüência, freqüentemente são retornados documentos não relevantes; em resposta a uma consulta expressa por um conjunto de palavras-chave.

Ordenação de Documentos Problema central relacionado à recuperação de informação; determinar quais são os documentos relevantes; e aqueles que não são; para uma determinada consulta. Esse problema é tratado por um mecanismo de ranking; que estabelece uma ordenação entre os documentos recuperados.

Ordenação de Documentos Documentos que aparecem no topo da lista de documentos retornados; são considerados como tendo maior chance de serem mais relevantes para o usuário. Mecanismos de ordenação; são o núcleo de um sistema de recuperação de informação.

O Processo de Recuperação de Informação necessidade de informação documentos recuperados e ranqueados consulta Coleta Operações sobre a consulta Busca Ordenação Coleção Indexação Índice Operações sobre o texto documento * Figura adaptada de BAEZA-YATES & RIBEIRO-NETO

Modelos de Recuperação de Informação Um mecanismo de ordenação, ou ranking; opera de acordo com um conjunto de premissas; relacionadas com a idéia de relevância do documento. Conjuntos distintos de premissas; relacionadas com uma medida da relevância do documento; estabelecem diferentes modelos de recuperação de informação.

Modelos de Recuperação de Informação O modelo de recuperação de informação adotado pelo sistema; determina a idéia utilizada no sistema para considerar um documento relevante ou não para uma consulta.

Taxonomia dos Modelos de Recuperação de Informação Modelos Clássicos Busca Filtragem Modelos Estruturais Tarefa do Usuário Navegação Navegação

Taxonomia dos Modelos de Recuperação de Informação Teoria de Conjuntos Fuzzy Booleano Estendido Modelos Clássicos Booleano Vetorial Probabilístico Algébricos Indexação por Semântica Latente Vetorial Generalizado Teoria de Probabilidades Redes de Inferência Redes de Crenças

Taxonomia dos Modelos de Recuperação de Informação Modelos Estruturais Nodos Próximos Listas que não se Sobrepõem

Taxonomia dos Modelos de Recuperação de Informação Navegação Flat Guiado por Estrutura Hipertexto

Caracterização Formal de Modelos de Recuperação de Informação conjunto de documentos; coleção. dj: cada um dos diversos documentos da coleção.

Caracterização Formal de Modelos de Recuperação de Informação Q: conjunto composto de representações das necessidades de informação dos usuários; conjunto de consultas. qi: cada uma das consultas desse conjunto.

Caracterização Formal de Modelos de Recuperação de Informação um arcabouço para representação de: documentos; consultas; e suas relações. Esse arcabouço está relacionado com a forma como a função de ranking será construída.

Caracterização Formal de Modelos de Recuperação de Informação R(qi, dj): função de ranking que associa um número real a cada par qi  Q e dj  D. Essa função de ranking define uma ordenação entre os documentos com relação a uma consulta qi.