Eveline Alonso Veloso PUC-MINAS

Slides:



Advertisements
Apresentações semelhantes
Medidas de Avaliação de Sistemas de Recuperação de Informação
Advertisements

Modelo de Redes de Crenças
Modelo Probabilístico
Operações sobre o Texto
Operações sobre as Consultas
gerador de código intermediário
Álgebra Relacional Marcelo Mendes Manaus
VI – Optimização de código Blocos básicos Optimização de ciclos Bibliografia aconselhada: –Apontamentos LFA 1999/ Jorge Morais.
Indexação Automática de Documentos
Diagrama Entidade-Relacionamento – DER
Especificação de Consultas
Propriedades de Documentos
Recuperação de Imagens
Especificação de Processos
Modelos de Recuperação de Informação
Eveline Alonso Veloso PUC-MINAS
Conceitos Gerais relacionados a Recuperação de Informação
Lógica Booleana A álgebra booleana é baseada totalmente na lógica. Desta forma, os circuitos lógicos executam expressões booleanas. As expressões booleanas.
Eletrônica Digital Funções e Portas Lógicas
Lógica de Predicados Sintaxe. O que não é possível expressar em Lógica Prop. Todo tricolor é um campeão. Roberto é tricolor. Logo Roberto é um campeão.
Portas e Funções Lógicas, Tabelas Verdade e Circuitos Lógicos
Ivan Saraiva Silva Aula 1 - Álgebra Booleana
Modelos de Preferências em Inteligência Artificial CP-Nets
SQL 3 Recursão em SQL AULA 7 PGC Sistemas de Banco de Dados
Cálculo Relacional Datalog não-recursivo
Modelos de Preferências AULA 15 DATA MINING Sandra de Amo.
Sumário 1 SQL Embutida 2 Processamento de Consultas
Modelo Relacional parte 1
4. TEORIA DOS CONJUNTOS FUZZY - 1
Medida do Tempo de Execução de um Programa
Medida do Tempo de Execução de um Programa
Estrutura de indexação Modelos de RI
Introdução a Teoria da Classificação
Sistema de dois componentes - condensado
UNIVERSIDADE FEDERAL DE SANTA CATARINA - UFSC PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA E GESTÃO DO CONHECIMENTO EGC – GESTÃO DO CONHECIMENTO E FERRAMENTAS.
Bancos de Dados I Renata Viegas
Inteligência Artificial
NEScrawler Aércio Cavalcanti – Afonso Ferreira - Vilmar Santos -
Introduction to Information Retrieval Introduction to Information Retrieval CS276 Information Retrieval and Web Search Christopher Manning and Prabhakar.
ORKURIOSO Equipe Arthur Gonçalves - agc Fábio Rocha - frp
Sistemas de Apoio à DecisãoMárcio MoreiraUnidade 5 – Decisões Não Estruturadas – Recuperação de Informações – Slide 1 5Decisões Não Estruturadas 5.1Recuperação.
Conceitos de Lógica Digital
Fabíola Guerra Nakamura Vitor Alcântara Batista
Mineração da Web Recuperação de Informação
Linguagem Funcional 2 Linguagem Funcional 2 - LF2 Estende LF1 com funções de alta ordem Uma função passa a ser um valor O contexto inclui um único componente:
Geração de Código Intermediário
Mineração da Web Recuperação de Informação
Mineração na Web Introdução a Recuperação de Informação
Recuperação de Informação Clássica
Recuperação de Informação
Mineração da Web Recuperação de Informação
i-Jus Busca em Diário Oficial
Redes Bayesianas - Aplicação em Recuperação de Informação Rudini Sampaio DCC / UFLA.
Recuperação de Informação
Profa. Lillian Alvares Faculdade de Ciência da Informação Universidade de Brasília Recuperação 1.
Aplicações dos Modelos de Recuperação da Informação na Extração de Conteúdos na Web Metodologia de Ciência da Computação Professora: Odette Mestrinho Passos.
Sistemas Microprocessados e Microcontrolados
Sistemas Digitais e Arquitetura de Computadores - SDAC
Puc-Minas / Pós Graduação 2006 Gestão Estratégica de RH Mensuração em RH Realidade X Modelo Realidade: Mundo real – nem sempre compreendida ou entendida.
Introduction to Information Retrieval Introduction to Information Retrieval CS276 Information Retrieval and Web Search Christopher Manning and Prabhakar.
Matemática Discreta I BCC101
1 24/4/ :29 FMU – 1. Semestre – Tecnologia – Analise e Desenvolvimento de Sistemas Professor: Eduardo Silvestri Aluno:Clóvis de Oliveira- RA
CIn-UFPE1 Recuperação de Informação Modelos de Recuperação de Documentos Flávia Barros.
CIn-UFPE1 Recuperação de Informação Modelos de Recuperação de Documentos Flávia Barros.
CBD-0279 Introdução ao Uso dos Metadados no Ambiente das Unidades de Informação Prof. Dr. Ivan Siqueira USP – ECA – CBD 2015.
PARADIGMAS DE LINGUAGENS EXPRESSÕES E INSTRUÇÕES DE ATRIBUIÇÃO
Universidade Federal da Paraíba Departamento de Informática Introdução à Engenharia de Computação Álgebra de Boole.
Colégio da Imaculada Colégio da Imaculada Curso Técnico em Informática
Medidas de Avaliação. Para a maioria dos sistemas computacionais é necessário criar medidas para aferir sua eficácia e eficiência; A medida mais comum.
Codificadores e Decodificadores Prof. Lucas Santos Pereira
Transcrição da apresentação:

Eveline Alonso Veloso PUC-MINAS Modelo Booleano Eveline Alonso Veloso PUC-MINAS

Referências BAEZA-YATES, Ricardo e RIBEIRO-NETO, Berthier. Modern Information Retrieval. 1ª edição, New York: ACM Press, 1999, capítulo 2.

Introdução Baseado em: teoria de conjuntos e álgebra booleana. Ainda é o modelo dominante nos sistemas comerciais de bancos de documentos.

Representação dos Documentos Documentos são representados por conjuntos. Seus termos de indexação; são os elementos desses conjuntos. d2 d1 t1 t4 t2 t3 t5

Termos de Indexação Considera que os termos de indexação estão presentes ou ausentes em um documento. Como conseqüência, os pesos dos termos de indexação assumem valores binários. wti,dj = peso do termo ti para o documento dj. wti,dj = 1; caso o termo ti apareça no documento dj. wti,dj = 0; caso o termo ti não aparece no documento dj.

Representação das Consultas As consultas são especificadas como expressões booleanas que possuem semântica precisa. São compostas de: termos de indexação; conectores booleanos: AND, OR, NOT. Exemplo: recuperação AND informação

Conectores Booleanos AND (e) e OR (ou); NOT (não); são conectores binários; possuem a mesma precedência. NOT (não); conector unário; possui precedência sobre os demais operadores booleanos.

Vantagens Como o conceito de conjunto é bastante intuitivo; o modelo booleano é facilmente compreendido por um usuário comum de um sistema de recuperação de informação. Fácil de ser implementado.

Desvantagens Sua estratégia de recuperação baseia-se em um critério de decisão binária; ou o documento é considerado relevante para a consulta do usuário ou não; não há nenhuma noção de uma escala gradativa de relevância; nem de casamento parcial. Conseqüências: freqüentemente o modelo booleano retorna poucos ou muitos documentos em resposta à consulta do usuário; nenhuma ordenação dos documentos recuperados é provida. Por isso, na realidade o modelo booleano é muito mais um modelo de recuperação de dados do que de informação.

Desvantagens Apesar de consultas booleanas apresentarem semântica precisa; não é simples para os usuários em geral traduzirem sua necessidade de informação em uma expressão booleana. Por isso, as consultas formuladas pelos usuários são muito freqüentemente simplistas.

Função de Ranking Consulta especificada com o conector booleano AND: interseção; R(qi, dj) = 1, caso dj apresente todos os termos de indexação especificados na consulta qi; 0, caso dj não apresente pelo menos um dos termos de indexação especificados na consulta qi.

Função de Ranking Consulta especificada com o conector booleano OR: união; R(qi, dj) = 1, caso dj apresente pelo menos um dos termos de indexação especificados na consulta qi; 0, caso dj não apresente nenhum dos termos de indexação especificados na consulta qi.

Função de Ranking Consulta especificada com o conector booleano NOT: complemento; R(qi, dj) = 1, caso dj não apresente o termo de indexação especificado na consulta qi; 0, caso dj apresente o termo de indexação especificado na consulta qi.

Exercício – Coleção Considere uma coleção composta pelos seguintes documentos: d1: Sistemas. Sistemas, sistemas. d2: gestão da informação d3: sistemas de informação. d4: Gestão da informação. Recuperação de INFORMAÇÃO.

Exercício – Consultas Construa o arquivo invertido correspondente a essa coleção e responda as seguintes consultas utilizando o modelo booleano: q1: sistemas AND informação q2: sistemas OR informação q3: recuperação AND gestão q4: gestão OR informação q5: gestão AND (NOT informação) q6: sistemas AND (NOT informação)