A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Eveline Alonso Veloso PUC-MINAS

Apresentações semelhantes


Apresentação em tema: "Eveline Alonso Veloso PUC-MINAS"— Transcrição da apresentação:

1 Eveline Alonso Veloso PUC-MINAS
Modelo Booleano Eveline Alonso Veloso PUC-MINAS

2 Referências BAEZA-YATES, Ricardo e RIBEIRO-NETO, Berthier. Modern Information Retrieval. 1ª edição, New York: ACM Press, 1999, capítulo 2.

3 Introdução Baseado em:
teoria de conjuntos e álgebra booleana. Ainda é o modelo dominante nos sistemas comerciais de bancos de documentos.

4 Representação dos Documentos
Documentos são representados por conjuntos. Seus termos de indexação; são os elementos desses conjuntos. d2 d1 t1 t4 t2 t3 t5

5 Termos de Indexação Considera que os termos de indexação estão presentes ou ausentes em um documento. Como conseqüência, os pesos dos termos de indexação assumem valores binários. wti,dj = peso do termo ti para o documento dj. wti,dj = 1; caso o termo ti apareça no documento dj. wti,dj = 0; caso o termo ti não aparece no documento dj.

6 Representação das Consultas
As consultas são especificadas como expressões booleanas que possuem semântica precisa. São compostas de: termos de indexação; conectores booleanos: AND, OR, NOT. Exemplo: recuperação AND informação

7 Conectores Booleanos AND (e) e OR (ou); NOT (não);
são conectores binários; possuem a mesma precedência. NOT (não); conector unário; possui precedência sobre os demais operadores booleanos.

8 Vantagens Como o conceito de conjunto é bastante intuitivo;
o modelo booleano é facilmente compreendido por um usuário comum de um sistema de recuperação de informação. Fácil de ser implementado.

9 Desvantagens Sua estratégia de recuperação baseia-se em um critério de decisão binária; ou o documento é considerado relevante para a consulta do usuário ou não; não há nenhuma noção de uma escala gradativa de relevância; nem de casamento parcial. Conseqüências: freqüentemente o modelo booleano retorna poucos ou muitos documentos em resposta à consulta do usuário; nenhuma ordenação dos documentos recuperados é provida. Por isso, na realidade o modelo booleano é muito mais um modelo de recuperação de dados do que de informação.

10 Desvantagens Apesar de consultas booleanas apresentarem semântica precisa; não é simples para os usuários em geral traduzirem sua necessidade de informação em uma expressão booleana. Por isso, as consultas formuladas pelos usuários são muito freqüentemente simplistas.

11

12 Função de Ranking Consulta especificada com o conector booleano AND:
interseção; R(qi, dj) = 1, caso dj apresente todos os termos de indexação especificados na consulta qi; 0, caso dj não apresente pelo menos um dos termos de indexação especificados na consulta qi.

13 Função de Ranking Consulta especificada com o conector booleano OR:
união; R(qi, dj) = 1, caso dj apresente pelo menos um dos termos de indexação especificados na consulta qi; 0, caso dj não apresente nenhum dos termos de indexação especificados na consulta qi.

14 Função de Ranking Consulta especificada com o conector booleano NOT:
complemento; R(qi, dj) = 1, caso dj não apresente o termo de indexação especificado na consulta qi; 0, caso dj apresente o termo de indexação especificado na consulta qi.

15 Exercício – Coleção Considere uma coleção composta pelos seguintes documentos: d1: Sistemas. Sistemas, sistemas. d2: gestão da informação d3: sistemas de informação. d4: Gestão da informação. Recuperação de INFORMAÇÃO.

16 Exercício – Consultas Construa o arquivo invertido correspondente a essa coleção e responda as seguintes consultas utilizando o modelo booleano: q1: sistemas AND informação q2: sistemas OR informação q3: recuperação AND gestão q4: gestão OR informação q5: gestão AND (NOT informação) q6: sistemas AND (NOT informação)


Carregar ppt "Eveline Alonso Veloso PUC-MINAS"

Apresentações semelhantes


Anúncios Google