A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Modelo Booleano Eveline Alonso Veloso PUC-MINAS. Referências BAEZA-YATES, Ricardo e RIBEIRO-NETO, Berthier. Modern Information Retrieval. 1ª edição, New.

Apresentações semelhantes


Apresentação em tema: "Modelo Booleano Eveline Alonso Veloso PUC-MINAS. Referências BAEZA-YATES, Ricardo e RIBEIRO-NETO, Berthier. Modern Information Retrieval. 1ª edição, New."— Transcrição da apresentação:

1 Modelo Booleano Eveline Alonso Veloso PUC-MINAS

2 Referências BAEZA-YATES, Ricardo e RIBEIRO-NETO, Berthier. Modern Information Retrieval. 1ª edição, New York: ACM Press, 1999, capítulo 2.

3 Introdução Baseado em: teoria de conjuntos e álgebra booleana. Ainda é o modelo dominante nos sistemas comerciais de bancos de documentos.

4 Representação dos Documentos Documentos são representados por conjuntos. Seus termos de indexação; são os elementos desses conjuntos. d1d1 t1t1 t2t2 t3t3 d2d2 t4t4 t5t5

5 Termos de Indexação Considera que os termos de indexação estão presentes ou ausentes em um documento. Como conseqüência, os pesos dos termos de indexação assumem valores binários. w ti,dj = peso do termo t i para o documento d j. w ti,dj = 1; caso o termo t i apareça no documento d j. w ti,dj = 0; caso o termo t i não aparece no documento d j.

6 Representação das Consultas As consultas são especificadas como expressões booleanas que possuem semântica precisa. São compostas de: termos de indexação; conectores booleanos: AND, OR, NOT. Exemplo: recuperação AND informação

7 Conectores Booleanos AND (e) e OR (ou); são conectores binários; possuem a mesma precedência. NOT (não); conector unário; possui precedência sobre os demais operadores booleanos.

8 Vantagens Como o conceito de conjunto é bastante intuitivo; o modelo booleano é facilmente compreendido por um usuário comum de um sistema de recuperação de informação. Fácil de ser implementado.

9 Desvantagens Sua estratégia de recuperação baseia-se em um critério de decisão binária; ou o documento é considerado relevante para a consulta do usuário ou não; não há nenhuma noção de uma escala gradativa de relevância; nem de casamento parcial. Conseqüências: freqüentemente o modelo booleano retorna poucos ou muitos documentos em resposta à consulta do usuário; nenhuma ordenação dos documentos recuperados é provida. Por isso, na realidade o modelo booleano é muito mais um modelo de recuperação de dados do que de informação.

10 Desvantagens Apesar de consultas booleanas apresentarem semântica precisa; não é simples para os usuários em geral traduzirem sua necessidade de informação em uma expressão booleana. Por isso, as consultas formuladas pelos usuários são muito freqüentemente simplistas.

11

12 Função de Ranking Consulta especificada com o conector booleano AND: interseção; R(q i, d j ) = 1, caso d j apresente todos os termos de indexação especificados na consulta q i ; 0, caso d j não apresente pelo menos um dos termos de indexação especificados na consulta q i.

13 Função de Ranking Consulta especificada com o conector booleano OR: união; R(q i, d j ) = 1, caso d j apresente pelo menos um dos termos de indexação especificados na consulta q i ; 0, caso d j não apresente nenhum dos termos de indexação especificados na consulta q i.

14 Função de Ranking Consulta especificada com o conector booleano NOT: complemento; R(q i, d j ) = 1, caso d j não apresente o termo de indexação especificado na consulta q i ; 0, caso d j apresente o termo de indexação especificado na consulta q i.

15 Exercício – Coleção Considere uma coleção composta pelos seguintes documentos: d 1 : Sistemas. Sistemas, sistemas. d 2 : gestão da informação d 3 : sistemas de informação. d 4 : Gestão da informação. Recuperação de INFORMAÇÃO.

16 Exercício – Consultas Construa o arquivo invertido correspondente a essa coleção e responda as seguintes consultas utilizando o modelo booleano: q 1 : sistemas AND informação q 2 : sistemas OR informação q 3 : recuperação AND gestão q 4 : gestão OR informação q 5 : gestão AND (NOT informação) q 6 : sistemas AND (NOT informação)


Carregar ppt "Modelo Booleano Eveline Alonso Veloso PUC-MINAS. Referências BAEZA-YATES, Ricardo e RIBEIRO-NETO, Berthier. Modern Information Retrieval. 1ª edição, New."

Apresentações semelhantes


Anúncios Google