Carregar apresentação
A apresentação está carregando. Por favor, espere
1
Operações sobre as Consultas
Eveline Alonso Veloso PUC-MINAS
2
Referências BAEZA-YATES, Ricardo e RIBEIRO-NETO, Berthier. Modern Information Retrieval. 1ª edição, New York: ACM Press, 1999, capítulo 5.
3
Motivação Usuários comuns de sistemas de recuperação de informação não possuem conhecimento detalhado; sobre a coleção de documentos que serão recuperados; nem sobre a estratégia de busca utilizada pelo sistema. Conseqüência: a maioria dos usuários encontra dificuldades para formular consultas adequadas; para fins de recuperação de informação.
4
Motivação Em máquinas de busca disponíveis atualmente na Web;
em geral, usuários gastam muito tempo reformulando suas consultas diversas vezes; até conseguirem recuperar eficazmente documentos relevantes para sua necessidade de informação.
5
Motivação Esta dificuldade sugere que:
a primeira consulta formulada pelo usuário deve ser tratada como uma tentativa inicial; que precisa ser aprimorada.
6
Abordagens para Expansão da Consulta
Abordagens mais comumente utilizadas para expandir a consulta original do usuário: realimentação de relevantes; expansão global; expansão local.
7
Realimentação de Relevantes
Estratégia mais popular de reformulação de consultas.
8
Realimentação de Relevantes – Procedimento
A partir da consulta original; formulada pelo usuário do sistema de recuperação de informação; um conjunto de documentos é recuperado. O usuário então inspeciona este conjunto de documentos recuperados; a procura de documentos relevantes. Na prática, apenas os primeiros documentos melhor ranqueados precisam ser inspecionados pelo usuário.
9
Realimentação de Relevantes – Procedimento
Após esta inspeção, o usuário marca os documentos que ele considerou relevantes. O sistema então seleciona bons descritores para os documentos marcados pelo usuário. Em geral, são selecionados como descritores do documento; os termos que possuem alto tf x idf para o documento.
10
Realimentação de Relevantes – Procedimento
O sistema reformula a consulta original do usuário; com base nos termos identificados como bons descritores dos documentos selecionados pelo usuário; e processa esta nova consulta. A expectativa é que a resposta desta nova consulta; seja melhor do que a resposta obtida para a consulta original.
11
Realimentação de Relevantes – Idéia Fundamental
Os documentos conhecidamente relevantes; ou seja, aqueles que foram indicados pelo usuário como relevantes; possuem termos que podem ser utilizados para descrever um conjunto maior de documentos relevantes.
12
Realimentação de Relevantes – Vantagens
O usuário não precisa explicitamente reformular sua consulta. Ele só precisa indicar os documentos que ele considerou relevantes. É uma estratégia interativa de expansão de consulta.
13
Realimentação de Relevantes – Exemplo
15
Estratégias de Expansão Global e Local
Expandem a consulta original formulada pelo usuário; tentando obter uma melhor descrição do conjunto de documentos relevantes; sem a intervenção do usuário.
16
Estratégias de Expansão Global e Local
Para esta expansão pode-se utilizar: um tesauros construído manualmente; estruturas semelhantes a tesauros; construídas automaticamente.
17
Tesauros São ferramentas de vocabulário específicas para um domínio do conhecimento; construídas por especialistas para representar conceitos de tal domínio; e especificar seus relacionamentos. Os termos do vocabulário da coleção são tratados como conceitos; e o tesauros é visto como uma estrutura de relação conceitual.
18
Tesauros – Relacionamentos
Os relacionamentos entre conceitos mais comumente representados em um tesauros são: equivalência; hierarquia; associatividade.
19
Tesauros – Exemplo laranja TG1 fruta TE1 laranja bahia
TE1 laranja pêra TR laranjeira
20
Estruturas Semelhantes a Tesauros
Todos os documentos da coleção, e os termos de seu vocabulário, podem ser utilizados para construir uma estrutura semelhante a um tesauros; que define as relações entre os termos do vocabulário da coleção. Podem ser considerados termos relacionados: sinônimos; variações sintáticas; etc.
21
Expansão Global Expansão baseada em informação global;
derivada de toda a coleção de documentos.
22
Expansão Global – Procedimento
Verifica-se; com a utilização de um tesauros ou de uma estrutura semelhante; todos os termos semelhantes àqueles empregados na consulta original formulada pelo usuário. A consulta original é expandida; utilizando-se todos os termos semelhantes aos termos presentes nesta consulta original. A consulta expandida é processada; e seu resultado é apresentado ao usuário.
23
Expansão Local Expansão baseada em informações derivadas;
do conjunto de documentos inicialmente recuperados.
24
Expansão Local – Procedimento
Inicialmente, processa-se a consulta originalmente formulada pelo usuário. Os documentos recuperados para esta consulta são examinados automaticamente; durante o processamento da consulta; para a determinação dos termos que serão utilizados para a expansão da consulta original. Assim, esta estratégia opera apenas sobre os documentos recuperados para a consulta original do usuário.
25
Expansão Local – Procedimento
Verifica-se; com a utilização de um tesauros ou de uma estrutura semelhante; todos os termos semelhantes àqueles empregados na consulta original formulada pelo usuário; que estão presentes em algum documento originalmente recuperado. A consulta original é expandida; com a utilização destes termos. Pode-se considerar somente os primeiros documentos recuperados para a consulta original.
26
Expansão Local – Desvantagem
É necessário acessar o texto dos documentos recuperados para a consulta original do usuário; o que pode afetar muito o tempo de resposta do sistema de recuperação de informação.
27
Exercício 1 – Coleção Considere a seguinte coleção de documentos:
d1: Domicílio eleitoral. Zona eleitoral. d2: Título de eleitor. Eleitor. Domicílio eleitoral. d3: Voto. Título de eleitor. d4: Eleição. Voto. d5: Eleição. Direito de votar.
28
Exercício 1 – Tesauros Considere também o seguinte trecho extraído do Tesauros Jurídico do Conselho de Justiça Federal: Termo TR Eleitor Direito de votar Domicílio eleitoral Título de eleitor Eleição Zona eleitoral Voto
29
Exercício 1 – Consulta Mostre como um sistema de recuperação de informação que utiliza o modelo Booleano processa a consulta q1 = eleitor: utilizando a estratégia de expansão global da consulta; utilizando a estratégia de expansão local da consulta.
30
Exercício 2 – Consulta Mostre agora como este mesmo sistema de recuperação de informação processa a consulta q2 = eleição: utilizando a estratégia de expansão global da consulta; utilizando a estratégia de expansão local da consulta.
31
Exercício 3 – Coleção Considere a seguinte coleção de documentos:
d1: Crime contra o meio ambiente. Poluição. Dano ecológico. d2: Floresta. Instituto Brasileiro de Defesa Florestal. d3: Meio ambiente. d4: Desmatamento: dano ecológico. d5: Poluição.
32
Exercício 3 – Tesauros Considere também o seguinte trecho extraído do Tesauros Jurídico do Conselho de Justiça Federal:
33
Exercício 3 – Consulta Mostre como um sistema de recuperação de informação que utiliza o modelo Booleano processa a consulta q3 = desmatamento: utilizando a estratégia de expansão global da consulta; utilizando a estratégia de expansão local da consulta.
34
Exercício 4 – Consulta Mostre agora como este mesmo sistema de recuperação de informação processa a consulta q4 = poluição: utilizando a estratégia de expansão global da consulta; utilizando a estratégia de expansão local da consulta.
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.