A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Operações sobre as Consultas Eveline Alonso Veloso PUC-MINAS.

Apresentações semelhantes


Apresentação em tema: "Operações sobre as Consultas Eveline Alonso Veloso PUC-MINAS."— Transcrição da apresentação:

1 Operações sobre as Consultas Eveline Alonso Veloso PUC-MINAS

2 Referências BAEZA-YATES, Ricardo e RIBEIRO-NETO, Berthier. Modern Information Retrieval. 1ª edição, New York: ACM Press, 1999, capítulo 5.

3 Motivação Usuários comuns de sistemas de recuperação de informação não possuem conhecimento detalhado; sobre a coleção de documentos que serão recuperados; nem sobre a estratégia de busca utilizada pelo sistema. Conseqüência: a maioria dos usuários encontra dificuldades para formular consultas adequadas; para fins de recuperação de informação.

4 Motivação Em máquinas de busca disponíveis atualmente na Web; em geral, usuários gastam muito tempo reformulando suas consultas diversas vezes; até conseguirem recuperar eficazmente documentos relevantes para sua necessidade de informação.

5 Motivação Esta dificuldade sugere que: a primeira consulta formulada pelo usuário deve ser tratada como uma tentativa inicial; que precisa ser aprimorada.

6 Abordagens para Expansão da Consulta Abordagens mais comumente utilizadas para expandir a consulta original do usuário: realimentação de relevantes; expansão global; expansão local.

7 Realimentação de Relevantes Estratégia mais popular de reformulação de consultas.

8 Realimentação de Relevantes – Procedimento A partir da consulta original; formulada pelo usuário do sistema de recuperação de informação; um conjunto de documentos é recuperado. O usuário então inspeciona este conjunto de documentos recuperados; a procura de documentos relevantes. Na prática, apenas os primeiros documentos melhor ranqueados precisam ser inspecionados pelo usuário.

9 Realimentação de Relevantes – Procedimento Após esta inspeção, o usuário marca os documentos que ele considerou relevantes. O sistema então seleciona bons descritores para os documentos marcados pelo usuário. Em geral, são selecionados como descritores do documento; os termos que possuem alto tf x idf para o documento.

10 Realimentação de Relevantes – Procedimento O sistema reformula a consulta original do usuário; com base nos termos identificados como bons descritores dos documentos selecionados pelo usuário; e processa esta nova consulta. A expectativa é que a resposta desta nova consulta; seja melhor do que a resposta obtida para a consulta original.

11 Realimentação de Relevantes – Idéia Fundamental Os documentos conhecidamente relevantes; ou seja, aqueles que foram indicados pelo usuário como relevantes; possuem termos que podem ser utilizados para descrever um conjunto maior de documentos relevantes.

12 Realimentação de Relevantes – Vantagens O usuário não precisa explicitamente reformular sua consulta. Ele só precisa indicar os documentos que ele considerou relevantes. É uma estratégia interativa de expansão de consulta.

13 Realimentação de Relevantes – Exemplo

14

15 Estratégias de Expansão Global e Local Expandem a consulta original formulada pelo usuário; tentando obter uma melhor descrição do conjunto de documentos relevantes; sem a intervenção do usuário.

16 Estratégias de Expansão Global e Local Para esta expansão pode-se utilizar: um tesauros construído manualmente; estruturas semelhantes a tesauros; construídas automaticamente.

17 Tesauros São ferramentas de vocabulário específicas para um domínio do conhecimento; construídas por especialistas para representar conceitos de tal domínio; e especificar seus relacionamentos. Os termos do vocabulário da coleção são tratados como conceitos; e o tesauros é visto como uma estrutura de relação conceitual.

18 Tesauros – Relacionamentos Os relacionamentos entre conceitos mais comumente representados em um tesauros são: equivalência; hierarquia; associatividade.

19 Tesauros – Exemplo laranja TG1 fruta TE1 laranja bahia TE1 laranja pêra TR laranjeira

20 Estruturas Semelhantes a Tesauros Todos os documentos da coleção, e os termos de seu vocabulário, podem ser utilizados para construir uma estrutura semelhante a um tesauros; que define as relações entre os termos do vocabulário da coleção. Podem ser considerados termos relacionados: sinônimos; variações sintáticas; etc.

21 Expansão Global Expansão baseada em informação global; derivada de toda a coleção de documentos.

22 Expansão Global – Procedimento Verifica-se; com a utilização de um tesauros ou de uma estrutura semelhante; todos os termos semelhantes àqueles empregados na consulta original formulada pelo usuário. A consulta original é expandida; utilizando-se todos os termos semelhantes aos termos presentes nesta consulta original. A consulta expandida é processada; e seu resultado é apresentado ao usuário.

23 Expansão Local Expansão baseada em informações derivadas; do conjunto de documentos inicialmente recuperados.

24 Expansão Local – Procedimento Inicialmente, processa-se a consulta originalmente formulada pelo usuário. Os documentos recuperados para esta consulta são examinados automaticamente; durante o processamento da consulta; para a determinação dos termos que serão utilizados para a expansão da consulta original. Assim, esta estratégia opera apenas sobre os documentos recuperados para a consulta original do usuário.

25 Expansão Local – Procedimento Verifica-se; com a utilização de um tesauros ou de uma estrutura semelhante; todos os termos semelhantes àqueles empregados na consulta original formulada pelo usuário; que estão presentes em algum documento originalmente recuperado. A consulta original é expandida; com a utilização destes termos. Pode-se considerar somente os primeiros documentos recuperados para a consulta original.

26 Expansão Local – Desvantagem É necessário acessar o texto dos documentos recuperados para a consulta original do usuário; o que pode afetar muito o tempo de resposta do sistema de recuperação de informação.

27 Exercício 1 – Coleção Considere a seguinte coleção de documentos: d 1 : Domicílio eleitoral. Zona eleitoral. d 2 : Título de eleitor. Eleitor. Domicílio eleitoral. d 3 : Voto. Título de eleitor. d 4 : Eleição. Voto. d 5 : Eleição. Direito de votar.

28 Exercício 1 – Tesauros TermoTR EleitorDireito de votarDomicílio eleitoral Título de eleitorEleição Direito de votarEleitor Domicílio eleitoralEleitorZona eleitoral Título de eleitorEleitorVoto EleiçãoEleitorVoto EleiçãoTítulo de eleitor Zona eleitoralDomicílio eleitoral Considere também o seguinte trecho extraído do Tesauros Jurídico do Conselho de Justiça Federal:

29 Exercício 1 – Consulta Mostre como um sistema de recuperação de informação que utiliza o modelo Booleano processa a consulta q 1 = eleitor: utilizando a estratégia de expansão global da consulta; utilizando a estratégia de expansão local da consulta.

30 Exercício 2 – Consulta Mostre agora como este mesmo sistema de recuperação de informação processa a consulta q 2 = eleição: utilizando a estratégia de expansão global da consulta; utilizando a estratégia de expansão local da consulta.

31 Exercício 3 – Coleção Considere a seguinte coleção de documentos: d 1 : Crime contra o meio ambiente. Poluição. Dano ecológico. d 2 : Floresta. Instituto Brasileiro de Defesa Florestal. d 3 : Meio ambiente. d 4 : Desmatamento: dano ecológico. d 5 : Poluição.

32 Exercício 3 – Tesauros Considere também o seguinte trecho extraído do Tesauros Jurídico do Conselho de Justiça Federal:

33 Exercício 3 – Consulta Mostre como um sistema de recuperação de informação que utiliza o modelo Booleano processa a consulta q 3 = desmatamento: utilizando a estratégia de expansão global da consulta; utilizando a estratégia de expansão local da consulta.

34 Exercício 4 – Consulta Mostre agora como este mesmo sistema de recuperação de informação processa a consulta q 4 = poluição: utilizando a estratégia de expansão global da consulta; utilizando a estratégia de expansão local da consulta.


Carregar ppt "Operações sobre as Consultas Eveline Alonso Veloso PUC-MINAS."

Apresentações semelhantes


Anúncios Google