A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Especificação de Consultas Eveline Alonso Veloso PUC-MINAS.

Apresentações semelhantes


Apresentação em tema: "Especificação de Consultas Eveline Alonso Veloso PUC-MINAS."— Transcrição da apresentação:

1 Especificação de Consultas Eveline Alonso Veloso PUC-MINAS

2 Referências BAEZA-YATES, Ricardo e RIBEIRO-NETO, Berthier. Modern Information Retrieval. 1ª edição, New York: ACM Press, 1999, capítulo 4.

3 Introdução Consulta: formulação da necessidade de informação do usuário de um sistema de recuperação de informação. Dependendo da experiência do usuário; e da clareza de sua necessidade de informação; uma determinada forma de especificar sua consulta é selecionada.

4 Formas de Especificar uma Consulta Principais formas de especificar consultas que geralmente aparecem em sistemas de recuperação de informação textual: consultas baseadas em palavras-chave: consultas com uma única palavra-chave; consultas em um contexto: frase exata; proximidade; consultas booleanas; casamento de padrão; consultas estruturadas.

5 Consultas baseadas em Palavras-chave Para os modelos de recuperação de informação clássicos; é o principal tipo de consulta. Uma consulta é formada por palavras-chave e algumas restrições opcionais; os documentos que possuem as palavras-chave especificadas e atendem as restrições estabelecidas são recuperados.

6 Consultas baseadas em Palavras-chave Populares; intuitivas; fáceis de especificar; em geral, processadas rapidamente.

7 Consultas com uma Única Palavra-chave Consulta mais elementar. Consulta é formada por uma palavra-chave; e os documentos que possuem a palavra-chave especificada são recuperados.

8 Consultas com uma Única Palavra-chave

9 Consultas em um Contexto Palavras-chave especificadas; são pesquisadas em um dado contexto; ou seja, próximas umas às outras. Dois tipos de consultas em um contexto: frase exata; proximidade.

10 Frase Exata Sequência de palavras-chave. Procura-se pela ocorrência da frase nos documentos indexados.

11 Frase Exata

12 Proximidade Versão mais relaxada da busca por frase exata. Sequência de palavras-chave; em geral, juntamente com a distância máxima permitida entre elas. As palavras podem aparecer nos documentos recuperados; em uma ordem diferente daquela em que foram especificadas na consulta.

13

14 Proximidade

15 Consultas Booleanas Forma mais antiga de especificar consultas; combinando palavras-chave. Consultas são especificadas como expressões booleanas; que possuem semântica precisa. São compostas de: palavras-chave; operadores booleanos: AND, OR, NOT. Exemplo: recuperação AND informação

16 Operadores Booleanos AND (e) e OR (ou); são conectores binários; possuem a mesma precedência. NOT (não); conector unário; possui precedência sobre os demais operadores booleanos.

17

18 Casamento de Padrão Um padrão é um conjunto de características sintáticas que devem ocorrer em um segmento de texto. Dizemos que os segmentos de texto que satisfazem às especificações do padrão; casam com o padrão indicado.

19 Casamento de Padrão Consultas mais complexas; auxiliam a busca por palavras-chave; complementando-a com recursos mais poderosos de recuperação de dados. Quanto mais poderoso for o conjunto de padrões, mais complexa é a implementação do sistema de recuperação de informação.

20 Tipos de Padrões Prefixo; Sufixo; Substring; Permitindo erros; Expressão regular.

21 Prefixo Padrão que deve ocorrer no início de uma palavra. Exemplo: Padrão: info; casa com: informação; informática; etc.

22 Sufixo Padrão que deve ocorrer no final de uma palavra. Exemplo: Padrão: info; casa com: paraninfo; etc.

23 Substring Padrão que deve ocorrer em qualquer lugar de uma palavra. Exemplo: Padrão: info; casa com: desinformado; paraninfo; informática; etc.

24 Permitindo Erros Padrão que corresponde a uma palavra; juntamente com um patamar de erros. Recupera palavras cujas escritas são similares à da palavra indicada. Similaridade: distância entre duas palavras; medida através do número mínimo de: inserções; remoções; e substituições.

25 Permitindo Erros Exemplo: Padrão: informação, permitindo 5 erros; casa com: informacao; desinformado; informática; etc.

26 Expressão Regular Corresponde a um padrão com operadores. Exemplos de operadores: * pode ser substituído por 0 ou mais caracteres; ? pode ser substituído por um caracter.

27

28 Expressão Regular

29 Consultas Estruturadas Exploram a estrutura dos documentos. Permitem combinar o conteúdo do documento; com sua estrutura. Permitem a especificação de consultas mais poderosas.

30


Carregar ppt "Especificação de Consultas Eveline Alonso Veloso PUC-MINAS."

Apresentações semelhantes


Anúncios Google