Especificação de Consultas

Slides:



Advertisements
Apresentações semelhantes
Medidas de Avaliação de Sistemas de Recuperação de Informação
Advertisements

Modelo de Redes de Crenças
Modelo Probabilístico
Operações sobre o Texto
Operações sobre as Consultas
Álgebra Relacional Marcelo Mendes Manaus
Banco de Dados Prof. Antonio.
UNICEUMA – CENTRO UNIVERSITÁRIO DO MARANHÃO
Indexação Automática de Documentos
Propriedades de Documentos
Recuperação de Imagens
Especificação de Processos
Dicionário de Dados Eveline Alonso Veloso PUC-Minas.
Modelos de Recuperação de Informação
Eveline Alonso Veloso PUC-MINAS
Eveline Alonso Veloso PUC-MINAS
Conceitos Gerais relacionados a Recuperação de Informação
Algoritmos de Pesquisa em Cadeias de Caracteres
Conteúdo: - Operadores.
Teste em Esquemas de Dados Maria Cláudia Figueiredo Pereira Emer Universidade Federal do Paraná Departamento de Informática Seminário.
Operadores Especiais da SQL
UNIVERSIDADE FEDERAL DE SANTA CATARINA - UFSC PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA E GESTÃO DO CONHECIMENTO EGC – GESTÃO DO CONHECIMENTO E FERRAMENTAS.
INTERPRETAÇÃO DE TEXTOS
Introdução ao -calculus
Denise Perdigão BASE DE DADOS Denise Perdigão
RESUMO Laboratório de Produção de Texto
XML DTDs e Schemas Sharp Shooters.NET Universidade Federal de Pernambuco Centro de Informática Recife, 21/10/2002 Autor: Marden Menezes Costa.
Prof. Natalia Castro Fernandes Mestrado em Telecomunicações – UFF 2º semestre/2012.
Raciocínio Baseado em Casos Álvaro Vinícius de Souza Coêlho
TUTORIAL. Acervo digital de obras de referência (dicionários e enciclopédias) com acesso ao texto completo e busca textual. Contempla diversas áreas do.
Fontes eletrônicas para a Pesquisa bibliográfica construção de conhecimentos.
Inteligência Artificial
EBSCO workshop Portal Capes – www. periodicos. capes. gov. br www
Escolha a Base: ° Brasileira ° Saúde Pública ° Chilena ° Cubana.
Introduction to Information Retrieval Introduction to Information Retrieval CS276 Information Retrieval and Web Search Christopher Manning and Prabhakar.
Gramáticas Livres de Contexto
TUTORIAL. Acervo de 47 jornais especialmente selecionados pela British Library para melhor representar o século XIX. Inclui jornais nacionais e regionais.
INSTRUÇÕES DE PESQUISA NO CATÁLOGO ON-LINE BIBLIOTECA DA ESCOLA DE FILOSOFIA, LETRAS E CIÊNCIAS HUMANAS.
Mineração da Web Recuperação de Informação
Mineração da Web Recuperação de Informação
Análise Léxica Primeira fase de um compilador
Mineração na Web Introdução a Recuperação de Informação
Recuperação de Informação Clássica
Recuperação de Informação
i-Jus Busca em Diário Oficial
Redes Bayesianas - Aplicação em Recuperação de Informação Rudini Sampaio DCC / UFLA.
Recuperação de Informação
EBSCOhost Pesquisa avançada.
Introdução a Banco de Dados Aula 04
Aplicações dos Modelos de Recuperação da Informação na Extração de Conteúdos na Web Metodologia de Ciência da Computação Professora: Odette Mestrinho Passos.
Métodos Formais.
Distância Mínima de Edição Profa. Sandra de Amo Bacharelado em Ciência da Computação - UFU.
Linguagem C.
Semântica de Linguagens de Programação
1 24/4/ :29 FMU – 1. Semestre – Tecnologia – Analise e Desenvolvimento de Sistemas Professor: Eduardo Silvestri Aluno:Clóvis de Oliveira- RA
Estruturas de Dados e Algoritmos para Inferência de Motifs Katia Guimarães.
CIn-UFPE1 Recuperação de Informação Modelos de Recuperação de Documentos Flávia Barros.
Emerald Group Publishing Limited Descubra como aproveitar os benefícios da editora líder mundial de Pesquisa em Gestão.
Tecnologias de Informação e Comunicação AGRUPAMENTO DE ESCOLAS DE P ERAFITA.
CBD-0279 Introdução ao Uso dos Metadados no Ambiente das Unidades de Informação Prof. Dr. Ivan Siqueira USP – ECA – CBD 2015.
SISTEMAS DE INFORMAÇÃO
Modelo Entidade-Relacionamento
TUTORIAL. SABIN AMERICANA Esta base é formulada conforme a bibliografia de Joseph Sabin, bibliófilo americano que viveu entre 1821 e Com.
PARADIGMAS DE LINGUAGENS EXPRESSÕES E INSTRUÇÕES DE ATRIBUIÇÃO
Colégio da Imaculada Colégio da Imaculada Curso Técnico em Informática
COMPILADORES 03 Prof. Marcos.
Tutorial para pesquisas na base de dados JSTOR. JSTOR é uma base de dados internacional, multidisciplinar, que contém textos completos de material bibliográfico.
Indexação e Resumos: teoria e prática
Expressões Regulares Junho, Expressões Regulares Uma Expressão Regular (ER), aka REGEX, é um método formal de se especificar um padrão de texto.
QUATRO REGRAS PARA PESQUISAR NA INTERNET Regra 1 - Dê ao pesquisador (ou motor de pesquisa) muitas palavras relacionadas com o assunto em pesquisa. Regra.
Transcrição da apresentação:

Especificação de Consultas Eveline Alonso Veloso PUC-MINAS

Referências BAEZA-YATES, Ricardo e RIBEIRO-NETO, Berthier. Modern Information Retrieval. 1ª edição, New York: ACM Press, 1999, capítulo 4.

Introdução Consulta: Dependendo da experiência do usuário; formulação da necessidade de informação do usuário de um sistema de recuperação de informação. Dependendo da experiência do usuário; e da clareza de sua necessidade de informação; uma determinada forma de especificar sua consulta é selecionada.

Formas de Especificar uma Consulta Principais formas de especificar consultas que geralmente aparecem em sistemas de recuperação de informação textual: consultas baseadas em palavras-chave: consultas com uma única palavra-chave; consultas em um contexto: frase exata; proximidade; consultas booleanas; casamento de padrão; consultas estruturadas.

Consultas baseadas em Palavras-chave Para os modelos de recuperação de informação clássicos; é o principal tipo de consulta. Uma consulta é formada por palavras-chave e algumas restrições opcionais; os documentos que possuem as palavras-chave especificadas e atendem as restrições estabelecidas são recuperados.

Consultas baseadas em Palavras-chave Populares; intuitivas; fáceis de especificar; em geral, processadas rapidamente.

Consultas com uma Única Palavra-chave Consulta mais elementar. Consulta é formada por uma palavra-chave; e os documentos que possuem a palavra-chave especificada são recuperados.

Consultas com uma Única Palavra-chave

Consultas em um Contexto Palavras-chave especificadas; são pesquisadas em um dado contexto; ou seja, próximas umas às outras. Dois tipos de consultas em um contexto: frase exata; proximidade.

Frase Exata Sequência de palavras-chave. Procura-se pela ocorrência da frase nos documentos indexados.

Frase Exata

Proximidade Versão mais “relaxada” da busca por frase exata. Sequência de palavras-chave; em geral, juntamente com a distância máxima permitida entre elas. As palavras podem aparecer nos documentos recuperados; em uma ordem diferente daquela em que foram especificadas na consulta.

Proximidade

Consultas Booleanas Forma mais antiga de especificar consultas; combinando palavras-chave. Consultas são especificadas como expressões booleanas; que possuem semântica precisa. São compostas de: palavras-chave; operadores booleanos: AND, OR, NOT. Exemplo: recuperação AND informação

Operadores Booleanos AND (e) e OR (ou); NOT (não); são conectores binários; possuem a mesma precedência. NOT (não); conector unário; possui precedência sobre os demais operadores booleanos.

Casamento de Padrão Um padrão é um conjunto de características sintáticas que devem ocorrer em um segmento de texto. Dizemos que os segmentos de texto que satisfazem às especificações do padrão; casam com o padrão indicado.

Casamento de Padrão Consultas mais complexas; auxiliam a busca por palavras-chave; complementando-a com recursos mais poderosos de recuperação de dados. Quanto mais poderoso for o conjunto de padrões, mais complexa é a implementação do sistema de recuperação de informação.

Tipos de Padrões Prefixo; Sufixo; Substring; Permitindo erros; Expressão regular.

Prefixo Padrão que deve ocorrer no início de uma palavra. Exemplo: info; casa com: informação; informática; etc.

Sufixo Padrão que deve ocorrer no final de uma palavra. Exemplo: info; casa com: paraninfo; etc.

Substring Padrão que deve ocorrer em qualquer lugar de uma palavra. Exemplo: Padrão: info; casa com: desinformado; paraninfo; informática; etc.

Permitindo Erros Padrão que corresponde a uma palavra; juntamente com um patamar de erros. Recupera palavras cujas escritas são similares à da palavra indicada. Similaridade: distância entre duas palavras; medida através do número mínimo de: inserções; remoções; e substituições.

Permitindo Erros Exemplo: Padrão: casa com: informação, permitindo 5 erros; casa com: informacao; desinformado; informática; etc.

Expressão Regular Corresponde a um padrão com operadores. Exemplos de operadores: * pode ser substituído por 0 ou mais caracteres; ? pode ser substituído por um caracter.

Expressão Regular

Consultas Estruturadas Exploram a estrutura dos documentos. Permitem combinar o conteúdo do documento; com sua estrutura. Permitem a especificação de consultas mais poderosas.