Medidas de Avaliação. Para a maioria dos sistemas computacionais é necessário criar medidas para aferir sua eficácia e eficiência; A medida mais comum.

Slides:



Advertisements
Apresentações semelhantes
Medidas de Avaliação de Sistemas de Recuperação de Informação
Advertisements

Modelo de Redes de Crenças
Modelo Probabilístico
Operações sobre o Texto
Indexação Automática de Documentos
Débora da Silva Orientadora: Maria Inés Castiñeira
Especificação de Consultas
Modelos de Recuperação de Informação
Eveline Alonso Veloso PUC-MINAS
Eveline Alonso Veloso PUC-MINAS
Conceitos Gerais relacionados a Recuperação de Informação
Metodologia da Pesquisa
Confiança.
Pré-Discussão do Artigo “Is Computer Science Science?”
Sistemas Operacionais
NOÇÕES PRELIMINARES.
Introdução a Teoria da Classificação
Sistemas Operacionais Planejamento de Experimento
Divisão de Biblioteca e Documentação FMUSP
Base SCOPUS 2011 Divisão de Biblioteca e Documentação FMUSP.
Bruno Augusto Vivas e Pôssas
Anderson Berg Orientador: Prof. Fernando Buarque
Administração Geral - Aula 05
Inteligência Artificial
Contabilidade A profissão contábil vem se transformando ao longo do tempo e estas transformações têm acompanhado basicamente as mudanças da economia global,
Metodologia de Pesquisa
Sistemas Operacionais
Análise de Evolução de software para recuperação da rastreabilidade entre documentação e código fonte baseada em modelos de características Aluno:
Introduction to Information Retrieval Introduction to Information Retrieval CS276 Information Retrieval and Web Search Christopher Manning and Prabhakar.
Sistema Recomendador para Comércio Eletrônico
RepositóriUM. O objetivo do RepositóriUM é armazenar, preservar, divulgar e dar acesso à produção intelectual da Universidade do Minho (Portugal) em formato.
Aula 03 – BCC202 Análise de Algoritmos (Parte 1) Túlio Toffolo www
Mineração da Web Recuperação de Informação
Redes Bayesianas - Aplicação em Recuperação de Informação Rudini Sampaio DCC / UFLA.
UNIVERSIDADE ESTADUAL DO MARANHÃO CURSO DE PÓS GRADUAÇÃO EM FUNDAMENTOS DA MATEMÁTICA TÉCNICAS EM COMUNICAÇÃO CIENTÍFICA São Luís 2008.
OBJETIVOS E JUSTIFICATIVA
Introdução ao Estudo da História
Linguagens Documentárias
Sistemas operacionais
Sistemas Operacionais
ANÁLISE ESTRUTURADA DE SISTEMAS
Processos.
Profa. Lillian Alvares Faculdade de Ciência da Informação Universidade de Brasília Recuperação 1.
Introdução A pesquisa é um procedimento reflexivo e crítico de busca de respostas para problemas ainda não solucionados.
Engenharia de Software
UNIVERSIDADE CATÓLICA DE GOIÁS ENGENHARIA DE PRODUÇÃO
Requisitos de Software
Agora... Sobre a aula de hoje!!!
TEMA E PROBLEMA.
Uma Interface em Linguagem Natural em Português para Pergunta-Resposta na Web Grupo de Inteligência Computacional Mestrado em Ciência da Computação Aluno:
Proposta de Trabalho Final Disciplina: Projeto de BD Manuela Klanovicz Ferreira Melissa Rafaelli.
BÁSICO PARA ELABORAÇÃO DE ARTIGOS CIENTÍFICOS
Projetos de Máquinas Ferramentas Desenvolvimentos de Projetos
Um Classificador Baysesiano para a Análise das Relações Sociais em Blogs Allan Lima –
Indexação e linguagens documentárias – uma pequena revisão introdutória José Antonio M. Nascimento.
Certificação e Auditoria
Recuperação de Informação
Apresentação REVISTAS Alexandre Lucas 2º. Trimestre
Conhecimento Científico
Testes de Hipóteses.
ISO/IEC Prof. Dr. Sandro Ronaldo Bezerra Oliveira
Divisão Técnica de Biblioteca e Documentação Universidade Estadual Paulista “Julio de Mesquita Filho” Campus de Botucatu Fator de Impacto Luciana Pizzani.
 Bancos de dado ou bases de dados são coleções organizadas de informações (dados) que se relacionam de forma a criar um sentido e dar mais eficiência.
O resumo Claire Guinchat e Michel Menou. Introdução  O resumo é uma operação que permite diminuir sensivelmente o volume de informação.  São textos.
Indexação e Resumos: teoria e prática
Indexação automática de documentos utilizando técnicas de mineração de textos Trabalho de conclusão de curso Fabio Montefuscolo Rafael Câmara.
1 factor de impacto de revistas científicas 23 de Abril 2008 Biblioteca da UA.
Tefko Saracevic.  Professor Emérito da Escola de Comunicação e Ciência da Informação de Rutgers da Universidade Estadual de Nova Jersey (EUA). Saracevic.
Tefko Saracevic.  Professor Emérito da Escola de Comunicação e Ciência da Informação de Rutgers da Universidade Estadual de Nova Jersey (EUA). Saracevic.
Recuperação da Informação Peter Ingwersen.  Universidade de Copenhagen (Dinamarca)  Peter Ingwersen tornou-se professor de pesquisa em 2001 e Professor.
Transcrição da apresentação:

Medidas de Avaliação

Para a maioria dos sistemas computacionais é necessário criar medidas para aferir sua eficácia e eficiência; A medida mais comum é o tempo e o espaço. Quanto menor o tempo de resposta e menor o espaço de memória (em disco ou RAM) necessário, melhor será o sistema; Em sistemas de recuperação de informação as buscas dos usuários são inerentemente vagas e os documentos recuperados não são exatos e precisam ser ordenados (“rankiados”) de acordo com sua relevância em relação à expressão de busca.

Medidas de Avaliação O que se almeja ao fazer uma busca em uma base documental é encontrar documentos que sejam úteis para satisfazer a uma necessidade de informação, evitando recuperar itens inúteis; “Relevante”, “pertinente” são termos frequentemente utilizados para se referir a itens “úteis”;

Medidas de Avaliação Após a execução de uma busca, pode-se dividir os documentos do corpus nos seguintes conjuntos: Relevantesnão-Relevantes Recuperados não recuperados

Medidas de Avaliação Documentos úteis para atender a necessidade de informação do usuário Documentos que não são úteis para o usuário Para qualquer necessidade sempre haverá mais documentos não úteis (-) do que úteis (+); O problema está em recuperar o maior número possível de itens úteis e o menor número possível de itens inúteis; O quadrado menor representa o resultado de uma busca.

Medidas de Avaliação precisão (precision) Foram recuperados 20 itens, sendo 6 úteis e 14 inúteis Precisão = 30% Expressa o quanto o sistema é capaz de recuperar apenas itens úteis.

Medidas de Avaliação revocação (recall) Expressa o quanto o sistema é capaz de recuperar todos os itens úteis. Revocação = 50% Dos 12 documentos existente no corpus, apenas 6 foram recuperados

Medidas de Avaliação revocação x precisão Para melhorar a revocação deve-se fazer uma busca mais genérica, representado pelo quadrado maior. Revocação Precisão

Medidas de Avaliação Revocação x Precisão

Medidas de Avaliação Apesar de muito utilizadas, as medidas de Precisão e Revocação apresentam alguns problemas: ◦ A revocação máxima para uma determinada busca requer um conhecimento de todos documentos do corpus. Para bases documentais muito grandes isso é impossível; ◦ Precisão e Revocação avaliam diferentes aspectos do corpus. Seria apropriado uma única medida que combinasse as duas;

Medidas de Avaliação outras medidas Média harmônica  Medida E Calcula a média harmônica entre as medidas Precisão ( P ) e Revocação ( r ) Esta medida permite ao usuário escolher se ele está mais interessado em Revocação ou em Precisão. b > 1  o usuário está mais interessado em precisão. b < 1  o usuário está mais interessado em revocação

Medidas de Avaliação medidas orientadas ao usuário As medidas Revocação e Precisão são baseadas na suposição que o conjunto de documentos relevantes para uma busca é o mesmo, independente do usuário. Porém, diferentes usuários podem ter uma interpretação diferente de qual documento é relevante ou qual não é. Para enfrentar esse problema, algumas medidas “orientadas ao usuário” foram criadas.

Medidas de Avaliação medidas orientadas ao usuário Cobertura ( coverage ) ◦ Expressa a quantidade de documentos relevantes (conhecidos) pelo usuário que foram recuperados; ◦ Um alto valor de coverage indica que o sistema está encontrando a maioria dos documentos relevantes que o usuário esperava. Novidade, descoberta ( novelty ) ◦ Expressa a quantidade de documentos relevantes recuperados que não eram conhecidos (previamente) pelo usuário; ◦ Um alto valor de novelty indica que o sistema está revelando para o usuário muitos novos documentos relevantes que eram desconhecidos para ele.

Coleções para Teste

Críticas à Information Retrieval ◦ Falta fundamentação básica  A natureza subjetiva à tarefa de decidir a relevância de um documento dificulta uma fundamentação teórica ◦ Carece de “campo de provas” e medidas consistentes  Anos de  Conferência anual chamada TREC (Text REtrieval Conference) dedicada a experimentação com uma grande coleção de teste composta de milhões de documentos;

Coleções para Teste TREC ◦ Coleção de documentos de diversas fontes  Wall Street Journal  Associated Press  US Patents  Financial Times  etc... CACM ◦ Coleção de artigos publicados no periódico Communications of the ACM, cujo primeiro número foi publicado em 1958; ◦ Primeiro periódico em Ciência da Computação; ISI ◦ Institute of Scientific Information (ISI) ◦ 1460 documentos