Patrícia Nunes Pereira Professor: Geber Ramalho

Slides:



Advertisements
Apresentações semelhantes
Agentes em Recuperação da Informação
Advertisements

Recuperação de Informação
Sobre a High Wire Uma divisão das bibliotecas da Universidade de Stanford (LA-CA) Iniciou em 1995 com a missão de ajudar editores sem fins lucrativos.
Propriedades de Documentos
Recuperação de Imagens
Conceitos Gerais relacionados a Recuperação de Informação
CINAHL Tutorial de Pesquisa Básica
Inteligência Artificial Alex F. V. Machado. Tecnologia de Processamento da Informação que envolve processos de raciocínio, aprendizado e percepção. Winston.
Arquitetura de Máquinas de Busca
Interfaces Conversacionais
GHHITS – Mining the Web Link Structure Universidade Federal de Pernambuco Centro de Informática Roberta Coelho Silvio Meira.
Ontologias para Melhorar Precisão e Cobertura de Buscas na Web
André Neves, Flávia Barros & Geber Ramalho
Eduardo Silva, Frederico Fernandes, Juliano Rabelo e Flávia Barros
Estrutura de indexação Modelos de RI
Introdução a Teoria da Classificação
Agentes na Web Márcio David de Magalhães Santos Departamento de Informática UFPE Recife, 1 de junho de 1999.
Recuperação de informação Detalhamento do projeto
Recuperação de Informação Multimídia
1 Projeto Filtragem de Mensagens Eletrônicas Disciplina: Inteligência Artificial Simbólica Professores: Geber Ramalho e Jacques Robin.
Recuperação de Informações
Apresentação: 10/08/97 ä Disciplina: Raciocínio Baseado em Casos ä Prof: Barcia, R. M., Weber, R., Martins, A. ä Apresentadora: Leslie Paas Mestranda:
UNIVERSIDADE FEDERAL DE SANTA CATARINA - UFSC PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA E GESTÃO DO CONHECIMENTO EGC – GESTÃO DO CONHECIMENTO E FERRAMENTAS.
Bruno Augusto Vivas e Pôssas
Inteligência Artificial Distribuída
Inteligência Artificial
Classificação/Clusterização
Bruno Cavalcante (bmsc) Gabriel Monteiro (gam) João Florêncio (jcpf) Lucas Marinho (lpm)
WebQuests e o futuro O papel do professor no ciberespaço.
Introduction to Information Retrieval Introduction to Information Retrieval CS276 Information Retrieval and Web Search Christopher Manning and Prabhakar.
Sistemas de Apoio à DecisãoMárcio MoreiraUnidade 5 – Decisões Não Estruturadas – Recuperação de Informações – Slide 1 5Decisões Não Estruturadas 5.1Recuperação.
Área de Pesquisa: Redes de Computadores
Introdução à Classificação de Texto
Aprendizado de Máquina - Introdução
Mineração na Web Introdução a Recuperação de Informação
Recuperação de Informação
Recuperação de Informação
Agentes Inteligentes na Web
Filtragem Colaborativa Ivan Romero Teixeira Agentes inteligentes
Professor: Márcio Amador
Seleção de Atributos Ricardo Prudêncio.
Classificacao de Texto Projeto Spam Filter
Introdução à Recuperação de informação Detalhamento do projeto
Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do.
Projeto Final MCI 2004 Filtragem de s Agente de Classificação de SPAM.
Padrões de Interação com o Usuário
Dados abertos interligados
A Lexicon-Enhanced Method for Sentiment Classification: An Experiment on Online Product Reviews Bruno Andrade.
Classificação/Categorização Christian Diego – cdad Icamaan Viegas – ibvs.
Introduction to Information Retrieval Introduction to Information Retrieval CS276 Information Retrieval and Web Search Christopher Manning and Prabhakar.
Classificação de Texto Baseada na aula de Henrique Borges e Ícaro Medeiros Alterada por Flávia Barros.
Filtragem de Informação
Classificação de Texto
Uma Interface em Linguagem Natural em Português para Pergunta-Resposta na Web Grupo de Inteligência Computacional Mestrado em Ciência da Computação Aluno:
Explaining answers from the Semantic Web: the Inference Web Approach Deborah L. McGuinness, Paulo Pinheiro da Silva ∗ Knowledge Systems Laboratory, Stanford.
Categorização de Documentos Mariana Lara Neves CIn/UFPE.
CIn/UFPE1 Categorização de Documentos e Preparação de Dados Mariana Lara Neves Flávia Barros (participação mínima) CIn/UFPE.
1 Projeto X-Finder Agents Recuperação e Indexação de páginas especializadas na Web Disciplina: Inteligência Artificial Simbólica Professora: Flávia Barros.
HAC 1 MD - junho/2008 Tecnologias de suporte à Mineração de Dados Gerenciamento de dados Data Warehouse OLAP Arquiteturas Visualização Sistemas de Suporte.
CIn/UFPE1 Categorização de Documentos (modificada) Mariana Lara Neves Flávia Barros CIn/UFPE.
Um Sistema de recomendação de consultas baseados em query log Diogo Mendonça.
Classificação de Textos
Agentes Inteligentes na Web Leandro Mitsuo Tiago Buarque Tiago Vinícius Jun/2007.
Eduardo Matos (ejvm) Leonardo Vilaça (lhvs) Igor Ebrahim (ies) Thiago Gomes (tgr)MW
Recuperação de Informação Eduardo Amaral - efas Frederico Fernandes - fbf2 Juliano Rabelo - jcbr Flávia Barros - fab.
AGENTES NA WEB Fred Freitas Karine Coelho AGENTES NA WEB Fred Freitas Karine Coelho.
Laboratório de Mídias Sociais Aula 02 Análise Textual de Mídias Sociais – parte I Prof. Dalton Martins Gestão da Informação Universidade.
Indexação automática de documentos utilizando técnicas de mineração de textos Trabalho de conclusão de curso Fabio Montefuscolo Rafael Câmara.
Transcrição da apresentação:

Patrícia Nunes Pereira Professor: Geber Ramalho Agentes na Internet Patrícia Nunes Pereira Professor: Geber Ramalho

Tópicos Motivação Introdução Categorias de Agentes Foco: Filtragem de Informação IR - Recuperação de Informação Categorização de Textos Exemplos Discussão Referências e Links

Motivação Rápido crescimento do volume de informações disponível na Internet Dificuldade em localizar documentos relevantes Alto consumo de tempo Síndrome da Nau perdida TOO MUCH INFORMATION = NO INFORMATION

Introdução Bum da Internet: Agentes inteligentes na Internet: Þ Grande volume de informação, diversificada, não estruturada, multilíngue, ... Agentes inteligentes na Internet: Þ Automatizar a busca e recuperação de informações

Categorias de Agentes Agentes de Busca Agentes que Filtram Informação Agentes de Entrega Off-line Agentes de Notificadores Agentes de Comércio na Web Chatterbots ...

Agentes de Busca Web Search Engine Usuário Busca Servidor de Consultas )--( Base de Índices Robô Browser Consulta Resposta Search Engine Usuário Indexing Engine Busca Web

Agentes de Busca Atributos: Precisão X Recall Características: Esforço consciente para encontrar informação Entrada: palavras chave Descarta links menos relevantes Não há garantia da qualidade da informação Vários exemplos (robot-based): WebCrawler, Lycos, Altavista,...

Agentes que Filtram Informação Servidor News Artigos Indexados Browser Agente de Filtragem Perfil do usuário Indexing Engine Internet

Filtragem de Informação RI + Interesses do usuário = Informação Relevante Perfil do usuário: Estático ou Dinâmico Problemas: Indexação; Linguagem Natural: resolução de fenômenos lingüísticos Sinonímia (R=Gerador de sinônimos) Polisemia (R=Indexação por significado) Objetivo: Evitar a perda de documentos relevantes e a recuperação de documentos irrelevantes!

Filtragem de Informação Tentativa de resolver parcialmente os problemas associados à recuperação de informação dos keyword-based systems. Características: Extração dos conceitos salientes do conjunto de documentos Aprendizado do perfil do usuário

Filtragem de Informação (Extração de Conceitos salientes em Documentos) Abordagem PLN: Sumarização de Documentos Formato particular é Self-Consuming Heurísticas de freqüência das palavras: TFIDF - Associa pesos às palavras TFIDF(w) = TF(w) * (LOG(|D|) - LOG(DF(W))) HT Paradigm Sumarização Hierárquica é Solução para Polisemia

Categorização de Textos Tarefa bastante custosa, se manual Aplicação do domínio de ML Categorias pré-definidas Suporte à IR Rápido crescimento de informações textuais na Web í Necessidade de processamento Abordagem ML para classificação: åUsa indução sobre amostras pré-classificadas

Categorização de Textos Visão unificada: Categ. Textos = ML + IR + Conhec. Adicional Texto inicial Categorização Indução Conhecimento Adicional Representação Inicial Redutor de Dimensão ou Seleção de Características Representação Final

Categorização de Textos Construção indutiva de categorizadores Textos é Exemplos para aprendizagem Aprendizado: Numérico (maioria)- Ex.: Redes Neurais, Classificadores Probabilísticos, Regressão Linear, ... Simbólico - ID3, Espaço de Versões, ... Características a serem consideradas: modularidade, inteligibilidade, resistência a ruídos,...

Categorização de Textos Impacto do conhecimento Três faces: IR e Aprendizagem Numérica: extraído dos dados Conhecimento do Domínio: aplicação específica Raciocínio Indutivo: fonte de conhecimento Conhecimento para: Gerar indexação Agrupar categorias Discriminar candidatas a palavras-chave

Filtragem de Informação Exemplos BORGES (A. F. SMEATON, 1996) Usuário precisa especificar palavras ou frases descrevendo suas necessidades de informação Oferece solução para Polisemia - WordNet Extensão do perfil do usuário com os termos relacionados ao significado sem ambigüidade

Filtragem de informação Exemplos WebWatcher (WebWatcher 1996) Usuário identifica palavras-chave Duas páginas estão relacionadas se há uma terceira página que aponta para elas Medida de similaridade: mutual information

Filtragem de informação Exemplos LAW (Bayer 1995) Monitora ações do usuário para distinguir documentos relevantes Monta o perfil do usuário Robô autônomo busca por documentos relevantes þ Sugere links interativamente

Filtragem de Informação Exemplos - Crítica Focam no aprendizado do perfil do usuário Baseados no modelo espaço-vetorial Não há muitas considerações sobre técnicas de PLN extensivas Virtualmente impossível isolar informações relevantes

Filtragem de Informação Exemplo SAMURAI (H. Leong, S. Kapur, O de Vel, 1997) Módulos: Sumarização de Texto Monitoração e Modelagem do usuário Search Engine = Web Search + Perfil do Usuário Filtragem de links irrelevantes Compilação dos resultados

Discussão O que é um Agente “inteligente”? Qual o futuro dos Agentes no mundo real?

Links http://www.ece.curtin.edu.au/~saounb/bargainbot/ articles.html http://www.firefly.com http://www.sics.pe/ps/abc/survey.html http://www.dsv.su.se/~fk/if_Doc/IntFilter.html http://www.lcs.media.mit.edu/groups/agents/ resources.html http://www.cs.umbc.edu/agents http://www.iit.nrc.ca/bibliographies/ml-applied-to-ir.html

Referências [1] Gleaning Information from the Web: Using Syntax to Filter out Irrelevant Information, R.Chandrasekar e B. Srinivas, University of Pennsylvania, Philadelphia, PA 19104, 1997; [2] Text Summarisation for Knowledge Filtering Agents in Distributed Heterogenous Enviroments, H. Leong, S. Kapur, O de Vel, James Cook, University of North Queensaland, Austrália, 1997; [3]A Framework for Comparing Text categorization Approaches, Isabelle Moulinier, LAFORIA-IBP-CNRS, Université Paris VI, France, 1997

Referências [4]Agent Sourcebook, Alper K., Cagland e colin G. harrison; [5] Internet Agents, Fah-Chun Cheong, MIT Media-Laboratory, Cambridge, MA, 1994; [6]Learning and revision User Profiles: The Identification of Interesting Web Sites, Michael , Pazzani, Daniel Billsus, University of California, Irvine, Irvine, CA 92697, 1997 [7] Learning Information Retrieval Agents: Experiments with Automated web Browsing, Marko balabanovic e Yoav Sholan, Stanford University, 1995