Recuperação Inteligente de Informação

Slides:



Advertisements
Apresentações semelhantes
Recuperação de Informação
Advertisements

MOODLE PARA TODOS Projeto EAD-CPD MOODLE UFBA Centro de Processamento de Dados - UFBA.
Ambiente Virtual de Aprendizagem. O AVA é um "espaço fecundo de significação onde seres humanos e objetos técnicos interagem, potencializando assim a.
Conceitos Gerais relacionados a Recuperação de Informação
#pshare: compartilhando preços de produtos na web Dárlinton B. F. Carvalho Março de 2010.
Interfaces Conversacionais
Aplicação de XML Web Semântica Tópicos Avançados em Bancos de Dados II
Mineração de Dados ou Descoberta de conhecimento em BDs
Ontologias para Melhorar Precisão e Cobertura de Buscas na Web
André Neves, Flávia Barros & Geber Ramalho
Eduardo Silva, Frederico Fernandes, Juliano Rabelo e Flávia Barros
Sugestões de projetos.
Introdução a Teoria da Classificação
Agentes na Web Márcio David de Magalhães Santos Departamento de Informática UFPE Recife, 1 de junho de 1999.
1 Projeto Filtragem de Mensagens Eletrônicas Disciplina: Inteligência Artificial Simbólica Professores: Geber Ramalho e Jacques Robin.
Base SCOPUS 2011 Divisão de Biblioteca e Documentação FMUSP.
UNIVERSIDADE FEDERAL DE SANTA CATARINA - UFSC PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA E GESTÃO DO CONHECIMENTO EGC – GESTÃO DO CONHECIMENTO E FERRAMENTAS.
Paulo J Azevedo Departamento de Informática
Prof. Ilaim Costa Jr. Novas Tecnologias Prof. Ilaim Costa Jr.
Filtragem Colaborativa e Sistemas de Recomendação
Sistemas de Recomendação
Recuperação Inteligente de Informação Tarefa 1 Equipe.
Bruno Cavalcante (bmsc) Gabriel Monteiro (gam) João Florêncio (jcpf) Lucas Marinho (lpm)
Engineering Village. Engineering Village – A Plataforma Desenvolvida pela Engineering Information (Ei), líder em fornecer informações.
ORKURIOSO Equipe Arthur Gonçalves - agc Fábio Rocha - frp
Adicionando Escalabilidade ao Framework de Recomendação Idealize
Sistemas de Apoio à DecisãoMárcio MoreiraUnidade 5 – Decisões Não Estruturadas – Recuperação de Informações – Slide 1 5Decisões Não Estruturadas 5.1Recuperação.
Rodrigo Cristiano Silva
Bruno Florencio Pinheiro Orientador: Renato Fernandes Corrêa
Introdução à Classificação de Texto
Mineração da Web Recuperação de Informação
Mineração na Web Introdução a Recuperação de Informação
Recuperação de Informação Mineração na Web
Recuperação de Informação
Web 2.0 Gilson Medeiros de Oliveira Junior -
Recuperação de Informação
Recuperação de Informação
Oficina Plone Criação de Formulários
O ambiente de Ead selecionado para realização do curso on-line foi o TelEduc. Este é utilizado na Uniminas como ferramenta de auxilio das disciplinas.
Ambiente Virtual de Aprendizagem
Redes Sociais Colaborativas Patrícia Ramos | 22/05/2006.
Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do.
Inteligência Artificial Web Semântica
Juliano Rabelo Mineração de Opiniões Juliano Rabelo
Projeto Final MCI 2004 Filtragem de s Agente de Classificação de SPAM.
Nº Pedro José de Oliveira Sessão Controlo Tese 2º Semestre 2007/2008 Orientador – João Rocha.
Integração de Ferramentas CASE
Classificação/Categorização Christian Diego – cdad Icamaan Viegas – ibvs.
Classificação de Texto Baseada na aula de Henrique Borges e Ícaro Medeiros Alterada por Flávia Barros.
Filtragem de Informação
Classificação de Texto
Uma Interface em Linguagem Natural em Português para Pergunta-Resposta na Web Grupo de Inteligência Computacional Mestrado em Ciência da Computação Aluno:
ENIA 2001/SBC Fortaleza, CE 30/07 a 03/ ActiveSearch Um Agente Pró-ativo para Recuperação de Documentos Similares em Repositórios Digitais.
PCS - Departamento de Engenharia de Computação e Sistemas Digitais Projeto de Formatura – Turmas 2008 Integrantes: Professor Orientador: Engenharia de.
Extração de Informação
Classificação de Textos
Eduardo Matos (ejvm) Leonardo Vilaça (lhvs) Igor Ebrahim (ies) Thiago Gomes (tgr)MW
TUTORIAL. SABIN AMERICANA Esta base é formulada conforme a bibliografia de Joseph Sabin, bibliófilo americano que viveu entre 1821 e Com.
BIBLIOTECA DIGITAL DA UFRGS: implementação e perspectivas 2da. Jornada sobre la Biblioteca Digital Universitaria JBD2004 Buenos Aires, de junio de.
Laboratório de Mídias Sociais Aula 02 Análise Textual de Mídias Sociais – parte I Prof. Dalton Martins Gestão da Informação Universidade.
Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.
/ de Julho de UFPE - Universidade Federal de Pernambuco CIn - Centro de Informática Pós-Graduação em Ciência da Computação Tópicos Avançados.
Ensinet/Nav: Uma ferramenta para estruturação de cursos baseados em objetos de aprendizagem UNIVERSIDADE CATÓLICA DE PELOTAS ESCOLA DE INFORMÁTICA NÚCLEO.
Bases de Dados mantidas pela USP.. A USP produz e oferece acesso a diversos tipos de produção intelectual: científica, acadêmica, técnica ou artística.
UNIVERSIDADE ESTADUAL PAULISTA “Júlio de Mesquita Filho” UNATI - Marília Buscadores na Web: um enfoque no Google. Aula 07.
Indexação automática de documentos utilizando técnicas de mineração de textos Trabalho de conclusão de curso Fabio Montefuscolo Rafael Câmara.
COMPILAÇÃO E RECUPERAÇÃO DE INFORMAÇÕES TÉCNICO-CIENTÍFICAS E INDUÇÃO AO CONHECIMENTO DE FORMA ÁGIL NA REDE AGROHIDRO MARIA FERNANDA MOURA 1 ;
Tarefa Autor: Skyup Informática. Atividade – Tarefa O módulo atividade tarefa tem como principio básico a interação professor-aluno. Os alunos podem apresentar.
Exemplos de projetos Flavia Barros CIn-UFPE.
Transcrição da apresentação:

Recuperação Inteligente de Informação Exemplos de Aplicações CIn-UFPE

Roteiro Áreas de pesquisa e desenvolvimento relacionadas Exemplos de Sistemas de RI Aplicações, agentes, serviços na Web CIn-UFPE

Tarefa típica de RI Dados Encontrar Um corpus de documentos (itens de dados) & Uma consulta do usuário geralmente representada por palavras-chave Encontrar Um conjunto ordenados de documentos que são relevantes para a consulta CIn-UFPE

Algumas Áreas relacionadas a RI Ciência da informação Bibliotecas digitais Bancos de dados Para armazenar os dados a serem recuperados Inteligência artificial Ontologias e sistemas inteligentes de RI Aprendizagem de máquina Classificação e clustering de documentos, criação e manutenção de perfil do usuário, extração de informação, mineração de texto, etc.. Processamento de linguagem natural CIn-UFPE

Algumas Áreas relacionadas a RI Processamento de Linguagem Natural Algumas “regiões” de interseção Sistemas Pergunta-resposta Extração de informação Regras para identificar ocorrência de palavras que pertencem a uma dada classe gramatical (via uso de POS-taggers) E alguns métodos de pré-processamento dos documentos Análise léxica, Stemming, identificação de grupos nominais, POS-tagging, etc CIn-UFPE

Exemplos de Sistemas de RI Sistemas de Busca Sistemas de Automação de Bibliotecas Sistemas de Gerenciamento de Documentos Engenhos de Busca na Web Sistemas de Meta-busca Sistemas de Pergunta-resposta Sistemas de Classificação/clustering de documentos Sistemas de Extração de Informação Sistemas de Recomendação Sistemas de Mineração de dados/informação RI Heterogênea CIn-UFPE

Exemplos de Agentes de RI na Web Agentes de filtragem de informação Agentes notificadores Agentes de Comércio Eletrônico Agentes Chatterbots CIn-UFPE

Sistemas de Busca Sistemas de Automação de Bibliotecas Primeira aplicação na área de RI Atualmente, a tendência são as bibliotecas digitais RI + BD Citeseer Scientific Literature Digital Library http://citeseer.ist.psu.edu/ CIn-UFPE

Sistemas de Busca Automação de Bibliotecas (2007-1) BDCIn: Biblioteca Digital do Centro de Informática Indexação de Trabalhos de Graduação, Dissertações de Mestrado e Teses de Doutorado do CIn-UFPE objetivo geral: facilitar a divulgação e o acesso aos trabalhos científicos produzidos no CIn CIn-UFPE

Sistemas de Busca Exemplos (2008-1) TG fácil: um engenho de busca web para trabalhos de graduação do CIn-UFPE Indexação dos TGs pelo conteúdo , não só por meta-dados Investment search Base indexada de dados sobre bolsa de valores notícias atualizadas das principais bolsas de valores do mundo obtidas a partir de sites da web que contêm notícias sobre economia CIn-UFPE

Sistemas de Busca Exemplos (2008-1) ORKURIOSO Scraps -Troca de mensagens entre usuários Busca por scraps Levantamento de opiniões Fiscalização policial Curiosidade Miss gay... Resultado Sender - Link Receiver - Link Scrap CIn-UFPE

Sistemas de Meta-busca Engenhos de busca São robustos e gerais Porém, retornam uma quantidade muito grande de documentos irrelevantes Realizam buscas nas bases de índices de outros sistemas Na Web ou em BDs privados Recuperação por similaridade Buscam documentos similares ao que o ususário está visualizando ou editando E.g. GoogleToolbar, Active Search (CIn), ... CIn-UFPE

Sistemas de Meta-busca Exemplo: Active Search Interface Doc’s Content Current Doc’s Internal Representation Meta-search Query Preparation Docs Searcher Query Web Local Directories Documents Bases Pointers to Documents Docs’ Pointers Docs’ Content Doc. Post-Processor Docs’ Internal Representation Ordered List of Docs Application1 Application2 Application3 Docs Retriever Docs Reorderer Document Pre-Processor Profile Manager Relevant Documents User’s Profile LAN

Sistemas de Pergunta-Resposta Recuperação de Informação + Processamento de Linguagem Natural Recebem como entrada uma pergunta em linguagem natural Retornam como saída a resposta (curta) ao invés de uma lista de documentos Utilizando também técnicas de Extração de Informação Exemplo: P: Qual o melhor time de futebol do Brasil? R: Santa Cruz Futebol Clube CIn-UFPE

Sistemas de Pergunta-Resposta Arquitetura Genérica CIn-UFPE

Sistemas de Pergunta-Resposta Exemplo: Pergunte! Motivação A Web é o maior repositório de informações já construído Necessidade de informação melhor representada sob forma de pergunta Sistemas negligenciam a semântica da pergunta e dos documentos Sistema Pergunte! Uma interface em Português para pergunta-resposta na Web Mestrado de Juliano Rabelo, 2004 CIn-UFPE

Sistemas de Pergunta-Resposta Exemplo (2007-1) Q & A: sistema de pergunta-resposta Restrito a perguntas do tipo “Quem”, “Onde” e “Quando” Utiliza uma base de dados local CIn-UFPE

Classificação e Clustering de documentos Classificação - Objetivo Classificar documentos de acordo com um conjunto ou hierarquia de categorias previamente definidas Clustering – Objetivo Agrupar documentos semelhantes em classes não conhecidas a priori CIn-UFPE

Classificação de documentos Algumas aplicações: Recomendação Alimentar hierarquias de classes, como a do Yahoo, para facilitar a busca Criação de repositórios de domínio específico Distribuição de Notícias Jornal personalizado Mensagem de Email e Newsgroups Filtragem de spam Routing Atribuição de prioridades Seleção de folders CIn-UFPE

Classificação de documentos Exemplo: Sistema CitationFinder Classificação automática de páginas de publicações científicas Mestrado de Mariana Lara Neves, 2001 Objetivo Criação e manutenção de um repositório de documentos desse domínio Para alimentar o sistema Prodext Construção manual: Bases de conhecimento com regras de produção Máquina de inferência (JEOPS) CIn-UFPE

Classificação de documentos Exemplo 2007-1 Classificação de Websites http://rdf.dmoz.org documento xml com diversos links e sua descrição e classificação Domínio específico de “games”. Conclusão: A descrição dos sites é muito breve para obtermos um bom resultado com classificadores automáticos CIn-UFPE

Clustering de documentos Aplicações Criar taxonomias (hierarquias de classes) para browsing de documentos em uma coleção Agrupar resultados de consultas a engenhos de busca ou outros sistemas de RI Técnicas Aprendizado não supervisionado CIn-UFPE

Clustering de documentos Exemplos (2008-1) Clusering aplicado à base Iris Data Set (2007-1) Domme: Domestic Mesh Engine Engenho de Busca e Agrupamento de Documentos na Intranet do CIn recuperação eficiente dos documentos da intranet do Cin CIn-UFPE

Clustering de documentos Exemplo 2007-1 Indexação e clustering & Busca na Web Objetivo Facilitar a busca de material de estudo (apostilas, tutoriais, aulas) na Web sobre um tema específico (e.g., Biologia 2º grau) Com base no conteúdo de questões previamente cadastradas no sistema CIn-UFPE

Clustering de documentos Exemplo 2007-1 Agrupa perguntas de vestibular sobre um mesmo tema CIn-UFPE

Sistemas de Extração de Informação Sistemas capazes de extrair de documentos relevantes apenas a informação requerida A informação extraída pode ser apresentada ao usuário e/ou armazenada em BDs ou BCs. Página de Hotel Template Nome: End.: Fone: Fax: Preços: Sistema de EI BD BC CIn-UFPE

Sistemas de Extração de Informação Exemplo: O ProdExt ProdExt: Um Wrapper para extração de referências bibliográficas a partir de páginas eletrônicas Mestrado de Carla Nunes, 2000 Abordagem utilizada Construção manual de base de regras Autor: A.V.Garcia and A. Haeberer Título: An Architecture for Semantically Based Code Migration Veículo: In Proc. of the II Brazilian Symp. on Progr. Languages Páginas: pp 179-192 Data: Sept/1997 Local: Campinas, Brasil A.V.Garcia and A. Haeberer. An Architecture for Semantically Based Code Migration. In Proc. of the II Brazilian Symposium on Progr. Languages, pp 179-192, Sept/1997, Campinas, Brasil. CIn-UFPE

Sistemas de Extração de Informação Exemplo: EI utilizando Aprendizagem de Máquina Mestrado de Eduardo Amaral 2004 CIn-UFPE

Sistemas de Extração de Informação Exemplos 2008-1 Extração de anúncios de vendas de carro do JC Online Os templates gerados forma indexados pelo Lucene, para facilitar a consulta do usuário. CIn-UFPE

Mineração de Opiniões Análise de Sentimentos Objetivo Sentiment analysis Objetivo Prover tratamento automático de opiniões/sentimentos Trata a subjetividade do texto Opiniões são extraídas a partir de Sites de opiniões Sites de lojas Blogs Foruns… CIn-UFPE

Mineração de Opiniões Desafio identificar trechos dos textos que expressam sentimentos/opiniões indicar se uma opinião é positiva (favorável) ou negativa (desfavorável) em relação ao item sendo abordado Utiliza técnicas de RI e processamento de linguagem natural CIn-UFPE

Mineração de Opiniões Interface Base de Textos Engenho de Busca Opinion holders Usuário final Identificação de subjetividade Interface Consulta Textos Textos retornados Opiniões Opiniões + sentimento Sumário Sumarização Classificação de Sentimento Extração de características CIn-UFPE

Sistemas de Personalização São sistemas que buscam adaptar-se às preferências e necessidade individuais de cada usuário Utilizam profiles Sistemas de personalização incluem: Recomendação Filtragem Predição CIn-UFPE

Sistemas de Recomendação Recomendam itens para usuários com base em suas preferências livros, filmes, CDs, páginas web, mensagens de newsgroup Exemplos de sistemas Lojas virtuais oferecem esse serviço para aumentar as vendas e.g. Amazon, CDNow Existem duas abordagens básicas par recomendação: Filtragem colaborativa (um tipo de filtragem social) Recomendação baseada em conteúdo CIn-UFPE

Sistema de Recomendação Exemplo 2007-1 ACoReS: Amadeus Course Recommendation System indica cursos aos usuários com base na identificação de padrões de comportamento desses usuários em relação ao sistema Observa o histórico de cursos nos quais os alunos se matricularam CIn-UFPE

Integração de Informação Pergunta-resposta + Extração de informação Objetivo Integrar automaticamente diversos Web sites para responder a determinadas perguntas do usuário cuja resposta não está disponível em um site único Para cada site selecionado, um wrapper é construído Os dados extraídos de cada site podem ser tratados como tabelas de bancos de dados que podem ser consultadas usando-se uma query language (e.g. SQL). CIn-UFPE

Integração de Informação Exemplo (2007-1) LOGO: Sistema Integrado para Busca de Passagens Aéreas OnLine Extração de informação + Integração de informação CIn-UFPE

Mais sistemas e aplicações Sistemas de mineração de dados/informação Sistemas de gerenciamento de documentos CIn-UFPE

RI Heterogênea Sistemas de Recuperação multi-língua Recebem a entrada em uma língua e devolvem a saída em outra língua Busca de partituras musicais ou cifras Busca de padrões de exames médicos Eletrocardiogramas, … CIn-UFPE

Agentes de Informação Fazem mais do que só RI, pois podem: Aplicações: Comunicar-se Cooperar Negociar Aplicações: Comércio eletrônico Leilões/licitações Etc…………….. CIn-UFPE

Agentes de Informação Agentes Notificadores Enviam emails para o usuário de acordo com seus interesses Agentes de Comércio Eletrônico Capazes de representar o usuário em compras na Web Agentes Chatterbots Capazes de dialogar com os usuários em linguagem natural restrita CIn-UFPE

Agentes Chatterbots Chatterbots Sistemas capazes de dialogar com os usuários em linguagem natural restrita E.g., Eliza, ALICE Utilizam técnicas de armazenagem e recuperação muito semelhantes aos sistemas de Pergunta-resposta Esses agentes também podem ser usados como interfaces em linguagem natural para Bancos de dados Bases de conhecimento Sites na web CIn-UFPE

Agentes Chatterbots Exemplo de bot na Web - Pixel http://www.virtus.ufpe.br/pixel Tese de doutorado de André Neves Utiliza a linguagem AILM Criação de novas tags para descrever o nível pragmático dos diálogos com chatterbots CIn-UFPE

Próxima aula Preparação de documentos CIn-UFPE