ORKURIOSO Equipe Arthur Gonçalves - agc Fábio Rocha - frp

Slides:



Advertisements
Apresentações semelhantes
Medidas de Avaliação de Sistemas de Recuperação de Informação
Advertisements

Dicas para fazer um bom Projeto de Pesquisa...
Modelo de Redes de Crenças
Modelo Probabilístico
Operações sobre o Texto
TUTORIAL BASE DE DADOS SCIENCE DIRECT Elaborado por:
Indexação Automática de Documentos
Especificação de Consultas
Propriedades de Documentos
Recuperação de Imagens
Modelos de Recuperação de Informação
Eveline Alonso Veloso PUC-MINAS
Eveline Alonso Veloso PUC-MINAS
Conceitos Gerais relacionados a Recuperação de Informação
Treinamento no uso dos recursos SABi/Web Maria Cristina Bürger 2009.
Ontologias para Melhorar Precisão e Cobertura de Buscas na Web
Eduardo Silva, Frederico Fernandes, Juliano Rabelo e Flávia Barros
Agentes na Web Márcio David de Magalhães Santos Departamento de Informática UFPE Recife, 1 de junho de 1999.
1 Projeto Filtragem de Mensagens Eletrônicas Disciplina: Inteligência Artificial Simbólica Professores: Geber Ramalho e Jacques Robin.
Recuperação de Informações
UNIVERSIDADE FEDERAL DE SANTA CATARINA - UFSC PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA E GESTÃO DO CONHECIMENTO EGC – GESTÃO DO CONHECIMENTO E FERRAMENTAS.
MetaLib - Visão Geral 1º Encontro de Usuários ALEPH 30 Nov. e 1º Dez. de 2006 Caio Pellegatti.
Projeto de Contexto Uma proposta do que pode ser feito.
Inteligência Artificial
Diagnóstico de Usabilidade das Secretarias de Estado
Recuperação de Informação usando o Apache Lucene
Recuperação Inteligente de Informação Tarefa 1 Equipe.
NEScrawler Aércio Cavalcanti – Afonso Ferreira - Vilmar Santos -
Editor Data Hidro Um exemplo de como os requisitos evoluem!
PHL Personal Home Library.
Repositório Científico de Acesso Aberto de Portugal (RCCAP)
Sistemas de Apoio à DecisãoMárcio MoreiraUnidade 5 – Decisões Não Estruturadas – Recuperação de Informações – Slide 1 5Decisões Não Estruturadas 5.1Recuperação.
INFORMÁTICA BÁSICA.
PETER ANTONY RAUSCH JOYCE MARTINS
Bruno Florencio Pinheiro Orientador: Renato Fernandes Corrêa
BASES DE DADOS EBSCO. Disponível em:
Domingos Sávio João Lima José Francisco Raphael Barros.
Mineração da Web Recuperação de Informação
Recuperação de Informação
Mineração da Web Recuperação de Informação
Mineração na Web Introdução a Recuperação de Informação
Recuperação de Informação Mineração na Web
Recuperação de Informação Clássica
Recuperação de Informação
Título do projeto Equipe Local Data.
i-Jus Busca em Diário Oficial
Redes Bayesianas - Aplicação em Recuperação de Informação Rudini Sampaio DCC / UFLA.
Introdução ao Processamento Digital de Imagens Clayton de Medeiros Vasconcelos Centro Brasileiro de Pesquisas Físicas CAT- Out
Recuperação de Informação
Recuperação de Informação
Recuperação de Informação
Agentes Inteligentes na Web
Classificacao de Texto Projeto Spam Filter
TabNet (tabulador para Internet TabWin (Tabulador para Windows)
Introdução ao Processamento Digital de Imagens
Recuperação Inteligente de Informação
Recuperação Inteligente de Informação
Recuperação de Informação Arlei Calazans Luís Ricardo Fábio Hedayioglu {ajcm, lrcs, cin.ufpe.br Classificação de cardiopatias a partir de uma base.
Processo de Desenvolvimento de Software – PDS
ENIA 2001/SBC Fortaleza, CE 30/07 a 03/ ActiveSearch Um Agente Pró-ativo para Recuperação de Documentos Similares em Repositórios Digitais.
Elaboração: Telma Telemberg da Silva – CRB 14/544 Editoração: Claudia Bittencourt Berlim – CRB 14/964 BIBLIOTECA VIRTUAL.
CIn-UFPE1 Recuperação de Informação Modelos de Recuperação de Documentos Flávia Barros.
Classificação de Textos
Propostas de Projetos para Especialização em IC
Um Classificador Baysesiano para a Análise das Relações Sociais em Blogs Allan Lima –
Números Brasil 9º país em IP único. Acesso limitado de 256kbps Japão com conexão de 100Gbps fonte Akamai.
Recuperação de Informação Eduardo Amaral - efas Frederico Fernandes - fbf2 Juliano Rabelo - jcbr Flávia Barros - fab.
U.C.: Tecnologias da Comunicação Docente: Vânia Janela Discente: Vanda Bregieiro nº Curso: PAP 1º ano O QUE SÃO BLOGUES?
Medidas de Avaliação. Para a maioria dos sistemas computacionais é necessário criar medidas para aferir sua eficácia e eficiência; A medida mais comum.
Curso Superior de Tecnologia em Redes de Computadores Projeto Integrador I Apresentação do Projeto Tiago Alves SERVIÇO NACIONAL DE.
Transcrição da apresentação:

ORKURIOSO Equipe Arthur Gonçalves - agc Fábio Rocha - frp Hugo Alves - haa Renato Marcelino rmo

Roteiro Orkut Descrição do sistema Corpus de documentos Arquitetura do sistema O Protótipo Testes e resultados Conclusão Referências

Orkut Maior rede social do país 32 Milhões de usuários Troca de mensagens entre usuários scraps Busca por scraps Levantamento de opiniões Fiscalização policial Curiosidade ...

Orkut

Descrição do sistema Aplicação para consulta de scraps Consulta palavras desejadas Ex.: “Boticário” Resultado Sender - Link Receiver - Link Scrap Estamos falando da correlação linear de Pearson.

Corpus de documentos Indexação Aquisição Palavras do scrap Crawler Busca em largura Limite por scraps ou profiles 1 2 3 Olá tudo bem? … Como vai vc? … Fala doidao!!! .... Documento Scrap www.orkut.com/profile... Link Sender Link Receiver

Corpus de documentos

Arquitetura do sistema

Modelos de RI adotados Modelo Booleano Modelo Vetorial Simples Rápido Filtro Primário Modelo Vetorial Grande uso Eficiente Score

Pré-processamento dos Documentos Preparação dos documentos Eliminação de stopwords Eliminação de tags html Conversão do texto para lowercase Stemming

Representação Interna dos Documentos Base de Índice Invertidos No Termo (Docs; Pos) 1 2 3 4 5 Brother malice gatinha pertubado orkut (21; 4), (1; 7) (3), (1; 8) (1), (4) (2), (4)

Consulta Busca nos scrapbooks Busca booleana “?”,”*”,” Buscas compostas “OR”,”AND”, “palavra composta” Score

Protótipo

Avaliação do sistema Avaliação subjetiva 10 usuários (NeuroTech e Cin) Notas Muito Ruim Ruim Médio Bom Muito Bom Muito Ruim Ruim Médio Bom Muito Bom 1 4

Avaliação do sistema Corpus Cobertura máxima Precisão 100 scraps 10 consultas Etiquetagem Cobertura máxima Precisão 63%

Melhorias propostas Analisador específico do domínio Gírias Extensão para outras comunidades Facebook Consultas avançadas Tipos de arquivos Informações do Sender

Conclusões Ferramenta inovadora Ferramenta de busca Bom desempenho Produtos Policial Caráter pessoal Bom desempenho

Referências YATES, R. B. e NETO, B. R. Modern Information Retrieval, 1999. LUCENE. Disponível em: <http://lucene.apache.org> Acesso em: 6 jun. 2008 ORKUT. Disponível em: <http://www.orkut.com> Acesso em: 6 jun. 2008

ORKURIOSO Equipe Arthur Gonçalves - agc Fábio Rocha - frp Hugo Alves - haa Renato Marcelino rmo