CRC 98 - 9 e 10 de Novembro de 1998 Um Agente de Filtragem de Correio Electrónico Indesejado José CamposEdmundo Monteiro Dep. de InformáticaDep. de Eng.

Slides:



Advertisements
Apresentações semelhantes
Hugo Monteiro E Venceslau Ferreira Expressão e Comunicação Licenciatura em Engenharia Informática Faculdade de Ciências e Tecnologia – Universidade Nova.
Advertisements

Agenda Introdução Justificativa Objetivo Detecção de Spam
José Claudio Vahl Júnior Janne Yukiko Yoshikawa Oeiras
Janne Yukiko Yoshikawa Oeiras José Claudio Vahl Júnior
Servidores -Samba-0842 MIME
Ferramentas Indispensáveis ao Professor
ACÇÃO 17 Primeiros Passos na Utilização das TIC... Capacidade de comunicar Correio Electrónico Configuração de um cliente de mail.
Electronic Data Interchange
Rational Unified Process
Producto x Processo x Projecto
REDES NEURONAIS ARTIFICIAIS (RNAs) Universidade do Minho.
© 2005, it - instituto de telecomunicações. Todos os direitos reservados. LOcalização de PESsoas em Ambientes Interiores 1º Workshop TELESAL 23 de Novembro.
Inteligência Artificial Alex F. V. Machado. Tecnologia de Processamento da Informação que envolve processos de raciocínio, aprendizado e percepção. Winston.
Orientador: Daniel Fernandes Macedo Aluno: Thiago Tassar de Almeida Outubro/2010.
1 Projeto Filtragem de Mensagens Eletrônicas Disciplina: Inteligência Artificial Simbólica Professores: Geber Ramalho e Jacques Robin.
Cifra de Vigenère Técnicas de Data Mining para cripto-análise
História da Internet 1º A Internet foi idealizada na década de 60 nos Estados Unidos. O objectivo inicial, era o enorme potencial de partilha de informações.
Projecto Escxel – Escola Secundária Quinta do Marquês - Oeiras Breves reflexões sobre o Projecto Escxel na nossa escola 1 de Outubro de 2010.
Aprendizado de Máquina
Técnicas da Intervenção Pedagógica
Apresentação Inicial José Graciano Almeida Ramos Orientador: Professor Dr. Jaime S. Cardoso Responsável INESC Porto : MSc. Ricardo Sousa 1 FEUP-MIEIC.
Apresentação Intermédia José Graciano Almeida Ramos Orientador: Professor Dr. Jaime S. Cardoso Responsável INESC Porto : MSc. Ricardo Sousa 1 FEUP-MIEIC.
(Bernardino Jorge) Centro de Formação da Associação de Escolas do Concelho de Mafra ENCONTRO A QUALIDADE NA ADMINISTRAÇÃO ESCOLAR 1 de Março de 2006 Tema:
FONTES DE INFORMAÇÃO SOCIOLÓGICA CONCEPÇÃO DA PESQUISA NA INTERNET Fontes utilizadas Blattmann, Ursula (1998), "Curso sobre como pesquisar na internet".
Mecanismos de Segurança e sua integração com o Kerberos
INTERFACE DE CONTROLO DE QUALIDADE DE SERVIÇO PARA APLICAÇÕES DE TRABALHO COOPERACTIVO 1ª Conferência de Redes de Computadores Coimbra 9 e 10 Nov
CRC98 - Coimbra, 9 e 10 de Novembro de 1998 Desenho e Implementação do Serviço Controlled-Load da Arquitectura IntServ Joana Urbano, Gonçalo Quadros, Edmundo.
SERVIÇO DE CONTROLO DE CONFERENCIAS BASEADO NO CORBA EVENT SERVICE
Comunicação e profissão
Como escrever um Documento de Projecto para Redes Informáticas
Gestão de Redes e Sistemas Distribuídos Teresa Maria Vazão Fevereiro 2003 IST/INESC Contactos:IST/Tagus-Park Tel:
Gestão de Redes e Sistemas Distribuídos Teresa Maria Vazão Julho 2005 Ferramentas de Gestão Plataformas de Gestão IST/INESC-ID Contactos: IST/Tagus-Park.
INCLUSÃO DIGITAL ROMPENDO BARREIRAS.
Perigos e cuidados Daniela Balena
Protocolo SMTP e POP O que é SMTP?
ESTG Leiria 4 de Abril de 2001 ESTG Leiria 4 de Abril de 2001 Definição e implementação de uma política de segurança para as instalações de comunicação.
FEUPDEECRedes de Computadores, 4º Ano de EEC, ramo de ACI POP3 (Post Office Protocol - Version 3) Abril, 98Isidro Vila Verde 1 Introdução.
Enviando e recebendo mensagens através dos protocolos SMTP e POP3 João Gilberto Magalhães.
Resolução de sistemas de equações lineares
Caracterização dos Princípios da Qualidade Isabel Saraiva - José Martins – Vera Godinho Módulo D2 Novembro 2006.
Arquitetura da Rede Internet FireWall Gateway SQL Server Clientes Mail Server.
Desenvolvimento da Aplicação de Gestão de Licenças de Táxi Luís Miguel da Silva Arêde associação de informática da região centro.
SOFTWARE EDUCACIONAL CLASSIFICAÇÃO
Nelson Vieira Nº 12 Manutenção Industrial. Servidor: Em informática, um servidor é um sistema de computação centralizada que fornece serviços a uma.
CC8 Comunicação e colaboração Correio eletrónico
Raquel Adriana M. Salinas S. Takeguma Orientador: Dr. Jefferson A. P. Pinheiro Brasília, 06 de dezembro de ARTIGO DE MONOGRAFIA.
A Função de Controlo IPCA-Escola Superior de Gestão
Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do.
Padrão Interoperável para Objetos de Aprendizagem
As TIC no processo de educação-formação de Matemática A visibilidade das TIC na formação geral e específica Qualquer tecla para continuar.
Projeto Final MCI 2004 Filtragem de s Agente de Classificação de SPAM.
PROCESSOS DE TREINAMENTO
Desenvolvimento da Aplicação de Gestão de Licenças de Táxi Luís Miguel da Silva Arêde associação de informática da região centro.
(c)AB, WEB: filosofia e origens Grupo de utilizadores Internet Ambiente académico dominado por sistemas UNIX Conjunto de serviços básicos: correio.
Filtragem de Informação
Classificação de Texto
1 Summarizing Text Documents: Sentence Selection and Evaluation Metrics Trabalho realizado por: Trabalho realizado por: João Casteleiro Alves João Casteleiro.
João Falcão e Cunha, Miguel B. Gonçalves © 2003 Testes de Usabilidade1 “Não é o que considera sobre o seu sítio que conta, mas sim o que os utilizadores.
Nome do argonauta 2014 Feedback Após 1 Mês
Classificação de Textos
SOFTWARES EDUCACIONAIS – CÓD PROF. MSC. RONNISON REGES VIDAL.
FIREWALL.
Marketing Viral & Marcos Cardoso
DIA DA INFORMÁTICA ESCOLA SECUNDÁRIA JOSÉ SARAMAGO 7 DE MAIO DE 2008 Oradores António Ferreira Helena Ferreira Isabel Caetano Segurança na Internet.
0 Gerenciamento de Projetos Grandes verdades sobre o desenvolvimento de sistemas de gerenciamento. Estas verdades se aplicam tanto a projetos em empresas.
Correio Eletrônico ( ) (FDE, Secretaria da Educação e Diretorias de Ensino) O que muda para o usuário final?
INTRODUÇÃO ÀS TECNOLOGIAS DE INFORMAÇÃO E COMUNICAÇÃO Rúben Nóbrega | 2012.
1 Projeto Piloto Conclusão em Agenda Projeto Piloto –Descrição –Execução da aplicação –Implementação de requisitos funcionais e não- funcionais.
IN VA. CONFIGURAÇÃO DE CONTA POP NO OUTLOOK (2010)
Formar Professores em Rede Formadores na Cercifaf: António Marcelino Lopes Teresa Lacerda.
Transcrição da apresentação:

CRC e 10 de Novembro de 1998 Um Agente de Filtragem de Correio Electrónico Indesejado José CamposEdmundo Monteiro Dep. de InformáticaDep. de Eng. Informática Escola Sup. Tecnologia de ViseuUniversidade de Coimbra

CRC e 10 de Novembro de 1998 Sumário Abordagem tradicional Abordagem baseada em agentes Arquitectura do sistema Concepção do sistema Implementação Experiências Resultados Conclusões e trabalho futuro

CRC e 10 de Novembro de 1998 Abordagem tradicional Spam: não solicitado e fraudulento Programas anti-spam: baseado em regras Regras: verificação do subject, from, etc. Os programas anti-spam: são eficazes, mas... requerem demasiado empenho do utilizador

CRC e 10 de Novembro de 1998 Abordagem baseada em agentes O que é um agente? Entidade autónoma Entidade semi-inteligente O agente: analisa mensagens e extrai padrões classifica mensagens e elimina as indesejadas Vantagem: Não requer configuração (regras)

CRC e 10 de Novembro de 1998 Arquitectura do sistema SMTP POP3 Mailbox 1 Agente Anti-Spam Perfil 1 Cliente Mailbox N... Perfil N servidor remoto máquina local

CRC e 10 de Novembro de 1998 Representação do conhecimento Mensagens e perfil mapeados em vectores proximidade entre mensagem e perfil perfil mensagem

CRC e 10 de Novembro de 1998 Mensagens/Perfil Vectores TEXTO TERMOS VECTORES VECTOR PERFIL EXTRACÇÃO DE PALAVRAS RELEVANTES ATRIBUIÇÃO DE PESOS HEADERS

CRC e 10 de Novembro de 1998 Cálculo dos pesos Pressuposto: os termos mais frequentes são os mais relevantes em quet é um termo D é o documento em análise

CRC e 10 de Novembro de 1998 Filtragem de mensagens Cálculo da semelhança entre mensagem e perfil A semelhança entre vectores é dada pelo produto escalar Os vectores devem estar normalizados

CRC e 10 de Novembro de 1998 Selecção das mensagens spam Pela definição de produto escalar = arcos ( S(mensagem, perfil) ) Mensagens boas: deve tender para 90º Mensagens spam: deve tender para 0º Selecção: utilização de threshold (do-it)

CRC e 10 de Novembro de 1998 Aprendizagem Perfil inicial vazio Perfil é enriquecido ao longo do tempo em que P é o perfil M é a mensagens f é o feedback (positivo ou negativo) é a sensibilidade da aprendizagem

CRC e 10 de Novembro de 1998 Implementação Agente desenvolvido em PERL Campos considerados: texto com peso 25% subject com peso 75% Threshold do-it colocado a 20% ( =72º)

CRC e 10 de Novembro de 1998 Experiências Mensagens em quatro categorias

CRC e 10 de Novembro de 1998 Treino do agente Treino: 29 mensagens indesejadas O agente errou nas 2 primeiras mensagens da GeoCities nunca classificou mal uma mensagem pessoal

CRC e 10 de Novembro de 1998 Resultados O agente gerou um perfil com 2226 termos Top 20:

CRC e 10 de Novembro de 1998 Resultados Classificação das mensagens boas

CRC e 10 de Novembro de 1998 Resultados Classificação das mensagens indesejadas

CRC e 10 de Novembro de 1998 Conclusões e trabalho futuro Conclusões: O threshold do-it mostrou ser adequado O mecanismo de aprendizagem, apesar de simples, atingiu os objectivos O cálculo dos pesos demonstrou ser adequado Trabalho futuro: Testar outras alternativas ao cálculo dos pesos Aumentar o número de experiências Testar vários perfis diferentes