Victoria J. Hodge and Jim Austin Dept. of Computer Science, University of York, A Survey of Outlier Detection Methodologies (2004). Artificial Intelligence.

Slides:



Advertisements
Apresentações semelhantes
Agenda Introdução Justificativa Objetivo Detecção de Spam
Advertisements

INTELIGÊNGIA COMPUTACIONAL
Sistema de Detecção de Intrusão.
Araken de Medeiros Santos Anne Magály de Paula Canuto
Fluxo Óptico Allan Carlos Avelino Rocha
Aprendizado de Máquina
Mecanismo de Proteção (Prevenção e Detecção)
Aspectos da Implementação de Redes Neurais
Eng 639 – Processamento de Imagens Digitais
SVM Support Vector Machines
Reconhecimento de Padrões Tipos de Aprendizagem
Reconhecimento de Padrões Segmentação
Reconhecimento de Padrões Seleção de Características
Reconhecimento de Padrões EigenFaces
Inteligência Computacional para Otimização
Reconhecimento de Padrões Dissimilaridade
Reconhecimento de Padrões Aprendizagem Supervisionada (KNN)
Reconhecimento de Padrões Segmentação
Redes Neurais (Conceitos Fundamentais)
Germano C. Vasconcelos Centro de Informática - UFPE
Redes de Funções de Base Radial Radial Basis Functions (RBFs)
Avaliação de Desempenho de Sistemas Operacionais
Sistemas Distribuídos de Tempo Real
FACENS – Engenharia da Computação Inteligência Artificial
Unsupervised Outlier Detection in Time Series Data Zakia Ferdousi e Akira Maeda Apresentação: Adriana Jouris.
Instituto Tecnológico da Aeronáutica – ITA Divisão de Ciência de Engenharia Eletrônica e Computação EE-09 Inteligência Artificial Prof. Adilson Marques.
INF 1771 – Inteligência Artificial
INF 1771 – Inteligência Artificial
Alexandre Xavier Falcão & David Menotti
Aprendizagem de Máquina - Agrupamento
Redes Neurais Auto-organizáveis
Impressão vocal Alunos: Daniel de Carvalho Cayres Pinto
Reconhecimento de Expressões Faciais em Imagens
K-Means / Clustering.
Hui Han, Lee Giles, Hongyuan Zha, Cheng Li, Kostas Tsioutsiouliklis
Gerhard M¨unz, Sa Li, Georg Carle Computer Networks and Internet Wilhelm Schickard Institute for Computer Science University of Tuebingen, Germany Traffic.
INTELIGÊNCIA ARTIFICIAL
Redes Neurais Prof. Alex F. V. Machado.
INF 1771 – Inteligência Artificial
INF 1771 – Inteligência Artificial
Aprendizado de Máquina - Introdução
Estratégia de Operações
Classificação de imagens de fotografias históricas usando detecção de linhas e paralelogramos pela presença de edifícios Natália Cosse Batista Grupo 8.
Redes Neuronais/Neurais/ Conexionistas Introdução
Support Vector Machine - SVM
SVMSharp – Uma implementação didática de uma SVM
RNA – Radial Basis Function
Revisão 2° Bimestre Inteligência Artificial. Redes Neurais.
Uma Introdução a SVM Support Vector Machines
Universidade Federal de Lavras Departamento de Ciência da Computação
Clustering Algorithms for Gene Expression Analysis Pablo Viana Fagner Nascimento.
Categorização de Documentos Mariana Lara Neves CIn/UFPE.
Inteligência Artificial I
Multilayer Failure Detection Method for Network Services Based on Distributed Components Eisuke Hirota, Kazuhiko Kinoshita, Hideki Tode, Koso Murakami,
Inteligência Artificial I
Aprendizado da rede O aprendizado, na maioria das vezes, constitui no ajuste do conjunto de pesos de modo que a rede consiga executar uma tarefa específica.
Luana Bezerra Batista Redes Neurais Luana Bezerra Batista
Reconhecimento Facial usando SVM
Redes Neurais Artificiais
Aplicações em Redes Neurais Artificiais De acordo com Turbam, McLean e Wetherbe (2004), “a computação neural também pode ser combinada com outros sistemas.
Classificação de Textos
Equipe: Hugo Santiago Heitor Rafael Amorim. Reconhecimento de Padrões As técnicas de RP são usadas para classificar ou descrever padrões ou objetos através.
INTELIGÊNCIA ARTIFICIAL Grupo: Amora Figueiredo Érika Diniz
Detecção de tráfego Skype na Web através de Redes Neurais Artigo Original: Freire, P. E., Ziviani, A., and Salles, R. M. (2008). Detecting skype flows.
MÉTODOS DE ENSINO EM CIÊNCIA BIOLOGICA.
Redes Neurais Artificiais (Parte 2)
Fundamentos da Computação Gráfica PUC-Rio – Pontifícia Universidade Católica do Rio de Janeiro DI – Departamento de Informática Mestrado em Informática.
Text Clustering Anaury Norran Italo Lima Robertson Novelino Tomás Almeida.
Transcrição da apresentação:

Victoria J. Hodge and Jim Austin Dept. of Computer Science, University of York, A Survey of Outlier Detection Methodologies (2004). Artificial Intelligence Review - Qualis B1 (2012) – 586 citations

Outliers

Definições Grubbs (Grubbs, 1969) Uma observação periférica, ou outlier, é uma que parece desviar-se acentuadamente a partir de outros membros da amostra em que ela ocorre. Barnett & Lewis (Barnett e Lewis, 1994) Uma observação (ou subconjunto de observações), que parece ser incompatível com o restante do conjunto de dados.

Aplicações Detecção de Fraude - detecção de aplicações fraudulentas de cartões de crédito,etc. Detecção de Intrusão - detecção de acesso não autorizado em redes de computadores. Monitoramento de Atividades - detecção de fraudes telemóvel atividade de monitoramento de telefone ou operações suspeitas nos mercados de ações. Desempenho de rede - monitorar o desempenho das redes de computadores, por exemplo, para detectar os gargalos da rede. Diagnóstico de falhas - os processos de monitorização para detectar falhas em motores, geradores, oleodutos ou instrumentos espaciais em naves espaciais, por exemplo.

Aplicações Análise de imagens de satélite - identificar características novas ou recursos erroneamente classificadas. Detecção de novidades em imagens - para neotaxis robôs ou sistemas de vigilância. Segmentação de movimento - recursos de imagem de detecção se movendo independentemente do fundo. Monitoramento em série temporal - aplicações de monitoramento de segurança críticos, tais como perfuração ou de alta velocidade de moagem. Monitoramento de condições médicas - tais como monitores de freqüência cardíaca.

Tipos de Abordagens Tipo 1 – Determinando outliers em agrupamentos de forma não supervisionados. Topo 2 - Esta abordagem é análoga à classificação supervisionada e requer que os dados sjam pré- rotulados. Tipo 3 - É análogo a uma tarefa de reconhecimento ou de detecção semi-supervisionada. A classe normal é ensinada mas o algoritmo aprende a reconhecer os outliers

Métodos - Modelo Estatístico Primeiras técnicas. Sensível ao volume dos dados. Técnicas “baseadas em proximidade” K-NN (Vizinho mais próximo) K-Means K-Medoids Métodos Paramétricos Minimum Volume Ellipsoid Estimation (MVE) Convex Peeling Principal Component Analysis (PCA) Expectation Maximization (EM). Métodos Não Paramétricos Usado para detecção de problemas na operação de máquinas.

Métodos - Modelo Estatístico Métodos Semi Paramétricos Combinam a velocidade dos métodos paramétricos com a flexibilidade dos métodos não-paramétricos. Gaussian Mixture Models (GMM) Extreme Value Theory (EVT) EVT é ideal para reconhecimento novidade onde as amostras anormais são difíceis e caras de se obter, como raros casos médicos ou mau funcionamento de máquinas caras. Support Vector Machines (SVM)

Alguns Exemplos PCA CONVEX PEELING MVE

EXEMPLO: K-MEANS

Métodos – Redes neurais Métodos Neurais Supervisionados Multilayer Perceptron (MLP) Auto-associative Neural Network Hopfield Networks Radial Basis Function (RBF) Métodos Neurais Não-Supervisionados Self Organising Maps (SOMs) Grow When Required (GWR) Adaptive Resonance Theory (ART) – Monitoramento de séries temporais

Métodos – Machine Learning Decision Trees Rule-based Systems Similarity-based Matching BIRCH (Balanced Iterative Reducing and Clustering Using Hierarchies) DBSCAN (Density-Based Spatial Clustering of Applications with Noise)

Métodos – Sistemas Híbridos MLP + Parzen Window Novelty Recogniser MLP + K-Means – usado em detecção de falha em motores de aeronaves MLP + HMM (Hidden Markov Model) HMM+EM – Detecção de fraudes em celulares Gaussian basis function networks (GBFN) and Principal Components Analysis Consensus voting JAM system (Java Agents for Meta-learning)

EXEMPLO: DBSCAN

Conclusões Aprensenta apenas uma amostra dos métodos para detecção de outliers. Deve-se ecolher o algorítmo adequado ao seu conjunto de dados considerando a sua massa de dados Deve-se decidir se os outliers serão removidos, classificados como novos valores ou se serão marcados como anomalias. A combinação de várias classificadores deve ser feita de forma criteriosa.

QUESTIONS???

Creditos Apresentação realizada na disciplina: Reconhecimento de Padrões em 04/10/2012 Professor: David Menotti Estudante: Luciano Vilas Boas Espiridião Mestrando em Ciência da Computação Departamento de Computação – DECOM Instituto de Ciências Exatas e Biológicas – ICEB Universidade Federal de Ouro Preto – UFOP