Estudo de Benefícios e Custos de Algoritmos para Seleção de Características Eduardo Mendel do Nascimento Estefhan Dazzi Wandekokem.

Slides:



Advertisements
Apresentações semelhantes
Correlação e Regressão
Advertisements

João Luiz Fernandes e Aura Conci Universidade Federal Fluminense
Fluxo em Redes Prof. Ricardo R. Santos.
Prof. André Laurindo Maitelli DCA-UFRN
CAPÍTULO 7 TESTE DE HIPÓTESE
INTELIGÊNGIA COMPUTACIONAL
UTILIZAÇÃO DA METODOLOGIA DOS TRÊS SINAIS DE AXIAL OFFSET PARA MONITORAÇÃO E CONTROLE DAS OSCILAÇÕES AXIAIS DE XENÔNIO NO REATOR NUCLEAR DE ANGRA 1.
ANÁLISE DISCRIMINANTE LIG, 18 de novembro de 2008.
ANÁLISE DISCRIMINANTE
ANÁLISE DISCRIMINANTE
Q-Q plots Construídos a partir das distribuições marginais de cada componente do vetor p-variado. São de fato um gráfico do quantil amostral versus quantil.
CAPÍTULO 7 TESTE DE HIPÓTESE
Lógica Fuzzy Aplicada a Sistemas de Diagnóstico
ESTIMAÇÃO.
Mineração de Dados Avaliação de Classificadores
HAC MD -junho/ Noções de algoritmos e estudo de casos das principais tarefas de Mineração de dados.
PERCEPTRON (CONTINUAÇÃO)
Adaptive Resonance Theory Carpenter & Grossberg
AULA 03 PERCEPTRON SIMPLES.
GRASP Greedy Randomized Adaptative Search Procedure
Dárlinton B. Feres Carvalho
Reconhecimento de Padrões Classificadores Lineares
Reconhecimento de Padrões Segmentação
Computação Evolutiva: Estratégias Evolutivas
Reconhecimento de Padrões Seleção de Características
Reconhecimento de Padrões Receiver Operating Characteristics (ROC)
Iana Alexandra Alves Rufino
MEDIDAS E INCERTEZAS O Que é Medição?
Rejane Sobrino Pinheiro Tania Guillén de Torres
CAPÍTULO Introdução 2. Programação de tarefas de robôs
Algoritmos Genéticos – Capítulo 11
INF 1771 – Inteligência Artificial
Davyd Bandeira de Melo Um Sistema de Reconhecimento de Comandos de Voz Utilizando a Rede Neural ELM Junho 2011.
Meta - heurísticas Prof. Aurora
ME623A Planejamento e Pesquisa
Márcia Zanutto Barbosa
Classificação. Classificação: Atribuição a uma classe (rótulo de um atributo categórico). Classifica dados (constrói um modelo) baseado em um conjunto.
VALORES ESPERADOS.
INF 1771 – Inteligência Artificial
INF 1771 – Inteligência Artificial
F USION O F C ONTINUOUS -V ALUED O UTPUTS Equipe: Henrique Lins (hsmpl) João Pascoal Neto (jrpn) Mário Barbosa (mbaj) Tiago Farias (tfs)
Classificação de imagens de fotografias históricas usando detecção de linhas e paralelogramos pela presença de edifícios Natália Cosse Batista Grupo 8.
Aula 6 - Método não-experimental ou de seleção não-aleatória
Seleção de Atributos Ricardo Prudêncio.
O Processo de KDD Data Mining SUMÁRIO - AULA1 O processo de KDD
Lista de Exercício IAI 2009 – Ricardo Prudêncio. Os objetivos dessa lista são: –Realizar treinamento de SVMs no WEKA –Praticar procedimento de seleção.
SVMSharp – Uma implementação didática de uma SVM
Aula 8. Classificação Não Supervisonada por Regiões
Sistema de Previsão Financeira Tendências e medidas de probabilidade.
Busca Combinatorial e Métodos de Heurística
Seleção de atributos Mariana Pinheiro Bento IA368Q.
Projeto Final MCI 2004 Filtragem de s Agente de Classificação de SPAM.
Mineração de Dados: Classificação e Predição
Transformada de Hough Processamento global para a detecção de linhas retas numa imagem Nenhum conhecimento é necessário a respeito da posição das linhas.
Uma Introdução a SVM Support Vector Machines
Classificação/Categorização Christian Diego – cdad Icamaan Viegas – ibvs.
Regressão e Previsão Numérica.
Geometria Computacional Fecho Convexo
Modelos Teóricos Contínuos de Probabilidade
DISTRIBUIÇÕES DE PROBABILIDADE
Sistemas de Controle III N8SC3
FEATURE SELECTION. Introdução  Estudo de metodologias relacionadas a seleção de atributos  Maldição da dimensionalidade  O número de atributos do desenvolvedor.
Mineração de Dados (Data Mining)
Busca Heurística Prof. Valmir Macário Filho. 2 Busca com informação e exploração Capítulo 4 – Russell & Norvig Seção 4.1 Estratégias de Busca Exaustiva.
GESTÃO E GARANTIA DA QUALIDADE
Objetivo Este projeto destina-se ao estudo e à elaboração de modelos neurais artificiais, com o auxílio do programa Matlab. O objetivo principal deste.
Distribuição. de freqüência
Camilo Daleles Rennó Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Técnicas.
Universidade do Sul de Santa Catarina Ciência da Computação Técnicas de Inteligência Artificial Aula 10 Algoritmos Genéticos Max Pereira.
Transcrição da apresentação:

Estudo de Benefícios e Custos de Algoritmos para Seleção de Características Eduardo Mendel do Nascimento Estefhan Dazzi Wandekokem

Classificação (1)‏ Descoberta automatizada de padrões de semelhança entre dados, dando à máquina a capacidade de associar um padrão, na forma de um vetor multidimensal, a uma dentre algumas classes distintas pré-definidas. Base de treino: especialistas humanos introduzem conhecimento no sistema com o uso de um conjunto de dados rotulados (base de treino). Uma observação do ambiente (um padrão) é mapeado matematicamente como uma variável multidimensional contínua ou discreta (uma característica), assim padrões são representados como pontos (rotulados ou não) no espaço de características.

Classificação (2)‏ À medida os padrões rotulados são introduzidos, regiões distintas do espaço de características passam a se associar mais fortemente a uma classe do que a outra. O processo de classificação então consiste na criação de um mapeamento entre cada região do espaço de características e a classe à qual essa região está associada. Espera-se uma generalização eficiente, a fim de se minimizar o erro de classificação em novos e desconhecidos dados apresentados ao classificador (base de teste).

Classificador Support Vector Machine (1)‏ Num problema de classificação com duas classes, espera-se que os padrões pertencentes a cada uma das classes residam em regiões distintas e separáveis. Um problema é linearmente separável se é possível a construção de um hiperplano separador que separa integralmente os exemplos de cada classe. Num espaço de características com dimensão D, esse hiperplano será a equação de um plano no espaço D-1, por exemplo uma reta em duas dimensões.

Classificador Support Vector Machine (2)‏

Classificador Support Vector Machine (3)‏ A separabilidade linear no espaço de características só ocorre em casos triviais, e uma alternativa para contornar sua ausência é o uso de mapeamento matemático. As variáveis dimensionais podem ser combinadas matematicamente ou simplesmente replicadas a fim de gerar novas variáveis de um novo espaço, numa nova configuração de pontos. Classificador SVM: usa um mapeamento fixado pelo usuário para mapear cada dado analisado, e usando os dados de treino, constrói um hiperplano separador com margem de separação máxima, usado então para classificar exemplos desconhecidos. Exemplos errados são penalizados.

Classificador Support Vector Machine (4)‏

Classificador Support Vector Machine (3)‏ A separabilidade linear no espaço de características só ocorre em casos triviais, e uma alternativa para contornar sua ausência é o uso de mapeamento matemático. As variáveis dimensionais podem ser combinadas matematicamente ou simplesmente replicadas a fim de gerar novas variáveis de um novo espaço, numa nova configuração de pontos. Classificador SVM: usa um mapeamento fixado pelo usuário para mapear cada dado analisado, e usando os dados de treino, constrói um hiperplano separador com margem de separação máxima, usado então para classificar exemplos desconhecidos. Exemplos errados são penalizados.

Processo de avaliação Na validação independente, há bases distintas denominadas de treino (usada para ajustar os parâmetros do modelo do classificador) e de teste (usada para medir o desempenho do classificador). Muitas vezes, deseja-se saber o desempenho baseado numa única base, usada portanto para treinar e validar. A validação cruzada possibilita a obtenção desse valor de qualidade. Inicialmente, a base é dividida aleatoriamente em um número pré-especificado de sub-bases com iguais quantidades de elementos. Então, cada um desses conjuntos é usado como base de teste, sendo a base de treino correspondente formada pela união dos conjuntos remanescentes. Ao final, cada dado da base estará associado a uma classe, e é possível tomar, por exemplo, a taxa de acerto nessa base.

Análise ROC No gráfico ROC o eixo x representa a taxa de falso positivo (fpr) e o eixo y a taxa de verdadeiro positivo (tpr)‏

Análise ROC Cada ponto no gráfico representa um classificador

Análise ROC Curva ROC Métrica: AUC (area under curve) Valor de score associado a cada exemplo Probabilidade a posteriori da classe positiva Dado um threshold, o classificador pode usar o score para determina a qual classe o exemplo pertence

Análise ROC

Análise ROC

Seleção de Características (1)‏ A geração das características que descrevem um padrão pode ser um processo computacional baseado numa observação menos abstrata do ambiente, por exemplo, o mapeamento que ocorre entre uma imagem observada e as características usadas para descrevê-la. Seleção de características é uma etapa anterior ao processo de treinamento do classificador que tem como objetivo retirar algumas características que são irrelevantes ou danosas ao processo de classificação. Dessa forma, busca-se por um conjunto ótimo de características que maximiza o desempenho do classificador.

Seleção de Características (2)‏ Busca exaustiva é inviável já que a quantidade de subconjuntos diferentes com K características, tomado de um conjunto total composto por N, resulta em C(N,K) subconjuntos distintos. Dessa forma, devem ser usadas heurísticas a fim de explorar o espaço de busca, visualizado como composto por um número de dimensões igual ao total de características, cada dimensão dessas consistindo numa variável binária que indica o uso ou não dessa característica. Best Features (BF) avalia individualmente cada característica, utilizando-a para treinar completamente um classificador, e a qualidade da característica vem desse desempenho. Útil para análise inicial, mas não considera inter-dependências entre as características.

Sequential Forward Selection (SFS)‏ Heurística gulosa de seleção, com um caráter sequencial e unidirecional. SFS inicia o conjunto das características selecionadas como composto somente por aquela determinada como a melhor por BF. Então, a cada etapa, determina qual das características ainda não selecionadas deve ser acrescentada ao conjunto, e assim acrescenta uma a uma até que a quantidade final de selecionadas seja alcançada. Na determinação de qual característica deve ser incluída, o algoritmo avalia o desempenho de cada classificador construído com o uso de um conjunto de características igual ao atualmente selecionado acrescido de cada característica não-selecionada em teste, de forma que a selecionada seja aquela que maximizar o desempenho.

Sequential Forward Floating Selection (SFFS) (1)‏ Evolução natural do SFS. Espera-se melhorar a busca possibilitando a remoção de uma característica anteriormente escolhida para fazer parte do conjunto das selecionadas. Para cada conjunto de características obtido com a exclusão de cada uma das características selecionadas, a qualidade pode ser estimada via o treino de um classificador e sua avaliação por validação cruzada. Se a qualidade de classificação aumentar em relação ao conjunto original (com a característica incluída), ela é uma potencial candidata a ser excluída. A característica excluída será então aquela que possibilitar o maior ganho com sua remoção.

Sequential Forward Floating Selection (SFFS) (2)‏ O processo de remoção de características prossegue, enquanto houver ganho de qualidade com a remoção de alguma característica. Quando não houver esse ganho, ocorre então a inclusão de uma única característica ao conjunto das selecionadas, e novamente cada característica desse conjunto é investigada a fim de se determinar se alguma deve ser removida. Deve existir um mecanimo para evitar loops de inclusão e posterior exclusão das mesmas características.

Estudo da Detecção de Desalinhamento (1)‏ Base de dados reais obtida de motobombas em operação. 945 dados com 70 características, distribuição de classe aproximadamente 50%/50%. O desalinhamento refere-se a problemas no acoplamento entre o eixo do motor e o eixo da bomba, ocorrendo quando esses eixos estão orientados paralelamente e não coincidem (desalinhamento paralelo), ou quando não estão orientados paralelamente e coincidem (desalinhamento angular). Assinatura característica de alta vibração nas freqüências das harmônicas 1x, 2x e 3x, nas direções radiais e axial. Características extraídas: energia (RMS) em bandas de frequência específicas do sinal de vibração da máquina, obtido de um acelerômetro.

Estudo da Detecção de Desalinhamento (2)‏

Estudo do Elemento Emissor de Sonar (1)‏ Base de dados obtida da Internet. 208 dados com 60 características, distribuição de classe aproximadamente 50%/50%. A tarefa consiste em treinar um classificador para discriminar entre sinais de sonar emitidos de um cilindro metálico daqueles emitidos de uma rocha. Características extraídas: energia (RMS) em bandas de frequência específicas do sinal sonoro.

Dúvidas?