Reconhecimento de Padrões Seleção de Características

Slides:



Advertisements
Apresentações semelhantes
AULA 02 PROGRAMAÇÃO LINEAR INTEIRA
Advertisements

Unidade VII Algoritmos Genéticos
Inteligência Artificial
Experiments with Clustering as a Software Remodularization Method Nicolas Anquetil and Timothy C. Lethbridge University of Ottawa, Canada WCRE 1999:
1 Seleção de Atributos Marcílio Souto DIMAp/UFRN.
Amintas engenharia.
ANÁLISE DISCRIMINANTE
Algoritmos Genéticos Problema das 8 Rainhas Algoritmo Genético
Mineração de Dados Avaliação de Classificadores
Inteligência Artificial I
Inteligência Artificial
Analise e Seleção de Variáveis
Meta - heurísticas Prof. Aurora
GRASP Greedy Randomized Adaptative Search Procedure
Mário Biague V Oficina: "Como Considerar Variáveis Sociais, Ambientais e Políticas no Planejamento Energético" Análise de portfólio de recursos energéticos.
ANÁLISE DE MODOS DE FALHAS E EFEITOS (AMFE)
1 Complexidade de Algoritmos Complexidade de pior caso Complexidade de melhor caso de uso bem menos freqüente em algumas situações específicas Complexidade.
Estatística 8 - Distribuições Amostrais
Seleção de Características
Algoritmos Genéticos Marcone Jamilson Freitas Souza
Reconhecimento de Padrões Classificadores Lineares
Reconhecimento de Padrões Segmentação
Busca Tabu - Revisão Marcone Jamilson Freitas Souza
Busca Dispersa Scatter Search
Computação Evolutiva: Programação Genética
Computação Evolutiva: Estratégias Evolutivas
Reconhecimento de Padrões Receiver Operating Characteristics (ROC)
Reconhecimento de Padrões EigenFaces
Reconhecimento de Padrões Computação Evolutiva
Reconhecimento de Padrões Teoria da Decisão Bayesiana
Inteligência Computacional para Otimização
Branch-and-Bound Marcone Jamilson Freitas Souza
Reconhecimento de Padrões Combinando Classificadores
Inteligência Computacional para Otimização
Reconhecimento de Padrões Dissimilaridade
Universidade Federal de Ouro Preto (UFOP)
Reconhecimento de Padrões PCA David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP) Programa de Pós-Graduação em Ciência.
Busca Tabu Marcone Jamilson Freitas Souza Departamento de Computação
Reconhecimento de Padrões Aprendizagem Supervisionada (KNN)
Reconhecimento de Padrões Inteligência de Enxame
Reconhecimento de Padrões Principal Component Analysis (PCA) Análise dos Componentes Principais David Menotti, Ph.D. Universidade.
Rejane Sobrino Pinheiro Tania Guillén de Torres
Como Desenvolver Sistemas de Informação
Questões sobre quatro quadrados
Inteligência Artificial
Busca Competitiva - MiniMax Jogo-da-Velha
Listas e algoritmos (em Scratch)
Inteligência Artificial
Classificação. Classificação: Atribuição a uma classe (rótulo de um atributo categórico). Classifica dados (constrói um modelo) baseado em um conjunto.
BCC /01 Funções. Material Didático Unificado. 1 BCC701 – Programação de Computadores I Universidade Federal de Ouro Preto Departamento de Ciência.
Marcus Vinicius Silva Soares Orientador: Luiz Merschmann Outubro / 2010.
Algoritmos paralelos eficientes para alguns problemas de processamento de Cadeia de Caracteres Alunos: Diego Alencar dos Santos Melo Felipe Formagini Brant.
Arquitetura de computadores
4 Questões do Quadrado Está pronto? B A
Busca com informação e exploração
Introdução e Busca Cega
Campus de Caraguatatuba Aula 12: Sistemas de Equações Lineares (2)
Anne Magály de PaulaCanuto DIMAp/UFRN
Algoritmos de Busca Local
Algoritmos Evolutivos Algoritmos Genéticos Introdução
Seleção de Atributos Ricardo Prudêncio.
1 A COMPUTAÇÃO MODERNA Valdemar W. Setzer Depto. de Ciência da Computação da USP
Tópicos em Sistemas Inteligentes
BCC /01 Aula Teórica 09 Funções Material Didático Proposto. 1 BCC701 – Programação de Computadores I Universidade Federal de Ouro Preto Departamento.
Construção e Análise de Algoritmos
Experimentação Algorítmica
Seleção de atributos Mariana Pinheiro Bento IA368Q.
Análise de Componentes Principais
Mineração de Dados (Data Mining)
Universidade do Sul de Santa Catarina Ciência da Computação Técnicas de Inteligência Artificial Aula 10 Algoritmos Genéticos Max Pereira.
Transcrição da apresentação:

Reconhecimento de Padrões Seleção de Características Universidade Federal de Ouro Preto (UFOP) Programa de Pós-Graduação em Ciência da Computação (PPGCC) Reconhecimento de Padrões Seleção de Características David Menotti, Ph.D. www.decom.ufop.br/menotti

Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti Introdução Um dos principais aspectos na construção de um bom classificador é a utilização de características discriminantes. Não é difícil encontrar situações nas quais centenas de características são utilizadas para alimentar um classificador. A adição de uma nova característica não significa necessariamente um bom classificador. Depois de um certo ponto, adicionar novas características pode piorar o desempenho do classificador. Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti

Reconhecimento de Padrões UFOP-PPGCC - Prof. David MenottiQ Introdução Aspectos diretamente relacionados com a escolha das características: Desempenho Tempo de aprendizagem Tamanho da base de dados. Seleção de características Tarefa de identificar e selecionar um subconjunto de características relevantes para um determinado problema, a partir de um conjunto inicial Características relevantes, correlacionadas, ou mesmo irrelevantes. Reconhecimento de Padrões UFOP-PPGCC - Prof. David MenottiQ

Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti Introdução Não é um problema trivial Em problemas reais, características discriminantes não são conhecidas a priori. Características raramente são totalmente independentes. Duas características irrelevantes, quando unidas pode formar uma nova característica relevante e com bom poder de discriminação. Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti

Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti Objetivos O objetivo é encontrar um subconjunto que pode ser Ideal O menor subconjunto necessário e suficiente para resolver um dado problema. Clássico Selecionar um subconjunto de M características a partir de N características, na qual M < N, de maneira a minimizar uma dada função objetivo. Melhor desempenho Buscar um subconjunto que melhore o desempenho de um dado classificador. Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti

Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti Visão Geral Um método de seleção de características deve utilizar um método de busca para encontrar um subconjunto M a partir de N características Espaço de busca é 2N Para cada solução encontrada nessa busca, uma avaliação se faz necessária. Critério de parada Validação Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti

Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti Visão Geral Dash, Liu, 1997. Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti

Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti Gerando Subconjuntos Existem diferentes abordagens que podem ser usadas para gerar os subconjuntos Exaustiva Heurística Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti

Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti Busca Exaustiva Explora todas as possíveis combinações do espaço de busca (2N) Garante que o subconjunto ótimo será encontrado. Muito caro computacionalmente Inviável quando o espaço de busca é grande. Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti

Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti Busca Heurística Com o objetivo de tornar o processo de busca mais rápido, vários algoritmos de busca foram propostos Hill climbing Forward selection Backward elimination Computação Evolutiva Algortimos genéticos PSO Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti

Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti Funções de Avaliação Para julgar se um dado subconjunto é ótimo, temos que avaliar o mesmo. As funções de avaliação podem ser divididas em filter e wrapper. Filter Independentes do algoritmo de aprendizagem. Wrapper Dependente do algoritmo de aprendizagem. Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti

Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti Filter vs Wrapper Wrapper geralmente produz os melhores resultados Entretanto, os resultados podem não ser iguais se trocarmos o algoritmo de aprendizagem em questão O tempo é uma questão crucial para métodos wrapper. Filter não produz resultados tão bons, porém é a solução para grandes bases de dados. Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti

Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti Medidas de Correlação Para abordagens filter, precisamos de medidas que forneçam a correlação entre as características Entropia Coeficiente de Correlação F-Score Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti

Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti PCA Uma ferramenta que pode ser utilizada tanto para extração como para seleção de características é a Análise de Componentes Principais (PCA) A idéia é aplicar PCA na base de aprendizagem e encontrar os principais autovetores da base. Abordagem filter, visto que o algoritmo de aprendizagem não é utilizado. Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti

Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti PCA Note que após o PCA, os dados se encontram em um novo espaço de representação. Apesar de uma possível redução, todas as características devem continuar sendo extraídas / usadas. O custo da extração de características não é alterado Somente o custo do algoritmo de aprendizagem. Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti

Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti PCA Exemplo AUTOVETORES -0.6779 -0.7352 -0.7352 0.6779 AUTOVALORES 1.2840 0.0491 VARIÂNCIA EXPLICADA 96.3181 3.6819 Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti

Análise de Sensibilidade Uma estratégia que pode ser utilizada para reduzir o custo computacional da abordagem wrapper é a Análise de Sensibilidade. A idéia é trocar as características não selecionadas pelo algoritmo de seleção de características pela média calculada na base de aprendizagem. Características Removidas Base de Aprendizagem Médias Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti

Seleção e Aprendizagem É importante ter em mente que o processo de seleção de características deve ser visto como um processo de aprendizagem Sendo assim, é importante utilizar uma base de validação para evitar over-fitting. Quando possível utilize uma base diferente de todas para calcular a função de avaliação Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti

Algoritmos Genéticos para Seleção de Características Devido ao poder de explorar grandes espaços de busca, algoritmos genéticos tem sido largamente utilizados em problemas de seleção de características Um objetivo (desempenho ou um índice qualquer) Múltiplos objetivos (qtde de características, desempenho, etc..) Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti

Algoritmos Genéticos para Seleção de Características Metodologia comumente utilizada Bit representation, cruzamento de um ponto, mutação bit-flip e elitismo. Fitness Desempenho Quantidade de características selecionadas Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti

Algoritmos Genéticos para Seleção de Características Abordagem baseada em Pareto Converge para o Pareto Uso de uma base de validação é importante. Reconhecimento de Padrões – Algoritmos Genéticos PUCPR-PPGIa - Prof. Luiz Eduardo S. Oliveira

Algoritmos Genéticos para Seleção de Características Reconhecimento de Padrões UFOP-PPGCC - Prof. David Menotti