Rogério Ishibashi Orientador: Cairo L. Nascimento Jr.

Slides:

Advertisements

Apresentações semelhantes

Análise e Projeto de Sistemas I

Advertisements

Análise e Projeto de Sistemas III

Agenda Introdução Justificativa Objetivo Detecção de Spam

Administração de Sistemas de Informação

INTELIGÊNGIA COMPUTACIONAL

EXPERIÊNCIA NO DESENVOLVIMENTO DE UM SISTEMA ESPECIALISTA FUZZY DE AUXILIO A DIAGNÓSTICO DE HIDROGERADORES NA ELETRONORTE.

Ronaldo Gilberto de Oliveira

Modelos Matemáticos utilizados na PO

Redes Neurais Artificiais

Mineração de Dados ou Descoberta de conhecimento em BDs

5. MODELAGEM: PLANTAS E PROCESSOS - 1

Inteligência Artificial

Prof. Dr. Cairo L. Nascimento Jr.

Prof. Dr. Cairo L. Nascimento Jr.

INTELIGÊNCIA TECNOLÓGICA Aplicações desenvolvidas no ITA

KDD + IA Técnicas de IA em Descoberta de Conhecimento em Bancos de Dados set/2002.

Simulação de Sistemas Prof. MSc Sofia Mara de Souza AULA2.

Estruturação e Desenvolvimento de

Instituto Tecnológico da Aeronáutica – ITA Divisão de Ciência de Engenharia Eletrônica e Computação EE-09 Inteligência Artificial Prof. Adilson Marques.

Davyd Bandeira de Melo Um Sistema de Reconhecimento de Comandos de Voz Utilizando a Rede Neural ELM Junho 2011.

A Framework for Robots Development and Programming Based on Genetic Algorithms Palmeira P.F.M Silvino J.S. de Melo J.C.D DEE-UFMG DELT-UFMG.

Modelagem, Análise e Decisão em Sistemas de Transporte Ferroviário

Otimização Prof. Benedito C. Silva IRN UNIFEI

Classificação. Classificação: Atribuição a uma classe (rótulo de um atributo categórico). Classifica dados (constrói um modelo) baseado em um conjunto.

ENGENHARIA DE PRODUÇÃO Disc. : Gerência de Manutenção Prof

A Hybrid Method for Robust Car Plate Character Recognition.

Segurança e auditoria de sistemas

Alexis Adriano da Silva Vitek Consultoria Ltda.

Fundação de Pesquisa de Ferrovias CENTRO DE INTELIGÊNCIA DE FERROVIAS TECNOLOGIAS FERROVIÁRIAS Inovações Tecnológicas.

Aprendizado de Máquina - Introdução

Data Mining: A arte de minerar conhecimento. Roteiro Visão do Problema –Introdução 1 –Motivação 2 Desafios Tecnologias: –Algoritmos de otimização de mineração.

Redes Bayesianas - Aplicação em Risco Operacional

Tópicos especiais em controle inteligente e distribuído Professor: Jorge Dantas de Melo Rafael Marrocos Magalhães.

Marcílio C. P. de Souto DIMAp/UFRN

Reconhecimento e Verificação de Assinaturas

Extração de Regras de RNA Wilian Soares Lacerda Fevereiro de 2003.

Programação Evolutiva e Lógica Fuzzy

Gestão de defeitos.

METODOLOGIA, MÉTODOS E FERRAMENTAS

Interpolação e Ajuste de Curvas

 Solucionar de forma otimizada os problemas que exijam alto esforço computacional e assim assegurar a satisfação dos clientes.

Testes Baseados Em Riscos: Uma revisão do Estado-da- Arte Nielson Pontes Outubro, 2010.

Prof. MSc. Cláudio Cabral

Best Combination of Binarization Methods for License Plate Character Segmentation (2013) - Resumo Vinicius Queiroz e Vinicius M. de Almeida.

Regressão e Previsão Numérica.

SISTEMAS DE APOIO À DECISÃO - SAD

Programação Evolutiva e Lógica Fuzzy CMP 135 Arquiteturas Especiais de Computadores Fauzi Shubeita - UFRGS 2004.

Classificação de Texto Baseada na aula de Henrique Borges e Ícaro Medeiros Alterada por Flávia Barros.

CI202Y - Métodos Numéricos Nelson Suga 2010

Capítulo 3: Analisando Processos de Decisão de Negócios

Laboratório de Mecatrónica/IST - COPPE Elétrica/UFRJ

Capítulo 9: SAD orientado a Modelo

HAC 1 MD - junho/2008 Tecnologias de suporte à Mineração de Dados Gerenciamento de dados Data Warehouse OLAP Arquiteturas Visualização Sistemas de Suporte.

METHONTOLOGY Sandro Rautenberg

1 Linguagens de Programação Pedro Lopes 2010/2011.

Feature Learning for Image Classification via Multiobjective Genetic Programming Seminários de Inteligência Artificial Felipe de Paula Wanderley Barros.

Projeto de um Algoritmo Genético Híbrido para Planejamento Operacional de Curto Prazo de Minerações a Céu Aberto Robert Fabricio Subtil.

Classificação de Textos

Introdução à Inteligência Artificial Prof. Cláudio M. N. A. Pereira.

Abordagem Sistemática Guilherme Amaral Avelino Avaliação e Controle de Sistemas de Informação.

Professora Michelle Luz

SOFTWARE DE ESTATÍSTICAS PARA BASQUETE EM CADEIRA RODAS ESTUDO DE CASO ADFP - FÊNIX Acadêmicos: Elisangela Fernandes Duarte Sandro Colaço de Lima Orientador:

DINÂMICA DE ESTRUTURAS E AEROELASTICIDADE Prof. Airton Nabarrete

ITA - Instituto Tecnológico de Aeronáutica Arquiteturas Programáveis de uma Máquina de Inferência Fuzzy em Tecnologia CMOS Autor: Leonardo Mesquita Orientador:

TÉCNICAS DE ESTIMATIVAS

Lenylda Albuquerque ISO Processos de Ciclo de Vida de Software Universidade Federal de Pernambuco.

MAPS: Um Modelo de Adaptação de Processos de Software Ciro Carneiro Coelho Orientador Prof. Hermano Perrelli de Moura.

Taís Sineiro Herig Laboratório de Genômica e Expressão / UNICAMP

INTELIGÊNCIA EMPRESARIAL Aula 6 – Componentes dos Sistemas de Apoio à Decisão.

Sistemas de Informação Capítulo 6 O uso consciente da tecnologia para o gerenciamento.

Transcrição da apresentação:

Rogério Ishibashi Orientador: Cairo L. Nascimento Jr. Extração de Conhecimentos com Interpretabilidade Aumentada Utilizando Modelagem Fuzzy e Otimização Multi-objetivo Rogério Ishibashi Orientador: Cairo L. Nascimento Jr. Instituto Tecnológico de Aeronáutica 16/Dez/2013

Roteiro 1. Introdução 2. Revisão Bibliográfica 3. Proposta de Solução: MoGFT-I 4. Estudos de Caso: 4.1 Estimação do tempo de vida de um motor aeronáutico 4.2 Reconhecimento de imagens binárias 7x7 com ruído 4.3 Controle do carro com pêndulo invertido 5. Conclusões finais

1. Introdução Grande quantidade de dados armazenados. Necessidade de programas computacionais para a extração de conhecimentos. Técnicas comuns utilizadas: modelos fuzzy, redes neurais, árvores de decisão, etc. Preocupação na otimização da acurácia e não na interpretação dos modelos.

1. Introdução: Motivação Na definição de regras de forma manual a responsabilidade recai sobre os especialistas. Depende de especialistas experientes que podem ter dificuldade para modelar sistemas complexos. Automatizar a extração de conhecimentos em bases de dados. Gerar modelos com boa precisão e interpretáveis para auxiliar um especialista em sua tomada de decisão. Vantagens de modelos interpretáveis: verificação do conhecimento extraído, aumento da confiança do usuário no modelo.

1. Introdução: Objetivo Árvores de Decisão Lógica Fuzzy Mecanismo Automático Geração de Regras Fuzzy e Calibração de Funções de Pertinência Algoritmos Genéticos Otimização multi-objetivo Acurácia Interpretabilidade Interpretabilidade

Roteiro 1. Introdução 2. Revisão Bibliográfica 3. Proposta de Solução: MoGFT-I 4. Estudos de Caso 4.1 Estimação do tempo de vida de um motor aeronáutico 4.2 Reconhecimento de imagens binárias 7x7 com ruído 4.3 Controle do carro com pêndulo invertido 5. Conclusões finais

2.1 Revisão: Árvores de Decisão (AD) Representação de conhecimento através de uma estrutura em forma de árvore que descreve decisões. - Nó-folha: conclusão. - “dividir para conquistar”; - Particionamento: Ex: Information Gain; - Critérios de poda: Ex: Reduced Error Pruning; - Exemplos: CART, ID3 and C4.5. - Vantagens: autoexplicativas, aprendizado fácil - Desvantagens: pouco tolerante a dados ruidosos, instabilidade, pode exigir muitas regras

2.2 Revisão: Lógica Fuzzy Variável pode assumir infinitos valores entre 0 e 1. Tratamento de incertezas e imprecisões. Dois métodos principais: Mamdani e Sugeno. Temperatura discreta. Temperatura fuzzy: Variáveis linguísticas, Funções de pertinência, Grau de pertinência; - Variáveis linguísticas na entrada/saída. - Vantagens: tolerante a dados ruidosos, trabalha com variáveis linguísticas, tratamento de incertezas e imprecisões, interpretabilidade - Desvantagens: dificuldade de estabelecer regras manualmente, aprendizado, necessita mais simulação e testes

2.3 Revisão: Algoritmos Genéticos Algoritmos de propósito geral que usam os princípios da evolução natural para buscar soluções aproximadas. Problema é codificado em um cromossomo composto por genes - Vantagens: capacidade de busca global, independência de domínio, natureza paralela - Desvantagens: resultados sub-ótimos, tempo de processamento

2.4 Revisão: Sistema Fuzzy Gen. Baseado em Regras Sistema Fuzzy Baseado em Regras apoiado por um processo de aprendizagem genético. RF: Regra Fuzzy, FP: Função de Pertinência - Vantagens: capacidade de aprendizado, todas as vantagens dos sistemas fuzzy - Desvantagens: todas as desvantagens dos algoritmos genéticos

2.5 Revisão: Otimização multi-objetivo Múltiplos objetivos conflitantes são avaliados independentemente através do conceito de dominância. Fronteira de Pareto. NSGA-II (Deb, 2001). x1 domina x2 se e somente se:

2.6 Revisão: Interpretabilidade em Sistemas Fuzzy Permite a representação do conhecimento de forma similar aos conceitos compreendidos por seres humanos (Cannone et al., 2009). Interpretabilidade e acurácia geralmente são conflitantes. Ex: redes neurais. Um modelo fuzzy interpretável é um modelo fácil de ser compreendido, explicado ou descrito por uma pessoa, relacionando o modelo ao seu domínio de conhecimento. - Acurácia e Interpretabilidade são objetivos contraditórios; - Exemplo de contradição: redes neurais artificiais.

2.6 Revisão: Interpretabilidade em Sistemas Fuzzy Condições para interpretabilidade: utilização de funções de pertinência (FP) que façam sentido, número de regras reduzido, utilização de regras compactas, com poucas variáveis. Como medir interpretabilidade? características de alto nível: nº de regras, nº de atributos e nº de FP, características de baixo nível: formato, sobreposição e cobertura das FP. - Baixo nível: relacionado à semântica, formato, sobreposição, cobertura, etc - verificar de maneira fácil e confiável o conhecimento extraído (relacionando isso ao domínio de conhecimento humano)

2.6 Revisão: Interpretabilidade em Sistemas Fuzzy - Tarefa subjetiva; - Depende da experiência e preferências;

Roteiro 1. Introdução 2. Revisão Bibliográfica 3. Proposta de Solução: MoGFT-I 4. Estudos de Caso 4.1 Estimação do tempo de vida de um motor aeronáutico 4.2 Reconhecimento de imagens binárias 7x7 com ruído 4.3 Controle do carro com pêndulo invertido 5. Conclusões finais

3. Proposta de Solução: MoGFT-I MoGFT-I: Multi-objective GFRBS supported by a Decision Tree with improved Interpretability. Dois módulos principais e independentes: Geração de regras, Ajustes nas funções de pertinência. Divididos em 3 fases.

3. Proposta de Solução: MoGFT-I

3. Proposta de Solução: MoGFT-I Fase 1: Geração da Árvore de Decisão. Fase 2: Extração das regras fuzzy. A árvore pode ser podada Variáveis são normalizadas e discretizadas

3. Proposta de Solução: MoGFT-I Fase 3: Algoritmo genético multi-objetivo para os ajustes das funções de pertinência. Função Objetivo 1: Minimizar a complexidade através do cálculo das penalidades das funções de pertinência. Função Objetivo 2: Minimizar erros de aproximação - Depende da aplicação (estudo de caso). - As regras fuzzy não são modeladas no cromossomo

3. Proposta de Solução: MoGFT-I

3. Proposta de Solução: MoGFT-I Avaliação + seleção + recombinação + mutação.

Roteiro 1. Introdução 2. Revisão Bibliográfica 3. Proposta de Solução: MoGFT-I 4. Estudos de Caso 4.1 Estimação do tempo de vida de um motor aeronáutico 4.2 Reconhecimento de imagens binárias 7x7 com ruído 4.3 Controle do carro com pêndulo invertido 5. Conclusões finais

4.1 Estudo de Caso 1: PHM PHM: Prognostic and Health Management. Permite que a confiabilidade de um sistema seja avaliada durante seu ciclo de vida através da predição de seu tempo de vida (RUL – Remaining Useful Life). Benefícios: mitigar os riscos de falha do equipamento, otimizar o planejamento logístico de manutenção, aumentar a segurança operacional de aeronaves. Outros autores utilizam redes neurais

4.1 Estudo de Caso 1: PHM - 100 séries temporais contendo dados de 21 sensores de motores aeronáuticos turbo-hélice - 80/20 14 atributos selecionados no passo 3 Regressão linear com mínimos quadrados e polinômio de primeira ordem (smooth)

4.1 Estudo de Caso 1: PHM Função objetivo 1: Minimizar a complexidade através do cálculo das penalidades. Função objetivo 2: Minimizar os erros de aproximação (aumentar a acurácia): 10 Regras geradas pelo algoritmo de árvore de decisão C4.5 com confidence factor 10-4. - Atributos são normalizados e discretizados - RUL é calculado com valor de defuzzificação - 100 indivíduos, 1000 gerações, 80% recombinação, 40% mutação

4.1 Estudo de Caso 1: PHM Final da execução do Algoritmo Genético Multi-objetivo.

4.1 Estudo de Caso 1: PHM

4.1 Estudo de Caso 1: PHM Exemplo de resultado da aplicação de um dos modelos gerados para os dados de teste.

4.1 Estudo de Caso 1: PHM Curvas de Pareto geradas com diferentes configurações de poda.

Roteiro 1. Introdução 2. Revisão Bibliográfica 3. Proposta de Solução: MoGFT-I 4. Estudos de Caso 4.1 Estimação do tempo de vida de um motor aeronáutico 4.2 Reconhecimento de imagens binárias 7x7 com ruído 4.3 Controle do carro com pêndulo invertido 5. Conclusões finais

4.2 Estudo de Caso 2: Reconhecimento de imagens - Foi gerado um modelo para cada padrão de imagem; - Modelo fuzzy com saída discretizada

4.2 Estudo de Caso 2: Reconhecimento de imagens Quantidade de regras geradas pelo algoritmo C4.5 para diferentes configurações de poda.

4.2 Estudo de Caso 2: Reconhecimento de imagens Função objetivo 1: minimizar a complexidade através dos cálculos das penalidades. Função objetivo 2: minimizar os erros de aproximação. - 300 individuos, 2000 gerações, 80% recombinação, 80% mutação

4.2 Estudo de Caso 2: Reconhecimento de imagens Final da execução do algoritmo genético multi-objetivo. Caracter ‘2’ Sem poda 19 Regras 9 soluções

4.2 Estudo de Caso 2: Reconhecimento de imagens Combinação de classificadores:

4.2 Estudo de Caso 2: Reconhecimento de imagens Curvas de Pareto geradas para a combinação de classificadores.

4.2 Estudo de Caso 2: Reconhecimento de imagens Imagens com 8% de ruídos. Imagens com 10% de ruídos.

4.2 Estudo de Caso 2: Reconhecimento de imagens Testes com diferentes níveis de ruído em 5% e 8%.

4.2 Estudo de Caso 2: Reconhecimento de imagens Média e desvio padrão das penalidades das 16 soluções. Distribuição das penalidades das 16 soluções.

Roteiro 1. Introdução 2. Revisão Bibliográfica 3. Proposta de Solução: MoGFT-I 4. Estudos de Caso 4.1 Estimação do tempo de vida de um motor aeronáutico 4.2 Reconhecimento de imagens binárias 7x7 com ruído 4.3 Controle do carro com pêndulo invertido 5. Conclusões finais

4.3 Estudo de Caso 3: Controle Controle do carro com pêndulo invertido. Problema não linear. Planta instável. Desafio é manter o pêndulo equilibrado na posição vertical e deslocar o carro para a origem.

4.3 Estudo de Caso 3: Controle Ângulo do pêndulo ( ). Velocidade angular do pêndulo ( ). Posição do carro ( ). Velocidade do carro ( ). Massa do carro (M): 1,0 kg. Massa do pêndulo (m): 0,1 kg. Comprimento do pêndulo (2l): 1,0 m. Gravidade (g): 9,8 m/s2.

4.3 Estudo de Caso 3: Controle Dado um controlador qualquer ja existente para o pêndulo, deseja-se utilizá-lo como suporte ao aprendizado do método MoGFT-I. Pode ser um controlador humano

4.3 Estudo de Caso 3: Controle Problema de regulação. Dados de treinamento gerados pelo controlador do Simulink/Matlab.

4.3 Estudo de Caso 3: Controle Fase 1: variáveis de entrada e de saída normalizadas e discretizadas em negative, medium, positive. Regras geradas pelo algoritmo de AD C4.5:

4.3 Estudo de Caso 3: Controle Equações para o cálculo dos erros de aproximação. ,

4.3 Estudo de Caso 3: Controle Final da execução do algoritmo genético multi-objetivo.

4.3 Estudo de Caso 3: Controle Solução com 0 penalidades Solução com 2 penalidades

4.3 Estudo de Caso 3: Controle Simulação com estado inicial em = (0o; 0o/s; 1,0 m; 0 m/s). Solução com 0 penalidades Solução com 2 penalidades

4.3 Estudo de Caso 3: Controle Simulação com estado inicial em = (0o; 0o/s; 0,2 m; 0 m/s).

4.3 Estudo de Caso 3: Controle Diagrama de fases com estado inicial em: = (0o; 0o/s; 1,0 m; 0 m/s).

4.3 Estudo de Caso 3: Controle Simulação com estado inicial em = (0o; 0o/s; 1,0 m; 0 m/s).

Roteiro 1. Introdução 2. Revisão Bibliográfica 3. Proposta de Solução: MoGFT-I 4. Estudos de Caso 4.1 Estimação do tempo de vida de um motor aeronáutico 4.2 Reconhecimento de imagens binárias 7x7 com ruído 4.3 Controle do carro com pêndulo invertido 5. Conclusões finais

5. Conclusões finais: Principais Contribuições Concepção do método MoGFT-I. Método com módulos independentes. Utilização de algoritmo multi-objetivo para otimização da acurácia e da interpretabilidade. Análise através das curvas de Pareto. Aplicação em problemas relevantes. MoGFT-I realiza aprendizado das regras e calibração das funções de pertinência de forma automática. Fornece um conjunto de soluções ao especialista com diferentes tradeoffs

5. Conclusões finais: Principais Contribuições Publicações geradas até o momento: Knowledge extraction using a genetic fuzzy rule-based system with increased interpretability. IEEE International Symposium on Applied Machine Intelligence and Informatics, Herl’any, Slovakia, 2012 (IEEE SAMI 2012). GFRBS-PHM: A genetic fuzzy rule-based system for PHM with improved Interpretability. IEEE International Conference on Prognostics and Health Management, Gaithersburg, USA, 2013 (IEEE PHM 2013).

5. Conclusões finais: Considerações Finais Os resultados obtidos cumpriram com o objetivo proposto. Foi mostrado a relevância da otimização multi-objetivo para avaliar funções conflitantes. As capacidades do método MoGFT-I puderam ser demonstradas em diferentes áreas. Finalmente, espera-se que esta pesquisa possa servir de inspiração para futuros trabalhos.

Fim Obrigado a todos.