Seleção de Gabaritos TBL usando Algoritmos Genéticos

Slides:



Advertisements
Apresentações semelhantes
Unidade VII Algoritmos Genéticos
Advertisements

Parte II - Sistemas de Aprendizado: Overview Seminários 2007 – 2º Semestre Maíra Gatti.
Agenda Introdução Justificativa Objetivo Detecção de Spam
Algoritmos Genéticos Alex F. V. Machado. Algoritmos Genéticos Quanto melhor um indivíduo se adaptar ao seu meio ambiente, maior será sua chance de sobreviver.
Mineração de Dados Avaliação de Classificadores
Optimization and Decision Support Techniques FUNDAMENTOS DE ALGORITMOS GENÉTICOS Pedro Miguel A. S. Melo FEUP – Fevereiro de 2008.
Fundamentos dos Algoritmos Genéticos Alex F. V. Machado.
Algoritmos Genéticos Alex F. V. Machado. Algoritmos Genéticos Quanto melhor um indivíduo se adaptar ao seu meio ambiente, maior será sua chance de sobreviver.
Aprendizado de Máquina
Algoritmos Construtivos
I Iterated Local Search Helena R. Lorenço, Olivier Martinz
Hyper-Heurísticas.
Algoritmos Genéticos Marcone Jamilson Freitas Souza
Computação Evolutiva: Programação Genética
Computação Evolutiva: Estratégias Evolutivas
Otimização de Funções Contínuas via Algoritmos Genéticos Adaptado do trabalho realizado por: Frederico Heitor Mônica do Amaral.
Reconhecimento de Padrões Seleção de Características
Otimização de Funções Contínuas via Algoritmos Genéticos
Reconhecimento de Padrões Computação Evolutiva
Algoritmos Genéticos Jorge H. C. Fernandes Setembro de 1998.
Inteligência Artificial
Ordenação Facilitar e aumentar a eficiência das operações de pesquisa sobre esses dados Pode ser crescente ou decrescente A seqüência de entrada, normalmente,
Ordenação Facilitar e aumentar a eficiência das operações de pesquisa sobre esses dados Pode ser crescente ou decrescente A seqüência de entrada, normalmente,
Inteligência Artificial Câmpus de Uruguaiana - PUCRS
Algoritmos Genéticos Rômulo Ferreira Douro.
Algoritmos Genéticos - Capítulo 10 Representação Numérica
Métodos Populacionais
Controle de parâmetros em algoritmos evolucionários
A Framework for Robots Development and Programming Based on Genetic Algorithms Palmeira P.F.M Silvino J.S. de Melo J.C.D DEE-UFMG DELT-UFMG.
Otimização Prof. Benedito C. Silva IRN UNIFEI
I Iterated Local Search Helena R. Lorenço, Olivier Martinz
1 Computação Evolucionária em Machine Learning Prof. Marco Aurélio C. Pacheco.
Cícero Nogueira dos Santos Ruy Luiz Milidiú
Marcus Vinicius Silva Soares Orientador: Luiz Merschmann Outubro / 2010.
Métodos Populacionais
Anne Magály de PaulaCanuto DIMAp/UFRN
Algoritmos Evolutivos Algoritmos Genéticos Introdução
Seleção de Atributos Ricardo Prudêncio.
O PROBLEMA DE SCHEDULING EM JOB-SHOP
Inteligência Artificial
Programação Evolutiva e Lógica Fuzzy
Orientador: Dr. Marcos Marcelino Mazzucco
DESAFIO Distinguir os sintagmas preposicionados (PP= Prepositional Phrases) que são complementos de verbos dos que são adjuntos. Ele trabalha em publicidade.
Projeto Final MCI 2004 Filtragem de s Agente de Classificação de SPAM.
Aprendizado não-supervisionado
A Lexicon-Enhanced Method for Sentiment Classification: An Experiment on Online Product Reviews Bruno Andrade.
1 2º Ciclo de Estudos – Mestrado Informática Médica Docente: Inês Dutra Alunos: João Janeiro Luis Martinez Ricardo Casal Disciplina: Sistemas de Apoio.
Correferências Pronominais na 3ª Pessoa do Singular INF2915 Prof.: Ruy Milidiu.
Classificação de Texto Baseada na aula de Henrique Borges e Ícaro Medeiros Alterada por Flávia Barros.
Uma Interface em Linguagem Natural em Português para Pergunta-Resposta na Web Grupo de Inteligência Computacional Mestrado em Ciência da Computação Aluno:
Aprendizagem Automática Uma Introdução Cristina Mota Instituto Superior Técnico L2F Inesc-ID New York University.
Categorização de Documentos Mariana Lara Neves CIn/UFPE.
Computação Evolutiva : Um Novo Paradigma Para a Resolução de Problemas Complexos Aurora Pozo Pós-graduação em Informática, Pós-graduação em Métodos Numéricos.
E-Commerce, Systems Performance Evaluation, and Experimental Development Laboratory A Model Checking Methodology for E-commerce Systems Adriano Machado.
Classificação Probabilística com TBL Cícero Nogueira dos Santos Pontifícia Universidade Católica do Rio de Janeiro – PUC-Rio Departamento de Informática.
Resolução de Anáforas Pronominais Apresentação da Proposta de Projeto Pontifícia Universidade Católica do Rio de Janeiro Departamento de Informática INF.
Algoritmos Genéticos Ricardo Prudêncio.
Classificação de Textos
Correferências Pronominais na 3ª Pessoa do Singular INF2915 Prof.: Ruy Milidiu Guylerme Velasco, Roberta Claudino, Thiago Ribeiro.
Rogério Ishibashi Orientador: Cairo L. Nascimento Jr.
Inteligência Artificial
Algoritmos e Programação I
Computação Evolutiva Nome dado ao estudo de algoritmos cuja inspiração é o processo de evolução natural das espécies. Origem: trabalho de um pesquisador.
Detecção de tráfego Skype na Web através de Redes Neurais Artigo Original: Freire, P. E., Ziviani, A., and Salles, R. M. (2008). Detecting skype flows.
Algoritmos Genéticos ÝIntrodução ÝHistórico ÝAlgoritmo Genético Básico: 3Representação de um indivíduo 3Função de aptidão 3Operadores genéticos 3Critério.
Algoritmos Genéticos Uma visão geral do método Cláudio M. N. A. Pereira.
Taís Sineiro Herig Laboratório de Genômica e Expressão / UNICAMP
Métodos Populacionais. Mantém um conjunto de soluções candidatas e não só uma solução Cada solução será modificada e avaliada Hill-Climbing paralelos.
1 Problemas Numéricos com Representação por Números Reais Prof. Marco Aurélio C. Pacheco.
Universidade do Sul de Santa Catarina Ciência da Computação Técnicas de Inteligência Artificial Aula 10 Algoritmos Genéticos Max Pereira.
Transcrição da apresentação:

Seleção de Gabaritos TBL usando Algoritmos Genéticos Pontifícia Universidade Católica do Rio de Janeiro – PUC-Rio Departamento de Informática Laboratório de Engenharia de Algoritmos e Redes Neurais - LEARN Seleção de Gabaritos TBL usando Algoritmos Genéticos Julio Cesar Duarte Cícero Nogueira dos Santos Ruy Luiz Milidiú

Transformation-Based Learning Sumário TBL – Revisão Gabaritos TBL Algoritmos Genéticos Modelagem Experimentos e Resultados Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

O algoritmo TBL Corpus de Treino não etiquetado Corpus de Treino etiquetado corretamente Gabaritos Corpus de Treino atual Derivação e avaliação das regras candidatas Classificador Inicial Seleção da regra a ser aplicada Aplicação da regra ao corpus de treino. Seqüência de regras aprendidas. Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

pos[-1] pos[0] word[0] pos[1] Gabaritos Termo atômico pos[-1] pos[0] word[0] pos[1] O jovem esqueceu a caneta ART N V ART N ART ADJ V ART N Regra: pos[-1]=ART pos[0]=ADJ word[0]=jovem pos[1]=V -> pos[0]=N Interpretação: SE pos[-1]=ART E pos[0]=ADJ E Word[0]=jovem E pos[1]=V ENTÃO pos[0]=N Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Transformation-Based Learning Gabaritos Combinação de features relevantes Construídos manualmente Construção depende de um especialista no domínio Trabalho intensivo Adaptações podem ser necessárias quando mudamos de uma língua p/ outra. Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Geração de gabaritos usando GA Motivação Evitar o uso do especialista, ou, Facilitar o trabalho do especialista Proposta Usar algoritmos genéticos Modelagem simples visando a eficiência Usar varias estratégias de modelagem Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Transformation-Based Learning Algoritmos Genéticos Modelos Computacionais inspirados no mecanismo da evolução Cromossomo  Indivíduo (Possível Solução) Problema de otimização Codificação do problema Função de avaliação Heurística = Aplicação de operadores genéticos Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Codificação do Problema (Indivíduo/Cromossomo) Normalmente, cadeia de 0´s e 1´s Indicam a presença, ou não, de uma característica (feature) f1 f2 f3 f4 ... fn 1 Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Transformation-Based Learning Função de Avaliação Tem como argumento um indivíduo e calcula a aptidão do indivíduo. Aptidão = medida de desempenho do indivíduo no problema Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Transformation-Based Learning Operadores Genéticos Operadores de Seleção: Decidem, baseados no fitness, os “melhores” indivíduos Persistem na população Utilizados pelos outros operadores Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Transformation-Based Learning Operadores Genéticos Operadores de Recombinação: Criam “novos” indivíduos a partir de indivíduos selecionados Cruzamento: Combina frações de indivíduos em novos Mutação: Gera uma pequena alteração em um indivíduo Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Algoritmos Genéticos - Funcionamento Gerar população inicial Calcular aptidão de cada indivíduo Enquanto critério_de_parada == False: Selecionar melhores indivíduos (descartar demais indivíduos, menos aptos) Aplicar operadores de reprodução Aplicar operadores de mutação Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Modelagem 4 abordagens para seleção de gabaritos: Cada uma carrega uma quantidade de conhecimento diferente Conhecimento ( ) x Desempenho ( ) Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

(1) Janela de contexto fixa Gabaritos formados por TAs da forma mais simples f[ds] Entrada: Lista de features, maxOffset, número de templates e tamanho esperado do template. Saída: Seqüências de f[ds] onde ds Є {-maxOffset,+maxOffset} Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Transformation-Based Learning Exemplo (FCW) Features = {f1, f2}, maxOffset = 1 2 gabaritos com tamanho esperado 3 Gabaritos gerados: f1[-1] f1[+1] f2[-1] f2[+1] f2[-1] f2[0] Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Transformation-Based Learning (2) Lista fixa de TAs É mais fácil construir TAs do que gabaritos. Gabaritos formados por qualquer tipo de TAs Entrada: Lista de TAs (L), número de gabaritos e tamanho esperado do gabarito. Saída: Seqüências de TA’s onde TA Є L Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Transformation-Based Learning Exemplo (FLAT) TAs = {f1[−1], f1[−2], f2[0], f2[1], f1[1, 2], f2[−3,−1]} 2 gabaritos com tamanho esperado 3 Gabaritos gerados: f1[−2] f2[0] f2[−3,−1] f1[−1] f2[0] f1[1, 2] Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

(3) Gabarito com tamanho máximo Muito similar ao anterior No lugar de um tamanho esperado, tem-se um tamanho máximo para o gabarito Valor do cromossomo indica posição na lista -1  ausência de TA Valores repetidos são descartados Entrada: Lista de TAs (L), número de gabaritos e tamanho máximo do gabarito Saída: Seqüências de TA’s onde TA Є L Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Transformation-Based Learning Exemplo (MTS) TAs = {f1[−1], f1[−2], f2[0], f2[1], f1[1, 2], f2[−3,−1]} 3 gabaritos com tamanho máximo 4 Gabaritos gerados: f1[−2] f2[1] f1[−1] f2[−3,−1] f1[−2] f2[1] f2[0] f1[−2] f2[0] f2[1] Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Transformation-Based Learning (4) Lista de gabaritos Tentativa de melhorar trabalho do especialista Nova combinação de gabaritos já construídos TBL é uma heurística gulosa  inserir um novo gabarito pode piorar o desempenho global Entrada: Lista de gabaritos (T) e número esperado de gabaritos Saída: Subconjunto de T Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Transformation-Based Learning Exemplo (TL) T = {τ00, τ01, τ02, τ03, τ04, τ05, τ06, τ07, τ08, τ09, τ10, τ11} Número de gabaritos esperado = 7 Gabaritos gerados: {τ00, τ02, τ05, τ06, τ08, τ09, τ10}. Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Transformation-Based Learning Modelagem Função de avaliação Um conjunto de regras TBL é gerado a partir de cada indivíduo Aptidão = F1-score medido num conjunto de validação F1-score = Média Harmônica entre a precisão e abrangência Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Transformation-Based Learning Modelagem Operadores: Cruzamento: Quebra de dois indivíduos em ponto aleatório Mutação: Troca aleatória de um valor no dna: 0  1 e vice-versa MTS: x  [-1, número de termos atômicos - 1] Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Experimentos – Tarefas English Text Chunking [NP He ] [VP reckons ] [NP the current account deficit ] [VP will narrow ] [PP to ] [NP only # 1.8 billion ] [PP in ] [NP September ] onde: NP = Noun Phrase; VP = Verb Phrase; PP = Prepositional Phrase Chunk English Noun Phrase Chunking [NP He ] reckons [NP the current account deficit ] will narrow to [NP only # 1.8 billion ] in [NP September ] Portuguese Named Entity Extraction [PER Bill Gates] é, em parceria com sócio [PER Paul Allen], o fundador da [COM Microsoft]. Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Transformation-Based Learning Experimentos Divisão do corpus Treinamento Pequenas frações separadas para o treinamento do genético Teste Resultados reportados Medida-F no conjunto de teste Tempo total de treinamento Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Transformation-Based Learning Resultados BNP - FCW Resultados muito bons, com tempo de treinamento compatíveis Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Resultados BNP – MTS e FLAT Comportamentos similares Aumento na performance e tempo de treinamento Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Transformation-Based Learning Resultados BNP - TL Resultados um pouco melhores que o humano Aumento no tempo de treinamento Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Resultados condensados CK e NE Resultados similares ao BNP NE resultados melhores mesmo com modelagens mais simples Aumento no tempo de treinamento 1 x 100 (alto relativamente, porém baixo em valores absolutos) Gabaritos gerados por humanos são bem específicos Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Transformation-Based Learning Considerações GA TBL Construção de gabaritos é um processo caro Método automático de criação/seleção de gabaritos Resultados muito melhores que BLS Perda de desempenho aceitável Tempo de treinamento compatíveis: Algumas vezes, MENOR maior, apenas caso não se incorpore o tempo de intervenção do especialista Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Referências bibliográficas BRILL, E. Transformation-based error-driven learning and natural language processing: A case study in part-of-speech tagging. Computational Linguistics, 21(4):543–565, 1995. BRILL, E. Recent Advances in Parsing Technology, chapter Learning to Parse With Transformations. Kluwer Academic Publishers, 1996. DAY, David; Aberdeen, John; Hirschman, Lynette; Kozierok, Robyn; Robinson, Patricia ; and Vilain, Marc. Mixed-Initiative Development of Language Processing Systems. In Fifth Conference on Applied Natural Language Processing, 1997, pp. 348–355. ACL FLORIAN, R., HENDERSON, J. e NGAI, G. Coaxing confidence from an old friend: Probabilistic classifications from transformation rule lists. Em Proceedings of EMNLP/VLC-2000, Hong Kong, October 2000. HIGGINS, Derrick. A transformation-based approach to argument labeling. CoNLL 2004. MANGU, L. e BRILL, E. Automatic rule acquisition for spelling correction. Em Proceedings of The Fourteenth International Conference on Machine Learning, ICML 97. Morgan Kaufmann, 1997. Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017

Referências bibliográficas MEGYESI, B. Shallow parsing with pos taggers and linguistic features. Journal of Machine Learning Research, 2:639–668, 2002. NGAI, G. e FLORIAN, R. Transformation-based learning in the fast lane. In Proceedings of North American Chapter of the Association for Computational Linguistics, págs. 40–47, June 2001. Projeto Lácio Web. Link: ttp://www.ilccmcspracioweb RAMSHAW, L. e MARCUS, M. Text chunking using transformation-based learning. In Proceedings of the Third Workshop on Very Large Corpora, págs. 82–94, New Jersey, USA, 1995. ACL. SAMUEL, K., CARBERRY, S. e VIJAY-SHANKER, K. Dialogue act tagging with transformation-based learning. Em Proceedings of COLING/ACL’98, págs. 1150–1156, 1998. SANTOS, Cícero Nogueira dos. Aprendizado de Máquina na Identificação de Sintagmas Nominais: O caso do Português Brasileiro. Dissertação de Mestrado, IME, Rio de Janeiro, 2005. WILLIAMS, Ken; Dozier, Christopher and McCulloh, Andrew. Learning Transformation Rules for Semantic Role Labeling. CoNLL 2004. Transformation-Based Learning Seminário apresentado na disciplina Aprendizado de Máquina – PUC-Rio/DI – 18 de abril de 2017