Universidade Federal de Uberlândia - UFU

Slides:



Advertisements
Apresentações semelhantes
Agenda Introdução Justificativa Objetivo Detecção de Spam
Advertisements

Modelos e Sistemas de Reputação
Experiments with Clustering as a Software Remodularization Method Nicolas Anquetil and Timothy C. Lethbridge University of Ottawa, Canada WCRE 1999:
1 As Tecnologias da Informação na Administração Pública Indicadores Estatísticos Instituto de Informática Rosa Maria Peças Conferência A acessibilidade.
AVALIAÇÃO DE ALGORITMOS DE STEMMING PARA A LÍNGUA PORTUGUESA.
RECONHECIMENTO DE CARACTERES MANUSCRITOS APLICANDO REDES NEURAIS
Damas3D Programação em Lógica Nelson Jorge Silva Rodrigues – ei00070
Controlo e Aprendizagem (Ciências do Desporto e E.Especial e Reabilitação) Aula teórica 3/1 Teoria da Informação Shannon & Weaver (1949) Quantificar a.
ENGENHARIA DE MÉTODOS Prof. Adolfo Sérgio Furtado da Silva
Algoritmos Genéticos Alex F. V. Machado.
Aprendizado de Máquina
2/18/2014Mestrado em Ciencia da Computacao Tópicos Especiais Mineração de Dados Profa. Sandra de Amo Mestrado em Ciência da Computação Faculdade.
Inteligência Artificial
Inteligência Artificial
ArchC: Uma linguagem de descrição de arquiteturas
IA em jogos modelagem de comportamento de personagens
Reconhecimento de Padrões Seleção de Características
Reconhecimento de Padrões Computação Evolutiva
FACENS – Engenharia da Computação Inteligência Artificial
INTRODUÇÃO À PROGRAMAÇÃO
Localização em Redes Wireless Ad Hoc: Infra-estrutura e Algoritmos
Othelo Alunos: Sávio Mendes de Figueiredo
Trabalho de Inteligência Artificial
Programação Dinámica Análise de algoritmos UNISUL
Jogo de Damas Alex Saito Leonardo Bezerra Bruno Rocha Maria Gabriela
Carlos Alberto de Freitas Pereira Júnior
Composição e Geração de Aplicações usando Aspectos
Inteligência Artificial
Lidando com cheating em uma arquitetura multiservidor para MMOGs
1 Felipe L. SeverinoPDP Enhancing Grids for Massively Multiplayer Online Computer Games Felipe L. Severino Programação com Objetos Distribuídos paralela.
Busca Competitiva - MiniMax Jogo-da-Velha
E. B. 2, 3 Jose Maria dos Santos Prof. Sandra Sousa
Davyd Bandeira de Melo Um Sistema de Reconhecimento de Comandos de Voz Utilizando a Rede Neural ELM Junho 2011.
A Framework for Robots Development and Programming Based on Genetic Algorithms Palmeira P.F.M Silvino J.S. de Melo J.C.D DEE-UFMG DELT-UFMG.
I.A. – Inteligência Artificial
Inteligência Artificial
Universidade Federal do Rio Grande do Sul Instituto de Informática
Aprendizado Baseado em Instâncias – Algoritmo k-NN
Algoritmos Culturais.
Lígia Maria Soares Passos Aluna Stéphane Julia Orientador
II Workshop de Dissertação Pós-Graduação em Ciência da Computação Faculdade de Computação – FACOM Universidade Federal de Uberlândia – UFU Dezembro/2008.
Aluno: Lucas Bucci da Silveira Orientador: Carlos Roberto Lopes
Aluno: Rodolfo A. L. Costa Orientador: Prof. Frederico G. Guimarães
Marcus Vinicius Silva Soares Orientador: Luiz Merschmann Outubro / 2010.
Uso de Sistemas Imunológicos Artificiais para Detecção de Falhas em Plantas da Indústria de Petróleo. Aluno: Alexandre Willig Quintino dos Santos Orientador:
ENGENHARIA DE PRODUÇÃO Pato Branco/Pr – 05 de julho de 2013
Busca Contra Adversário ou Jogos
Aprendizagem de Máquina “Learning a Neural Tree” Paulo Amorim - prfa.
TÉCNICAS DE PROGRAMAÇÃO
Prof. Celso Cardoso Neto. (2) ALINHAMENTO Caso 1.
Disciplina Inteligência Artificial Defesa de Projeto Período
Redes Neuronais/Neurais/ Conexionistas Introdução
Seleção de Atributos Ricardo Prudêncio.
1 A COMPUTAÇÃO MODERNA Valdemar W. Setzer Depto. de Ciência da Computação da USP
Nome alunos 1 Título UC. Título – slide 2 Conteúdo Conteúdo 2.
Construção e Análise de Algoritmos
Apresentação da Disciplina Inteligência Artificial/Computacional
Campus de Caraguatatuba Aula 16e: Exercícios de View
Projeto e Implementação de Jogos Eletrônicos
Universidade Federal de Lavras Departamento de Ciência da Computação
Categorização de Documentos Mariana Lara Neves CIn/UFPE.
CIn/UFPE1 Categorização de Documentos e Preparação de Dados Mariana Lara Neves Flávia Barros (participação mínima) CIn/UFPE.
Luana Bezerra Batista Redes Neurais Luana Bezerra Batista
Busca Competitiva Disciplina: Inteligência Artificial
Mestrando Gabriel G. Detoni Orientador Prof. Dante Barone Controle para Futebol de Robôs Utilizando Processamento Paralelo Seminário de Andamento.
Eduardo Matos (ejvm) Leonardo Vilaça (lhvs) Igor Ebrahim (ies) Thiago Gomes (tgr)MW
Computação Evolutiva Nome dado ao estudo de algoritmos cuja inspiração é o processo de evolução natural das espécies. Origem: trabalho de um pesquisador.
Alan Mateus Vieira Neves Mestrando em Ciência da Computação Prof. Dr. Ricardo Massa Orientador Um framework estratégico para tomada de decisão em ambiente.
IA em Jogos Clássicos Informalmente, a inteligência aplicada em jogos clássicos (xadrez, dama, reversi, etc) consiste em, dada uma configuração do tabuleiro,
Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 12 Aprendizado não Supervisionado Mapas auto-organizáveis Max Pereira.
Transcrição da apresentação:

Universidade Federal de Uberlândia - UFU Faculdade de Computação Mestrado em Ciências da Computação Uma proposta para resolver o problema de loop no LSDraughts e no VisionDraughts: criação de um jogador de final de jogo Valquíria Ap. Rosa Duarte Orientadora: Profa. Dra. Rita Maria Silva Julia

Estrutura da apresentação Introdução e motivação Trabalhos relacionados Proposta - Jogador de final de jogo Resultados esperados Cronograma Referências II Workshop de Dissertações – Mestrado em Ciência da Computação

Introdução e Motivação Jogador baseado nos jogadores NeuroDraughts e LS-VisionDraughts Problemas de loop encontrado nesses jogadores Empate de jogos que estão em condições de vitória Melhoria da eficiência dos jogadores II Workshop de Dissertações – Mestrado em Ciência da Computação

Trabalhos relacionados Jogos de tabuleiros: NeuroDraughts LS-Draughts VisionDraughts Chinook Anaconda GO II Workshop de Dissertações – Mestrado em Ciência da Computação

NeuroDraughts Utiliza o mínimo de intervenção possível Regras do jogo e conjunto de características Aprendizado por TD(λ) e aprendizagem por reforço Influência das características Treinamento por self-play com clonagem II Workshop de Dissertações – Mestrado em Ciência da Computação

LS-Draughts Extensão do NeuroDraughts Características selecionadas através de AG Sistema gerador de agentes jogadores Busca minimax Presença de loops Longo período de treinamento II Workshop de Dissertações – Mestrado em Ciência da Computação

LS-Draughts - Mapeamento por Características

VisionDraughts Altera a arquitetura do NeuroDraughts: Substitui minimax por busca eficiente com poda alfa- beta, tabela de transposição e iterative deepening Acrescenta base de dados de final de jogo Redução em 95% do tempo de busca Menor incidência de loops II Workshop de Dissertações – Mestrado em Ciência da Computação

Outros jogadores Chinook: Anaconda: Go: Campeão mundial homem-máquina Forte conhecimento humano - Marion Tinsley Ajuste manual das funções Usado para testar a eficiência do jogador de final de jogo Anaconda: Mínimo de intervenção humana possível Aprendizado baseado em Redes Neurais Presença de loops Go: Generalized thermography II Workshop de Dissertações – Mestrado em Ciência da Computação

Nossa proposta – Jogador de final de Jogo Ordenação parcial em todos os nós da árvore de busca Aumentar o número de podas Alcançar maior profundidade de busca (look ahead) Aumentar a visão do jogador Criação de uma segunda rede neural MLP Agente de final de jogo Base de dados – Redes de Kohonen II Workshop de Dissertações – Mestrado em Ciência da Computação

Arquitetura do jogador ALGORITMO GENÉTICO (AG) CONJUNTO CARACTERÍSTICAS (CC) ALFA BETA ITERATIVE DEEPENING TABELA TRANSPOSIÇÃO TABULEIRO ESTADO S0 REDE NEURAL (RN) REAJUSTE PESOS (RP) Obs: tem acesso ao valor de P’(M - 1) (RN’) Obs: corresponde à rede RN comos pesos reajustados Um Individuo Mapeamento de Si Pi Pm (5) P’m (9) Novos Pesos (6) RN com pesos reajustados (7) Mapeamento de Sn (8) (1) Sn(3) Mapeamento de Sm (4) folha de S0 (2) Si, iésima

Criação de uma segunda rede neural - MLP Versão multi-agente do jogador LS-VisionDraugths Duas redes neurais: Inicio até ‘meio’ do jogo: LS-VisionDraughts ‘Meio’ até final do jogo:jogador de final de jogo Especialidade da segunda rede: jogar em tabuleiros que tenha como estado inicial 10 peças ou menos. II Workshop de Dissertações – Mestrado em Ciência da Computação

Criação de uma segunda rede neural (cont.) Obtida a partir do treinamento envolvendo gerações de redes neurais especializadas em estados de final de jogo, que são minerados por Redes de Kohonen Aprendizado por reforço e por TD(λ) II Workshop de Dissertações – Mestrado em Ciência da Computação

Aspectos gerais do jogador de final de jogo Características iniciais: idem usadas no LS-Draughts Uso de um AG para selecionar um conjunto mínimo de características de final de jogo Treinamento feito através de Aprendizagem por reforço TD (λ) com self-play com clonagem II Workshop de Dissertações – Mestrado em Ciência da Computação

Seleção de estados de tabuleiro com 10 peças Por que 10 peças no tabuleiro? Base de dados formada a partir da junção dos jogadores LS e VisionDraughts Classificação dos estados da base através de Redes de Kohonen Seleção feita por incidência dos estados na base II Workshop de Dissertações – Mestrado em Ciência da Computação

Resultados esperados Jogador de final de jogo competitivo Conjunto mínimo de características para representar final de partida Mínimo de intervenção humana no treinamento da rede Eliminar ou, no mínimo, reduzir situações de loops indesejáveis II Workshop de Dissertações – Mestrado em Ciência da Computação

Cronograma II Workshop de Dissertações – Mestrado em Ciência da Computação

Referências BERLEKAMP, E. (1996). The economist’s view of combinatorial games. Proceedings of MSRI Workshop on Combinatorial Games. CAIXETA, G. S. (2008). Visiondraughts -um sistema de aprendizagem de jogos de damas baseado em redes neurais, diferenças temporais, algoritmos eficientes de busca em árvores e informações perfeitas contidas em bases de dados. Master’s thesis, Universidade Federal de Uberlândia. Caixeta, G. S. and da Silva Julia, R. M. (2008). A draughts learning system based on neural networks and temporal differences: The impact of an efficient tree-search algorithm. The 19th Brazilian Symposium on Artificial Intelligence, SBIA 2008. CHELLAPILLA, K. and FOGEL, D. B. (2000). Anaconda defeats hoyle 6-0: A case study competing an evolved checkers program against commercially available software. Proceedings of the 2000 Congress on Evolutionary Computation CEC00, La Jolla Marriott Hotel La Jolla, California, USA, page 857. LYNCH, M. (2007). Neurodraughts - an application of temporal diference learning to draughts.Master’s thesis, Dept. of CSIS, University of Limerick, Ireland. NETO, H. C. (2007). Ls-draughts - um sistema de aprendizagem de jogos de damas baseado em algoritmos genéticos, redes neurais e diferenças temporais. Master’s thesis, Universidade Federal de Uberlândia. NETO, H. C., JULIA, R. M. S., and Caixeta, G. (2008). LS-Draughts- A Draughts Learning System Based on Genetic Algorithms, Neural Network and Temporal Differences, pages 73– 82. Kirchengasse: I-Tech Educational and Publishing KG,2008.