A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Arquitetura de Multi-Agentes 1 / 55 Arquitetura de Multi-Agentes IA Simbólica Prof. Jacques Robin Ryan Leite Albuquerque Luiz Carlos Barboza Júnior.

Apresentações semelhantes


Apresentação em tema: "Arquitetura de Multi-Agentes 1 / 55 Arquitetura de Multi-Agentes IA Simbólica Prof. Jacques Robin Ryan Leite Albuquerque Luiz Carlos Barboza Júnior."— Transcrição da apresentação:

1 Arquitetura de Multi-Agentes 1 / 55 Arquitetura de Multi-Agentes IA Simbólica Prof. Jacques Robin Ryan Leite Albuquerque Luiz Carlos Barboza Júnior

2 Arquitetura de Multi-Agentes 2 / 55 Roteiro  Arquiteturas Para Agentes Inteligentes Abstratas Concretas

3 Arquitetura de Multi-Agentes 3 / 55 Arquiteturas para Agentes Inteligentes  Introdução  Arquiteturas Abstratas Agentes Puramente Reativos Agentes com Estado  Arquiteturas Concretas Arquiteturas Baseadas em Lógica Arquiteturas Reativas Arquiteturas Baseadas em Crenças, Desejos e Intenções Arquiteturas Baseadas em Camadas

4 Arquitetura de Multi-Agentes 4 / 55 Ambientes, estados e ações  Formalização da abstração de agentes S = {s1, s2,...} // environment states A = {a1, a2,...} // actions  Agente Padrão: action : S*  A  Ambiente: env : S x A  (S) Determinístico: se (S) é unitário Não Determinístico

5 Arquitetura de Multi-Agentes 5 / 55 Históricos  Agente x Ambiente (History) h : s 0  (a 0 )  s 1  (a 1 )  …  (a u-1 )  s u  (a u ) ... History (Ag,Env) - a u é a ação escolhida, dados todos os estados do ambiente até s u - s u é um dos estados retornados pela aplicação de a u-1 ao estado atual do ambiente (s u-1 )  Comportamento característico de um agente em um ambiente é o conjunto de todas os históricos que satisfazem action e env

6 Arquitetura de Multi-Agentes 6 / 55 Introdução  Se uma propriedade p é válida para todos os históricos, ela é chamada de propriedade invariante do agente naquele ambiente  Equivalência de comportamento: hist(ag1, env) = hist(ag2, env) - …com relação a um ambiente env hist(ag1, _) = hist(ag2, _) - …com relação a todos os ambientes  Estamos interessados em históricos infinitos A interação (agente x ambiente) não tem fim !!

7 Arquitetura de Multi-Agentes 7 / 55 Arquiteturas Abstratas Agentes Puramente Reativos Percepção Agentes com Estado

8 Arquitetura de Multi-Agentes 8 / 55 Agentes Puramente Reativos  Não fazem referência a um histórico  Baseam suas tomadas de decisão somente no presente action : S  A Agentes Puramente Reativos x Agente Padrão  Exemplo de Agente Puramente Reativo: A função de ação de um termostato: heater off, if s = temperature OK action(s) = heater on, otherwise

9 Arquitetura de Multi-Agentes 9 / 55 Ambiente Agente seeaction Percepção  Como implementar action ??  Refinamento do modelo abstrato de agentes Dividir em subsistemas Decisões de projeto - Estruturas de Dados e - Estruturas de Controle  Função de Decisão do Agente é decomposta em: Percepção ( see : S  P ) Ação ( action : P*  A )

10 Arquitetura de Multi-Agentes 10 / 55 Percepção  Observações interessantes Suponha s1,s2  S e s1 != s2, mas see(s1) = see(s2) - O agente recebe a mesma percepção para dois estados diferentes do ambiente Conjunto de estados indistinguíveis Seja s1,s2  S. s1  s2 se see(s1) = see(s2) - A relação de equivalência divide S em conjuntos de estados mutuamente indistinguíveis - Quanto mais grosseira é essa equivalência, menos eficiente será a percepção do agente  Se |  | = |S|, o agente poderá distinguir todos os estados  Se |  | = 1, o agente não tem habilidade de percepção

11 Arquitetura de Multi-Agentes 11 / 55 Agentes com Estado  Temos pensado em agentes que têm seu processo de tomada de decisão baseado em históricos Não intuitivo  Estamos tratando agora de agentes que detêm uma estrutura de dados interna que armazenam: Estados do ambiente Históricos ... onde é baseado, pelo menos em parte, o processo de tomada de decisão

12 Arquitetura de Multi-Agentes 12 / 55  see : S  P inalterado  action : I  A  next : I x P  I Adicionado percepções alteram o estado interno Ambiente Agente seeaction next state Agentes com Estado

13 Arquitetura de Multi-Agentes 13 / 55 Arquiteturas Concretas Arquiteturas Baseadas em Lógica Arquiteturas Reativas Arquiteturas Baseadas em Crenças, Desejos e Intenções Arquiteturas Baseadas em Camadas

14 Arquitetura de Multi-Agentes 14 / 55 Arquiteturas Baseadas em Lógica  De acordo com a IA Simbólica, o comportamento inteligente pode ser gerado em um sistema, quando é dado a ele : Uma representação simbólica do ambiente; Uma representação simbólica dos comportamentos desejáveis Uma manipulação sintática dessas representações  Representação Simbólica Fórmulas da Lógica  Manipulação Sintática Dedução e Prova de Teoremas

15 Arquitetura de Multi-Agentes 15 / 55 Arquiteturas Baseadas em Lógica  Um conjunto de teorias sobre uma agência que explica como os agentes devem se comportar, podem ser vistas como especificações  Essas especificações são refinadas até poderem ser implementadas  Na visão de agentes como provadores de teoremas, essas teorias são planos executáveis  Agentes Deliberativos O estado interno é um banco de dados D de fórmulas da lógica clássica de primeira ordem

16 Arquitetura de Multi-Agentes 16 / 55  O processo de tomada de decisões é modelado através de um conjunto de regras dedutivas:    Banco de Dados de Fórmulas Regras Dedutivas Fórmula da Lógica Arquiteturas Baseadas em Lógica

17 Arquitetura de Multi-Agentes 17 / 55 Banco de Dados de Fórmulas Regras Dedutivas Fórmula da Lógica Arquiteturas Baseadas em Lógica  see : S  P  next : D x P  D  action : D  A derivado em termos de regras dedutivas  juntar com 15

18 Arquitetura de Multi-Agentes 18 / 55 Banco de Dados de Fórmulas Regras Dedutivas Fórmula da Lógica O Mundo do Aspirador de Pó  Funções Possíveis forward suck turn (90°)  Predicados do Domínio in(x,y) dirt(x,y) facing(d) (0,2)(1,2)(2,2) (0,1)(2,1) (0,0)(1,0)(2,0) Área suja!!

19 Arquitetura de Multi-Agentes 19 / 55 Banco de Dados de Fórmulas Regras Dedutivas Fórmula da Lógica O Mundo do Aspirador de Pó  A função next será decomposta em duas old() new : D x P  D Assim, next(, p) = ( \ old() ) new(, p)  As regras... in(x,y) dirt(x,y)  do(suck) - Prioridade máxima in(0,0) facing(north) !dirt(0,0)  do(forward) in(0,1) facing(north) !dirt(0,1)  do(forward) in(0,2) facing(north) !dirt(0,2)  do(turn) in(0,2) facing(east)  do(forward)

20 Arquitetura de Multi-Agentes 20 / 55 Voltando...  Fazer agentes dessa maneira é quase impraticável Ambiente não-determinístico - Não podemos garantir a otimalidade das ações escolhidas Representação lógica de percepções do ambiente pode ser não trivial ex, Representação de propriedades dinâmicas de ambientes reais também é não trivial ex, Lógica freqüentemente inadequada para: - representar percepções (ex, extraída de câmera) - raciocinar em tempo real

21 Arquitetura de Multi-Agentes 21 / 55 Arquiteturas Reativas  Abordagens alternativas Comportamental: Desenvolver e combinar comportamentos individuais Situado: agentes estão realmente situados em algum ambiente Reativo: não raciocina sobre o ambiente, só reage a ele  hierarquia de comportamentos Comportamento de realização de tarefas Cada comportamento é como uma função de ação separada Vários comportamentos podem estar rodando simultaneamente Inibição de comportamentos por níveis de prioridade  Por exemplo, um robô móvel deve ter como prioridade máxima o comportamento de evitar obstáculos Decisões baseadas em

22 Arquitetura de Multi-Agentes 22 / 55 Arquiteturas Reativas  A função see permanece inalterada  Função action = conjunto de comportamentos + relação de inibição  Comportamento = (c,a) c é um conjunto de percepções (condições) a é uma ação dispara quando: o ambiente está no estado s e see(s)  c exceto se existe outro comportamento disparável com maior prioridade

23 Arquitetura de Multi-Agentes 23 / 55 Arquiteturas Reativas  Exemplo: Comportamento instintivo das formigas adicionar transparência sobre o exemplo das formigas  Vantagens Simplicidade, Economia, Tratável Computacionalmente, Robustez Contra Falhas  Problemas ainda não resolvidos Visão limitada ao ambiente local Aprendizado com experiências (performance) Desenvolvimento puramente empírico sem princípios metodológicos O comportamento global emana de interações entre agentes e o ambiente complica o entendimento profundo do funcionamento do sistema

24 Arquitetura de Multi-Agentes 24 / 55  Processo de raciocínio prático Arquiteturas Baseadas em Crenças, Desejos e Intenções BRF Crenças Gerador de Opções Desejos Filtros Ações Intenções Sensor Ação

25 Arquitetura de Multi-Agentes 25 / 55 Arquiteturas Baseadas em Crenças, Desejos e Intenções  Processo de Decisão Análise das opções de ações disponíveis Opções selecionadas tornam-se intenções  Intenções Guiam o raciocínio Meios-Fins para escolher ações Relacionadas com crenças sobre o futuro Persistem - suficientemente para alcançar algum objetivo (saber perseverar) - não eternamente (saber desistir) - duas razões para abandonar intenção:  objetivo inalcançável  objetivo tornou-se irrelevante

26 Arquitetura de Multi-Agentes 26 / 55 Arquiteturas Baseadas em Crenças, Desejos e Intenções  Quando reconsiderar suas intenções (parar para pensar)? Balanceamento de comportamentos pro-ativos (direcionado a objetivo) e reativos (dirigidos a eventos)  Agentes arrojados Nunca param para reconsiderar Próprios para ambientes que não mudam rapidamente  Agentes prudentes Para constantemente para reconsiderar Próprios para ambientes que exigem a habilidade de identificar quando as intenções estão condenadas (ambientes com taxa de mudança muito alta)

27 Arquitetura de Multi-Agentes 27 / 55 Arquiteturas Baseadas em Crenças, Desejos e Intenções  Vantagens Intuitiva - Decisão do que fazer - Decisão de como fazer - Noções de crenças, desejos e intenções Decomposição funcional em subsistemas  Desvantagem Dificuldade de saber como implementar eficientemente essas funções ou subsistemas

28 Arquitetura de Multi-Agentes 28 / 55 Arquiteturas Baseadas em Camadas  É atualmente a mais popular classe de arquiteturas de agentes disponível !!  Para que um agente tenha comportamentos reativos e pró-ativos, devemos criar dois subsistemas para tratar cada um  Os subsistemas são arrumados em camadas que interagem entre si  No mínimo 2 camadas (reativos + pró-ativos)  Fluxo de Control Camadas Horizontais Camadas Verticais

29 Arquitetura de Multi-Agentes 29 / 55 Camadas Horizontais: juntar com 31  Camadas Horizontais Camada n Input... Camada 2 Camada 1 Output

30 Arquitetura de Multi-Agentes 30 / 55 Camadas Horizontais  Cada camada está conectada com… Sensores (entrada) Ações (saída)  Conceitualmente simples Uma camada para cada comportamento desejado  Problema Concorrência de camadas confundir o agente que gerará ações globais as vezes não coerente Solução - Mediador: camada de controle por tempo - Gargalo!!

31 Arquitetura de Multi-Agentes 31 / 55  Dois passos de controle Camadas Verticais Output Camada n... Camada 2 Camada 1 Input

32 Arquitetura de Multi-Agentes 32 / 55 Camadas Verticais  Entrada e saída estão conectadas a no máximo uma camada cada  Dois passos de controle Modelo hierárquico de organizações - Informações  - Comandos  Ex.: Jörg Müller’s INTERRAP

33 Arquitetura de Multi-Agentes 33 / 55 Arquitetura CMUnited-98  Ambiente com sincronização periódica entre membros de times de agentes  Visão Geral da Arquitetura  Estrutura do Trabalho em Equipe  Paradigma de Comunicação  Implementação  Resultados

34 Arquitetura de Multi-Agentes 34 / 55 Periodic Team Synchronization (PTS)  Ambientes com Colaboração entre agentes para alcançar um objetivo Sincronização com comunicação confiável disponível por períodos limitados Resto do tempo, comunicação não confiável e com largura de banda limitada Tempo-real  Desafios Representação dos “acordos de vestiário” Determinar o momento de troca de papeis e/ou de formação Assegurar que todos os agentes estejam na mesma formação Assegurar que todos os papeis da formação estão preenchidos

35 Arquitetura de Multi-Agentes 35 / 55 Visão Geral da Arquitetura

36 Arquitetura de Multi-Agentes 36 / 55 Estrutura do Trabalho em Equipe  Papel Define exatamente ou parcialmente comportamentos do agente ex, meio-campista  Formações Coleção de papeis, ex, 4-3-3, 4-4-2 Pode ser decomposta em sub-formação, ex, zaga, ataque  Acordo de vestiário define: formações iniciais gatilhos para re-alocação de papeis dentro de uma formação - ex, ponta direita passa pela esquerda e vice-versa gatilhos para mudança de formação  Jogadas ensaiadas, ex, escanteio

37 Arquitetura de Multi-Agentes 37 / 55 Paradigma de Comunicação  Ambiente Vários agentes, times Canal único Banda estreita Não confiável  Desafios Direcionamento e identificação de mensagens Robustez a interferência Múltiplas respostas simultâneas Robustez a mensagens perdidas Coordenação do time

38 Arquitetura de Multi-Agentes 38 / 55 Implementação  Sincronização das ações  Estado do mundo  Atualizando o estado do mundo  Habilidades do agente  Modos de comportamento  Instanciação de domínio de papeis e formações  Troca dinâmica de formações  Posições flexíveis  Jogadas pré-planejadas  Paradigma de comunicação

39 Arquitetura de Multi-Agentes 39 / 55 Estado do mundo  Objeto Coordenadas de posição Confiança da coordenada  Objeto Estacionário  Objeto Móvel Coordenadas de velocidade Confiança da coordenada  Bola  Jogador Time, Número Ângulo da face Confiança no ângulo Objeto Estacionário Objeto Estacionário Objeto Móvel Objeto Móvel Bola Jogador

40 Arquitetura de Multi-Agentes 40 / 55 Atualizando o estado do mundo  O próprio agente SE chegou nova informação visual - A posição absoluta do agente pode ser calculada a partir de coordenadas relativa e objetos estacionários (landmarks) SE não chegou informação visual - Atualizar a velocidade e previsão dos efeitos da última ação - Prever a nova posição e velocidade a partir dos valores anteriores Se disponível, atualizar a velocidade do agente a partir das sensações corpóreas (própriocepção) Atualizar a stamina do agente a a partir das sensações corpóreas ou de previsões de efeitos de ações

41 Arquitetura de Multi-Agentes 41 / 55 Atualizando o estado do mundo  A bola SE chegou nova informação visual - Determinar a posição absoluta da bola a partir da posição absoluta do agente e da posição relativa da bola SE informação sobre a velocidade foi dada - Atualizar a velocidade SE não chegou informação visual - Estimar velocidade e posição SE a bola deveria estar no campo de visão, mas não esta - zerar a confiança para 0  Companheiros e adversários

42 Arquitetura de Multi-Agentes 42 / 55 Habilidades do agente e Modos de comportamentoTraduzir  Goaltend  Localize  Face Ball  Handle Ball  Active Offense  Passive Offense  Active Defense  Auxiliary Defense  Passive Defense

43 Arquitetura de Multi-Agentes 43 / 55 Instanciação de domínio de papeis e formações  Ball Lost  Face Ball()  If (Ball know  Chasing)Handle Ball(args1)  If (Ball know AND Not Chasing)Passive Offense(args1)  If (Communicate Flag Set) Communicate()

44 Arquitetura de Multi-Agentes 44 / 55 Posições flexíveis  Antecipação Marcação do oponente (explicar) Posicionamento dependente da bola (explicar) Posicionamento estratégico usando atração e repulsão (SPAR)  SPAR (Strategic Position by Attraction and Repulsion): heurística composta baseadas nas seguintes prioridades: 1. Maximizar a distância a cada oponente (sair da marcação) 2. Maximizar a distância a cada companheiro (ocupação do campo) 3. Minimizar a distância à bola 4. Minimizar a distância ao gol 5. F icar próximo à posição de base do papel (home position) 6. Ficar dentro dos limites do campo 7. Evitar posição de impedimento 8. Fica “livre” para receber o passe (não tem adversário entre jogador com a bola e companheiro)

45 Arquitetura de Multi-Agentes 45 / 55 Jogadas pré-planejadas  Alocação de papel em jogadas ensaiadas: escolher para para P jogador J cuja posição de base é a mais próxima da posição inicial da jogada ensaiada

46 Arquitetura de Multi-Agentes 46 / 55 Paradigma de comunicação  CMUnited [ ]  Tipos de Mensagens  Perguntar/responder a localização da bola  Perguntar/responder a localização do companheiro  Informar destino do passe  Informar que esta indo para bola  Informar que esta assumindo/deixando uma posição

47 Arquitetura de Multi-Agentes 47 / 55 Resultados  Resultados da estrutura do trabalho em equipe Posições flexíveis Jogadas

48 Arquitetura de Multi-Agentes 48 / 55 Resultados  Resultados da estrutura do trabalho em equipe Formação

49 Arquitetura de Multi-Agentes 49 / 55 Resultados  Resultados do Paradigma de comunicação Robustez a interferência - 73msg/5min falsas -> Todas identificadas como falsas - Apenas uma de um companheiro identificada incorretamente como falsa Manipulando respostas múltiplas Coordenação do time

50 Arquitetura de Multi-Agentes 50 / 55 Conclusões

51 Arquitetura de Multi-Agentes 51 / 55 Bibliografia


Carregar ppt "Arquitetura de Multi-Agentes 1 / 55 Arquitetura de Multi-Agentes IA Simbólica Prof. Jacques Robin Ryan Leite Albuquerque Luiz Carlos Barboza Júnior."

Apresentações semelhantes


Anúncios Google