A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Planejamento Hierárquico e Planejamento Reativo Ana Emilia de Melo Queiroz Tópicos Avançados em Inteligência Artificial Simbólica CIn - UFPE.

Apresentações semelhantes


Apresentação em tema: "Planejamento Hierárquico e Planejamento Reativo Ana Emilia de Melo Queiroz Tópicos Avançados em Inteligência Artificial Simbólica CIn - UFPE."— Transcrição da apresentação:

1

2 Planejamento Hierárquico e Planejamento Reativo Ana Emilia de Melo Queiroz Tópicos Avançados em Inteligência Artificial Simbólica CIn - UFPE

3 Planejamento HierárquicoPlanejamento Hierárquico Planejamento ReativoPlanejamento Reativo Sem SensorSem Sensor CondicionalCondicional Execução e MonitoramentoExecução e Monitoramento Planejamento ContínuoPlanejamento Contínuo Planejamento Hierárquico e Planejamento Reativo : Roteiro

4 Planejamento Hierárquico e Planejamento Reativo Decomposição Hierárquica Problema Instruções muito abstratas não são implementáveis no mundo real. Ex. Go(Supermarket), Buy(Milk), Buy(Bananas), Go(Home) Instruções detalhadas provocam explosão combinatória no espaço de busca Avançar(1cm), Girar(40°),... Solução Planejar com refinamento incremental através de decomposição hierárquica de operadores abstratos Operadores abstratos: não direitamente executáveis (não primitivos) com várias decomposições em ações menos abstratas

5 Planejamento Hierárquico e Planejamento Reativo Exemplo de decomposição hierárquica BuildHouse Obtain Permit Hire Builder Pay Builder Construction Decomposes to Build Frame Build Roof Build Walls Build Interior Build Foundation Decomposes to

6 Planejamento Hierárquico e Planejamento Reativo Decomposição Hierárquica O que é preciso? Estender STRIPS para Incluir operadores abstratos Definir quem são ou não os operadores abstratos Redefinir POP Novo operador: Decompose(a,p) - A ação a pode ser decomposta em um plano p.

7 Exemplo Decompose(Construction, Plan(STEPS:{S 1 :Build(Foundation),S 2 :Build(Frame), S 3 : Build(Roof), S 4 :Build(Walls), S 5 : Build(Interior)} Orderings:{S 1

8 Planejamento Hierárquico e Planejamento Reativo Decomposição Hierárquica Algoritmo Construir POP inicial ao maior nível de abstração Recursivamente decompor ações abstratas até POP final conter apenas de operadores primitivos (que podem ser executados pelo agente) Verificar consistência global do POP final Vantagens de Sub-POPs independentes: Espaço de busca reduzido Conhecimento composicional Uso e reuso de sub-POPs pre-fabricados ou já planejados

9 Planejamento Hierárquico e Planejamento Reativo Decomposição e compartilhamento Maioria das decomposições das ações abstratas independentes umas das outras Mas as vezes a única solução primitiva envolve compartilhamento de ações entre decomposições 2 possibilidades: Quando escolher decomposição de uma ação abstrata, verificar oportunidades e restrições de compartilhamento Escolher decomposição sem compartilhamento, e depois usar regras de revisão (chamadas críticas) para tornar o plano primitivo resultante em uma solução com ações corretamente compartilhadas

10 Planejamento Hierárquico e Planejamento Reativo Exemplo da necessidade de compartilhar Curtir lua de mel & fazer bebê Casar-se Ir para lua de mel Ter bebê Curtir Lua-de-mel & fazer bebê Casar-se & ir para lua-de-mel Casar-se & ter um bebê

11 Planejamento Hierárquico e Planejamento Reativo De POP-HD-STRIPS para POP-HAD STRIPS Duas formas ortogonais de planejamento hierárquico: hierarquia de ações de vários níveis de abstração para decomposição hierarquia de precondições de vários níveis de prioridade para aproximação Podem ser combinadas para reduzir busca: começar por planos completos e consistentes embora abstratos e aproximativos Exemplo de operador com precondições a 3 níveis de prioridades: Op(Action:Buy(x), Effect:Have(x) ^ ¬Have(Money), Precond:1:Sells(store,x) 2:At(store) 3:Have(Money))

12 Planejamento Hierárquico e Planejamento Reativo E se as coisas não saírem como planejadas? Monitoramento da Ação: Verificação, com percepção, das pre- condições do passo corrente Monitoramento da Execução: Verificação, com percepção, das pré- condições do segmento restantes. Condições de lidar com pré-condições: não planejadas já satisfeitas Ex: Robô dirigindo carro...

13 Planejamento Hierárquico e Planejamento Reativo Detecção das falhas do plano Formas de monitoramento dependentes da percepção. Indeterminância: Limitada (numerável): ex. :abrir uma lata de tinta Ilimitada (não enumerável): ex.: dirigir, planejamento econômico

14 Planejamento e Execução

15 Planejamento Hierárquico e Planejamento Reativo Planejamento e Execução POP e POP-TIRC-HAD: Funcionam quando: Ambiente acessível, estático, determinístico Conhecimento completo e correto Perceber, depois planejar, depois agir cegamente. Domínios não determinísticos e ou parcialmente observável: Ambiente inacessível, dinâmicos, estocásticos Conhecimento incompleto e incorreto

16 Planejamento Hierárquico e Planejamento Reativo Planejamento e Execução Planejando com Indeterminância Planejamento Sem Sensor. Planejamento Condicional. Monitoramento e Execução. Planejamento Contínuo. Obs:Os primeiros dois métodos trata da indeterminância limitada, os outros da indeterminância ilimitada.

17 Planejamento Hierárquico e Planejamento Reativo Planejamento e Execução:Planejamento Sem Sensor Adotar uma estratégia conhecida e bem sucedida. Exemplo: Um médico que prescreve um antibiótico de amplo espectro. Não trata indeterminânica ilimitada. Aplicado a técnica clássica. Coerção: métodos para contornar a incerteza que força o mundo a um estado conhecido.

18 Planejamento Hierárquico e Planejamento Reativo Planejamento e Execução Planejamento Condicional ou Planejamento de Contingência Plano condicional / Conjunto de planos / Possíveis situações Ações de Efetuação x Ações de Percepção: objetivo ação de efetuação: alterar ambiente objetivo ação de percepção: alterar conhecimento do ambiente (ex, checar o preço de algum objeto).

19 Planejamento Hierárquico e Planejamento Reativo Planejamento e Execução: Execução de um plano condicional Condição é verificada na B.C. e deve ser conhecida naquele ponto do plano. Conhecimento = Seq. de percepções + Seq. de ações + B.C inicial. Para um plano condicional ser executável: o agente deve inserir ações de percepção para testar condição.

20 Planejamento Hierárquico e Planejamento Reativo Planejamento e Execução Planejamento Condicional Ambiente Completamente Observável Ele conhece o estado corrente mas não está habilitado a predizer os efeitos de suas ações. Construção de passos condicionais no plano em tempo de planejamento. Verificação destas condições em tempo de execução.

21 Planejamento Hierárquico e Planejamento Reativo Planejamento e Execução Planejamento Condicional: Ambiente Completamente Observável. O que é preciso? Estender SRIPS para suportar o não determinismo. Efeitos disjuntivos. Uma ação podendo ter um ou mais efeitos. Ex: Um aspirador que tenta ir para esquerda e pode falhar. Action(left,PRENCOND:AtR,EFFECT:ATL).Action(left,PRENCOND:AtR,EFFECT:ATL). Action(left,PRENCOND:AtR,EFFECT:AtR v AtL).Action(left,PRENCOND:AtR,EFFECT:AtR v AtL). Efeitos condicionais Dependendo do estado no qual a ação está sendo executada. Não trata indeterminância Ex: Aspirador que às vezes suja o quadrado destino, porém ele só suja se o quadrado estiver limpo. Action(left,PRECOND: AtR,EFFECT:AtL v (AtL ^ when CleanL:~CleanL)).Action(left,PRECOND: AtR,EFFECT:AtL v (AtL ^ when CleanL:~CleanL)). Passos Condicionais If AtL ^ CleanL then Rigth else SuckIf AtL ^ CleanL then Rigth else Suck

22 Planejamento Hierárquico e Planejamento Reativo Planejamento e Execução Planejamento Condicional: Ambiente Parcialmente Observável Percepção parcial do estado atual. Admitir que o estado atual pertence a um conjunto de estados. Estados de crenças do agente. Ex: O agente do aspirador. Ele conhece o estado do quadrado em que está, mas ele não conhece o outro quadrado. Representação do estado de crença. {(AtR ^ CleanR ^ CleanL).(AtR ^ CleanR ^ ~CleanL}{(AtR ^ CleanR ^ CleanL).(AtR ^ CleanR ^ ~CleanL} Este formato de representação pode ser muito cara se existir várias proposições booleanas definidas sobre o estado.Este formato de representação pode ser muito cara se existir várias proposições booleanas definidas sobre o estado.

23 Planejamento Hierárquico e Planejamento Reativo Planejamento e Execução Monitoramento e Execução Qualquer técnica de planejamento pode ser utilizada : (Clássica, Sem Sensor ou Condicional). A diferença é que ele precisará fazer o monitoramento da execução. Avaliação da adequação do plano à nova situação. E se alguma coisa não sai como esperado? O Replanejamento é utilizado para tratar as indeterminâncias ilimitadas que podem ocorrer.

24 Planejamento Hierárquico e Planejamento Reativo Planejamento e Execução Monitoramento e Execução Começar execução com plano completo e correto dados conhecimento e suposições inicialmente disponíveis Usar percepções durante a execução para adquirir conhecimento complementar e verificar suposições Replanejar fim do plano para se adequar as situações não antecipadas.

25 Planejamento Hierárquico e Planejamento Reativo Planejamento e Execução Monitoramento da Execução Plano completo inicial: whole_plan que começa em S e vai até G. O agente executa o plano até o ponto E. As precondições são verificadas. Ele verifica que as prencodições são satisfeitas atualmente no estado O e não no estado E. Ele então chama o seu algoritmo de planejamento que retorno um reparo para o plano. Este reparo começa em O e vai até algum ponto P do plano inicial. Um novo plano resulta da concantenação do repair com a continuação.

26 Planejamento Hierárquico e Planejamento Reativo Planejamento e Execução Planejamento Contínuo ou Situado Persiste indefinidamente no ambiente: Ele vive sempre mudando a formulação de seus objetivos, planejamento e fases de atuação. Em vez de ter o planejador e o monitor de execução como processos separados, ter um único processo presente em um agente de monitoramento contínuo. Suas atividades incluem Executar alguns passo do plano que devem ser executados Refinamento do plano para satisfazer as precondições abertas Resolver os conflitos Modificar o plano tomando como referencial as informações obtidas durante a execução.

27 Planejamento Hierárquico e Planejamento Reativo Planejamento e Execução Planejamento Contínuo: POP-con Assumindo ambiente completamente observável. A mesma técnica pode ser utilizada para ambientes parcialmente observáveis. Como exemplo usaremos o mundo dos blocos. A ação é mover(x,y). Mover x para y. Action(Move(x,y),PRECOND:Clear(x) ^ Clear(y) ^ On(x,z), EFFECT:On(x,y) ^ Clear(z) ^ ~On(x,z) ^ ~Clear(y)).

28 Ex: Mundo dos blocos Ação: Mover (x, y) Op( Ação: Mover (x, y), Precond: Limpo (x) ^ Limpo (Y) ^ EmCima (x, z), Efeito: EmCima (x,y) ^ Limpo (z) ^ ~ EmCima(x, z) ^ ~ Limpo (y) Estado InicialObjetivo A BEBE CFCF DGDG A BEBEG CDCD F

29 Plano Inicial Início Mover (C,D) Estado Inicial A BEBE CFCF DGDG Mover (D,B) Fim NaMesa (A) EmCima (B,E) EmCima (C,F) EmCima (D,G) Limpo (A) Limpo (C) Limpo (D) Limpo (B) EmCima (D,G) Limpo (D) Limpo (B) EmCima (C,F) Limpo (C) Limpo (D) EmCima (C,D) EmCima (D,B)

30 Plano Inicial Início Mover (C,D) Estado Inicial A BEBE CFCF DGDG Mover (D,B) Fim NaMesa (A) EmCima (B,E) EmCima (C,F) EmCima (D,G) Limpo (A) Limpo (C) Limpo (D) Limpo (B) EmCima (D,G) Limpo (D) Limpo (B) EmCima (C,F) Limpo (C) Limpo (D) EmCima (C,D) EmCima (D,B)

31 Plano Inicial Início Mover (C,D) Estado Inicial A BEBE CFCF DGDG Mover (D,B) Fim NaMesa (A) EmCima (B,E) EmCima (C,F) EmCima (D,G) Limpo (A) Limpo (C) Limpo (D) Limpo (B) EmCima (D,G) Limpo (D) Limpo (B) EmCima (C,F) Limpo (C) Limpo (D) EmCima (C,D) EmCima (D,B)

32 Plano Inicial Início Mover (C,D) Estado Inicial A BEBE CFCF DGDG Mover (D,B) Fim NaMesa (A) EmCima (B,E) EmCima (C,F) EmCima (D,G) Limpo (A) Limpo (C) Limpo (D) Limpo (B) EmCima (D,G) Limpo (D) Limpo (B) EmCima (C,F) Limpo (C) Limpo (D) EmCima (C,D) EmCima (D,B)

33 Eis que de repente... Início Mover (C,D) Mover (D,B) Fim NaMesa (A) EmCima (B,E) EmCima (C,F) EmCima (D,B) Limpo (A) Limpo (C) Limpo (D) Limpo (G) EmCima (D,y) Limpo (D) Limpo (B) EmCima (C,F) Limpo (C) Limpo (D) EmCima (C,D) EmCima (D,B) A BEBE CFCFG D

34 Eis que de repente... Início Mover (C,D) Mover (D,B) Fim NaMesa (A) EmCima (B,E) EmCima (C,F) EmCima (D,B) Limpo (A) Limpo (C) Limpo (D) Limpo (G) EmCima (D,y) Limpo (D) Limpo (B) EmCima (C,F) Limpo (C) Limpo (D) EmCima (C,D) EmCima (D,B) A BEBE CFCFG D A próxima ação seria: Mover (D, B), mas as pré-condições limpo (D) ^ limpo (B) ^ EmCima (D,G) não são mais válidas

35 Início Mover (C,D) Mover (D,B) Fim NaMesa (A) EmCima (B,E) EmCima (C,F) EmCima (D,B) Limpo (A) Limpo (C) Limpo (D) Limpo (G) EmCima (D,y) Limpo (D) Limpo (B) EmCima (C,F) Limpo (C) Limpo (D) EmCima (C,D) EmCima (D,B) A BEBE CFCFG D Estendendo um link causal

36 Início Mover (C,D) Mover (D,B) Fim NaMesa (A) EmCima (B,E) EmCima (C,F) EmCima (D,B) Limpo (A) Limpo (C) Limpo (D) Limpo (G) EmCima (D,y) Limpo (D) Limpo (B) EmCima (C,F) Limpo (C) Limpo (D) EmCima (C,D) EmCima (D,B) A BEBE CFCFG D Estendendo um link causal

37 Início Mover (C,D) Mover (D,B) Fim NaMesa (A) EmCima (B,E) EmCima (C,F) EmCima (D,B) Limpo (A) Limpo (C) Limpo (D) Limpo (G) EmCima (D,y) Limpo (D) Limpo (B) EmCima (C,F) Limpo (C) Limpo (D) EmCima (C,D) EmCima (D,B) A BEBE CFCFG D Eliminando passos redundantes

38 Início Mover (C,D) Fim NaMesa (A) EmCima (B,E) EmCima (C,F) EmCima (D,B) Limpo (A) Limpo (C) Limpo (D) Limpo (G) EmCima (C,F) Limpo (C) Limpo (D) EmCima (C,D) EmCima (D,B) A BEBE CFCFG D Eliminando passos redundantes

39 InícioFim NaMesa (A) EmCima (B,E) EmCima (C,A) EmCima (D,B) Limpo (F) Limpo (C) Limpo (D) Limpo (G) EmCima (C,D) EmCima (D,B) A BEBEFG D Um Agente desajeitado... C

40 Início Mover (C,D) Fim NaMesa (A) EmCima (B,E) EmCima (C,A) EmCima (D,B) Limpo (F) Limpo (C) Limpo (D) Limpo (G) EmCima (C,A) Limpo (C) Limpo (D) EmCima (C,D) EmCima (D,B) A BEBEFG D Adicionando um novo passo... C

41 Início Mover (C,D) Fim NaMesa (A) EmCima (B,E) EmCima (C,A) EmCima (D,B) Limpo (F) Limpo (C) Limpo (D) Limpo (G) EmCima (C,A) Limpo (C) Limpo (D) EmCima (C,D) EmCima (D,B) A BEBEFG D Adicionando um novo passo... C

42 InícioFim NaMesa (A) EmCima (B,E) EmCima (C,D) EmCima (D,B) Limpo (A) Limpo (C) Limpo (D) Limpo (G) EmCima (C,D) EmCima (D,B) A BEBEFG D Finalmente... C

43 InícioFim NaMesa (A) EmCima (B,E) EmCima (C,D) EmCima (D,B) Limpo (A) Limpo (C) Limpo (D) Limpo (G) EmCima (C,D) EmCima (D,B) A BEBEFG D E o agente situado pode buscar um novo objetivo C

44 Discussão percepção,correção de falhas e atuação.O planejamento contínuo pode ser visto como similar ao POP a medida que ele é um ciclo de percepção,correção de falhas e atuação. Em cada iteração POP procura as falhas do plano efetuar a correção. Pré-condições em aberto Conflitos Causais. O agente planejador contínuo ele pode tratar um número maior de falhas. Falta de objetivos O agente pode adicionar um novo objetivo Pré-condições em aberto. Adicionar um link causal para a pré-condição em aberto Conflito Causal Escolher restrições de ordem ou de variáveis para resolver o conflito. Link não suportado Se existir um link Sart P A e p não é mais verdadeiro em Start, então remove o link....

45 Ambientes Determinísticos Ambientes não Determinísticos LimitadasIlimitadas POP POP-Sem Sensor - coerção Monitoração e Execução POP-TI POP - Condicional Planejamento Contínuo POP-RC POP-HAD Quadro Comparativo


Carregar ppt "Planejamento Hierárquico e Planejamento Reativo Ana Emilia de Melo Queiroz Tópicos Avançados em Inteligência Artificial Simbólica CIn - UFPE."

Apresentações semelhantes


Anúncios Google