Experimento... Wumpus Ambientes Arquiteturas

Experimento... Wumpus Ambientes Arquiteturas
Agentes Inteligentes Experimento... Wumpus Ambientes Arquiteturas

Lembrando... Agente Inteligente
dada uma seqüência perceptiva, escolhe, segundo seus conhecimentos, as ações que satisfazem melhor seu objetivo Agente sensores a m b i e n t e modelo do ambiente. conhecimento. objetivos,... Raciocinador efetuadores

Experimento do “Robô Humano”

Partes do robô Partes: Cérebro 1 Cérebro (1 pessoa)
2 Braços (1 por pessoa = 2 pessoas) 1 sistema de visão (1 pessoa) Cérebro não pode ver fala com todas as partes do robô controla os braços indicando ângulos de giro deslocamento em uma direção e distância dadas força a aplicar pode fazer perguntas aos braços e sistema de visão pode pedir para o sistema de visão se deslocar para obter outros ângulos de visão pode desenhar ambiente em uma folha de papel

Partes do robô Braços Sistema de visão não podem ver
não devem ouvir o que diz o sistema de visão tem tato pouco refinado podem responder sim ou não ao cérebro (ex. estão tocando em algo?) seguem instruções do cérebro Sistema de visão não pode fornecer informação sem ter sido claramente perguntado pelo cérebro pode distinguir diferentes objetos e estimar distâncias pode mover-se de forma a dar informações visuais a partir de diferentes ângulos

A tarefa Voluntários? Algumas conclusões
Braços e olhos saem da sala... Cérebro recebe a tarefa Algumas conclusões Um modelo do mundo é imprescindível e econômico (resume todo o ocorrido) dá suporte ao raciocínio Conhecimento prévio do mundo é importante Coordenar diferentes sistemas é complicado A percepção e a execução são imperfeitas Feedback visual e de força são imprescindíveis No mundo real é mais complicado tem muito conhecimento implícito A maioria dos sistemas de visão não são móveis ...

O Mundo do Wumpus

Bem-vindos ao “Mundo do Wumpus”
Agente caçador de tesouros

O Mundo do Wumpus: formulação do problema
Ambiente: paredes, Wumpus, cavernas, buracos, ouro Estado inicial: agente na caverna (1,1) com apenas uma flecha Wumpus e buracos em cavernas quaisquer Objetivos: pegar a barra de ouro e voltar à caverna (1,1) com vida

O Mundo do Wumpus: formulação do problema
Percepções: fedor (ao lado do Wumpus) brisa (ao lado dos buracos) brilho (na caverna do ouro) choque (contra a parede da caverna) grito do Wumpus (quando morre) Ações: avançar para próxima caverna girar 90 graus à direita ou à esquerda pegar um objeto na mesma caverna que o agente atirar na direção para onde o agente está olhando (a flecha pára quando encontra uma parede ou mata o Wumpus) sair da caverna

Codificação do Mundo do Wumpus
1 2 3 4 início fedor A brisa B W brisa, luz O A - Agente W - Wumpus B - Buraco O - Ouro X? - possível X V - Caverna visitada Percepção = [fedor,brisa,brilho, choque,grito]

Raciocinando e Agindo no Mundo do Wumpus
Representação do conhecimento do agente: [nada,nada,nada,nada,nada] [nada,brisa,nada,nada,nada] 1 2 3 4 A 1 2 3 4 ok A V B? b ok (a) início (b) depois do 1o movimento

Raciocinando e Agindo no Mundo do Wumpus
Depois de passar por (1,1), chega a (2,1)... [fedor,nada,nada,nada,nada] 1 2 3 4 ok A V b 1 2 3 4 ok A f V b B! W f b l B? W f ok B! (c) Decide ir para (2,2), único OK não visitado Vai para (2,2), (2,3) e encontra o ouro!!!

Exercício... Vamos achar o ouro?
B! 4 3 O 2 B! W! 1 A 1 2 3 4

Caracterização do Ambiente

Exemplos de agentes

Ambiente Classes de ambientes Propriedades de um ambiente
Físico: robôs Software: softbots Realidade virtual (simulação do ambiente físico): softbots e avatares Propriedades de um ambiente acessível x inacessível estático x dinâmico determinista x não-determinista discreto x contínuo episódico x não-episódico tamanho: número de percepções, ações, objetivos,...

Ambientes: propriedades
Acessível: quando os sensores do agente conseguem perceber todos os aspectos relevantes do ambiente para a escolha da ação ex. wumpus não é acessível, xadrez é Determinista: o próximo estado do ambiente pode ser completamente determinado pelo estado atual e as ações selecionadas pelo agente (= incerteza do fruto da ação) semi-determinista: se tem outros atores agindo imprevisivelmente para mudar o “estado do mundo” ex. wumpus determinista, robocup não-determinista, xadres semi-determinista

Episódico: a experiência do agente é dividida em episódios e ação em um episódio não depende das ações que ocorreram em episódios prévios exemplo: classificador de imagens é episódico, xadrez não Estático: o ambiente não muda enquanto o agente está escolhendo a ação a realizar. Semi-estático: o ambiente não muda enquanto o agente delibera, mas o "score" do agente muda ex. xadrez c/ relógio semi-estático, xadrez estático, táxi dinâmico obs: há mundos dinâmicos e deterministas (ex. esteira de fábrica)

Discreto: quando existe um número distinto e claramente definido de percepções e ações em cada turno ex. médico (consulta) discreto, táxi dinâmico O Tamanho do ambiente é dado por: número de percepções, ações e objetivos possíveis

Exemplos de ambientes

Simulação do ambiente Às vezes é mais conveniente simular o ambiente
mais simples permite testes prévios evita riscos, etc... O ambiente (programa) recebe os agentes como entrada fornece repetidamente a cada um deles as percepções corretas e recebe as ações atualiza os dados do ambiente em função dessas ações e de outros processos (ex. dia-noite) é definido por um estado inicial e uma função de atualização deve refletir a realidade

Arquiteturas de Agentes

Algoritmo básico Ciclo de Agente Arquiteturas Percebe
Raciocina (interpreta percepção e escolhe ação) Executa ação Arquiteturas Agente tabela Agente reativo puro Agente reativo com estado interno (autômato) Agente cognitivo (baseado em objetivos) Agente otimizador Agente adaptativo autonomia complexidade

Agente tabela sensores ambiente efetuadores Funcionamento Vantagens
percepções ações . . Agente Funcionamento Para cada percepção, procura na tabela a ação correspondente Vantagens muito eficiente!!

Agente tabela Limitações
Mesmo Problemas simples -> tabelas muito grandes ex. xadrez 30^100 Nem sempre é possível, por ignorância ou questão de tempo, construir a tabela Não há autonomia nem flexibilidade Este agente só tem fins didáticos!!! Não vale nem a pena pensar nele

Agente puramente reativo
Ambiente Sensores Regras Percepção Ação Efetuadores

Agente Reativo Puro Funcionamento Exemplo no Wumpus
Usa regras associando diretamente percepção com ação ex. Se velocidade > 60 então multar ex. Se luz do freio do carro da frente acender, então frear Dada a percepção, encontra a primeira regra que casa e executa ação Exemplo no Wumpus IF visualPerception = glitter THEN action = pick (representação pseudo-lógica)

Agente Reativo Puro Vantagens e desvantagens
Regras condição-ação: representação inteligível, modular e eficiente Não pode armazenar uma seqüência perceptiva, pouca autonomia Limitações do agente reativo puro no mundo do Wumpus um agente ótimo deveria: recuperar o ouro ou determinar que é muito perigoso pegar o ouro e em qualquer dos casos acima, voltar para (1,1) e sair da caverna. Um agente reativo nunca sabe quando sair, estar com o ouro e estar na caverna (1,1) não fazem parte da sua percepção (se pegou, esqueceu). esses agentes podem entrar em laços infinitos.

Agente reativo com estado interno
Ambiente Interpretador de percepção Sensores Modelo dos ambientes passados e atual Atualizador do modelo do ambiente Escolhedor de ação Efetuadores

Funcionamento: idem anterior + modelo do mundo (memória) Regras associando indiretamente percepção com ação via construção e manutenção de um modelo do ambiente Ação depende da percepção atual + anteriores + ações anteriores... Antes de agir, já atualiza o modelo do ambiente Ex. Fazer uma ultrapassagem em um carro Motivação O ambiente inteiro não é acessível no mesmo momento ex. ultrapassagem de um carro Percepções instantâneas iguais podem corresponder a estados diferentes ex. Wumpus: cavernas visitadas

Novos conhecimentos (regras) para atualização do mundo percepção  modelo  modelo’ Modelo’  modelo’’ (talvez) Modelo’’  ação ação  modelo’’  modelo’’’ Regras percepção  modelo  modelo IF visualPercept at time T is glitter AND location of agent at time T is (X,Y) THEN location of gold at time T is (X,Y) X,Y,T see(glitter,T)  loc(agent,X,Y,T)  loc(gold,X,Y,T).

Regras de agente reativo com estado interno
Regras modelo  modelo IF known that agent is with gold at time T AND known that location of agent at time T is (X,Y) THEN known that location of gold at time T is (X,Y) Regras modelo  ação IF known that location of agent at time T = (X,Y) AND known that location of gold at time T = (X,Y) THEN choose action at time T to be pick

Regras de agente reativo com estado interno
Regras ação  modelo  modelo IF choosen action at time T was pick THEN known that agent is with gold at time T+1 Desvantagem: Autonomia, mas não muito não tem objetivo, não pensa no futuro (só na ação imediata)!!!

Agente deliberativo/cognitivo (baseado em objetivo)
Ambiente Interpretador de percepção Modelo dos ambientes passados e atual Sensores Atualizador do modelo do ambiente Atualizador do objetivos Objetivos Preditor de ambientes futuros Modelo de ambientes futuros hipotéticos Escolhedor de ação Efetuadores

Agente Cognitivo Funcionamento (associação percepção-ação)
Mediada por modelo do ambiente e objetivo do agente Pode envolver encadear regras para construir plano multi-passo necessário para atingir objetivo a partir de modelo ex. taxista encontrando a rota para o destino do passageiro ex. taxista freia porque quer evitar prejuízo e dor de cabeça no futuro Contém os 4 tipos de regras do agente reativo com estado interno + 2 novos tipos de regras: Regras: objetivo  modelo  ação Regras: objetivo  modelo  objetivo’ Trata o objetivo explicitamente e pensa no futuro!!!!

Regras de agente Cognitivo
Regras objetivo  modelo  ação (ações) //O agente escolhe um caminho para o objetivo IF goal of agent at time T is to be in location (X,Y) AND agent is in (X-1, Y-1) at time T-N AND known that location (X,Y-1) is safe at time T-N AND known that location (X,Y) is safe at time T-N THEN choose action Go to X,Y via (X,Y-1)

Regras de agente deliberativo
Regras objetivo  modelo  ação (ações) //O agente pode variar a escolha conforme o objetivo, como não matar o wumpus para pegar logo o ouro IF goal of agent is to get the gold AND agent is in (X-1, Y) at time T AND known that the gold is in location (X,Y) AND known that location (X,Y) is safe at time T AND known that Wumpus is in location (X-1,Y+1) at time T AND known that the agent has na arrow at time T THEN choose action Go to X,Y

Regras de agente deliberativo
Regras objetivo  modelo  objetivo //Se o agente queria estar com o ouro e conseguiu, atualizar objetivo para ir para (1,1) IF goal of agent at time T is to be with gold at time T+N AND agent is with gold at time T+1 THEN update goal of agent at time T to be in location (1,1) at time T+M

Agente cognitivo (baseado em objetivo)
Vantagens e desvantagens: Mais complicado e ineficiente, porém mais flexível e autônomo ex. se começa a chover, já sabe que não pode confiar no freio Não trata objetivos conflitantes ex. chegar ao destino pelo caminho mais curto, seguro, barato, rápido e bonito

Agente otimizador (baseado em utilidade)
Ambiente Interpretador de percepção Modelo dos ambientes passados e atual Sensores Atualizador do modelo do ambiente Objetivos potencialmente conflitantes Atualizador do objetivos Utilidades dos objetivos ou ações Preditor de ambientes futuros Modelo de ambientes futuros hipotéticos Escolhedor de ação Efetuadores

Regras de agente otimizador
Associação percepção-ação: Mediada por modelo do ambiente, objetivos do agente e utilidades da realização parcial de conjuntos de objetivos Envolve métodos de otimização: busca, pesquisa operacional, etc. Contém 5 dos 6 tipos de regras do agente deliberativo, substituindo: regras objetivo  modelo  ação ...por: regras objetivo  modelo  utilidade, e regras utilidade  ação

Agente que aprende Vantagem: tem adaptabilidade (aprende)
sensores crítico avaliação t trocas elemento de execução (agente) elemento de aprendizagem conhecimento a m b i e n t e objetivos de aprendizagem t Gerador de problemas efetuadores Vantagem: tem adaptabilidade (aprende) Ex. motorista sem o mapa da cidade

Experimento... Wumpus Ambientes Arquiteturas

Apresentações semelhantes

Apresentação em tema: "Experimento... Wumpus Ambientes Arquiteturas"— Transcrição da apresentação:

Apresentações semelhantes

Sobre projeto

Feedback

Login

Autorizar-se através da rede social:

Experimento... Wumpus Ambientes Arquiteturas

Apresentações semelhantes

Apresentação em tema: "Experimento... Wumpus Ambientes Arquiteturas"— Transcrição da apresentação:

Apresentações semelhantes

Sobre projeto

Feedback