Experimento... Wumpus Ambientes Arquiteturas

Slides:



Advertisements
Apresentações semelhantes
AULA 01 PROGRAMAÇÃO DINÂMICA
Advertisements

Renata S.S. Guizzardi Inteligência Artificial – 2007/02
Agentes Inteligentes Agentes Inteligentes.
Introdução à Programação usando Processing Programação Gráfica 2D Animações Exercício Animações 14/10/09 Bruno C. de Paula 2º Semestre 2009 > PUCPR >
14/10/09 Uma animação possui: Início; Passo; Fim; 1.
Agentes Inteligentes.
Técnicas de orçamento de capital
Ludwig Krippahl, 2007 Programação para as Ciências Experimentais 2006/7 Teórica 2.
Ludwig Krippahl, 2007 Programação para as Ciências Experimentais 2006/7 Teórica 3.
Vetores Representação e características Operações I Decomposição
Inteligência Artificial Alex F. V. Machado. Tecnologia de Processamento da Informação que envolve processos de raciocínio, aprendizado e percepção. Winston.
Agentes Inteligentes Alex F. V. Machado.
Agentes Inteligentes Alex F. V. Machado.
1 Agentes Inteligentes Alex F. V. Machado. 2 Um programa de IA pode ser visto como um Agente Racional Plano da aula O que é um Agente Racional (inteligente)?
ES723 - Dispositivos Eletromecânicos
Resolução.
Inteligência Artificial
Os Sistemas Multi-agente Viviane Torres da Silva
Agentes Inteligentes Introdução.
1 Complexidade de Algoritmos Complexidade de pior caso Complexidade de melhor caso de uso bem menos freqüente em algumas situações específicas Complexidade.
Árvores.
Sistemas Baseados em Agentes
Agentes Baseados em Conhecimento
Busca Online Alexandra Barros Geber Ramalho. Busca Offine x Busca Online Busca Offline (ou planejamento clássico) –Computa a solução (do estado inicial.
Bem-vindos ao “Mundo do Wumpus”
A Assombrosa Caverna do Wumpus Versão Life Ioram Sette.
Tipos de Regras Discussão geral
Sistemas Multiagentes
SISTEMAS DE INFORMAÇÃO Inteligência Artificial 2011/01
Inteligência Artificial
Listas Encadeadas.
Classes e objetos Modelagem
INF 1771 – Inteligência Artificial
INF 1771 – Inteligência Artificial
INF 1771 – Inteligência Artificial
INF 1771 – Inteligência Artificial
Buscas em Grafos Prof. André Renato 1º Semestre/2012
CIn- UFPE 1 Problema: Auxílio á Compras na Web. CIn- UFPE 2 Problema: Automatização de sistemas de potência objetos: rios, barragens, turbinas, transformadores,
Introdução aos Sistemas Multiagentes
Cinemática Plana de um Corpo Rígido Cap. 16
COMO CHEGAR AO CORAÇÃO DE UMA MULHER
Oferta e Demanda A Curva de Oferta
Capítulo 2 – Russell & Norvig
Resolução de problemas por meio de busca
LINGUAGENS DE PROGRAMAÇÃO PROF. DANIELA PIRES
Semana 03 Comandos de desvio de fluxo. Expressões lógicas.
Sistemas Inteligentes
INF 1771 – Inteligência Artificial
Introdução e Busca Cega
Conceitos básicos em grafos
Sistemas Inteligentes
Agentes Cognitivos Autônomos
Marcilio Souto DIMAp/UFRN
Máquina de Turing Universal
Técnicas de Localização para Robôs em Ambientes Internos Claudia Patricia Ochoa Díaz Mestrado em Sistemas Mecatrônicos UnB
Lógica para Computação Prof. Celso Antônio Alves Kaestner, Dr. Eng. celsokaestner (at) utfpr (dot) edu (dot) br.
Agenda Agentes que Respondem por Estímulo Agentes Inteligentes.
Sistemas Inteligentes
PUCC 1 Tópicos em Sistemas Inteligentes. PUCC 2 Agenda - Aula 03 Buscas Agentes que Planejam.
Ambientes e Arquiteturas de Agentes
Inteligência Artificial I
Agentes Baseados em Conhecimento
1 Agentes Inteligentes Flávia Barros Patrícia Tedesco.
Introdução aos Agentes Inteligentes Tipos de Problemas de Busca Flávia Barros.
Sistemas Inteligentes Aula: Agentes Inteligentes Flávia Barros & Patricia Tedesco 1.
Introdução à inteligência artificial
Tipos de Regras Definições Gerais Como representar vários tipos de conhecimento utilizando Regras de Produção? 1.
CIn- UFPE 1 Resolução de Problemas. CIn- UFPE ? Agente solucionador de problemas O agente reativo Escolhe suas ações com base.
Transcrição da apresentação:

Experimento... Wumpus Ambientes Arquiteturas Agentes Inteligentes Experimento... Wumpus Ambientes Arquiteturas

Lembrando... Agente Inteligente dada uma seqüência perceptiva, escolhe, segundo seus conhecimentos, as ações que satisfazem melhor seu objetivo Agente sensores a m b i e n t e modelo do ambiente. conhecimento. objetivos,... Raciocinador efetuadores

Experimento do “Robô Humano”

Partes do robô Partes: Cérebro 1 Cérebro (1 pessoa) 2 Braços (1 por pessoa = 2 pessoas) 1 sistema de visão (1 pessoa) Cérebro não pode ver fala com todas as partes do robô controla os braços indicando ângulos de giro deslocamento em uma direção e distância dadas força a aplicar pode fazer perguntas aos braços e sistema de visão pode pedir para o sistema de visão se deslocar para obter outros ângulos de visão pode desenhar ambiente em uma folha de papel

Partes do robô Braços Sistema de visão não podem ver não devem ouvir o que diz o sistema de visão tem tato pouco refinado podem responder sim ou não ao cérebro (ex. estão tocando em algo?) seguem instruções do cérebro Sistema de visão não pode fornecer informação sem ter sido claramente perguntado pelo cérebro pode distinguir diferentes objetos e estimar distâncias pode mover-se de forma a dar informações visuais a partir de diferentes ângulos

A tarefa Voluntários? Algumas conclusões Braços e olhos saem da sala... Cérebro recebe a tarefa Algumas conclusões Um modelo do mundo é imprescindível e econômico (resume todo o ocorrido) dá suporte ao raciocínio Conhecimento prévio do mundo é importante Coordenar diferentes sistemas é complicado A percepção e a execução são imperfeitas Feedback visual e de força são imprescindíveis No mundo real é mais complicado tem muito conhecimento implícito A maioria dos sistemas de visão não são móveis ...

O Mundo do Wumpus

Bem-vindos ao “Mundo do Wumpus” Agente caçador de tesouros

O Mundo do Wumpus: formulação do problema Ambiente: paredes, Wumpus, cavernas, buracos, ouro Estado inicial: agente na caverna (1,1) com apenas uma flecha Wumpus e buracos em cavernas quaisquer Objetivos: pegar a barra de ouro e voltar à caverna (1,1) com vida

O Mundo do Wumpus: formulação do problema Percepções: fedor (ao lado do Wumpus) brisa (ao lado dos buracos) brilho (na caverna do ouro) choque (contra a parede da caverna) grito do Wumpus (quando morre) Ações: avançar para próxima caverna girar 90 graus à direita ou à esquerda pegar um objeto na mesma caverna que o agente atirar na direção para onde o agente está olhando (a flecha pára quando encontra uma parede ou mata o Wumpus) sair da caverna

Codificação do Mundo do Wumpus 1 2 3 4 início fedor A brisa B W brisa, luz O A - Agente W - Wumpus B - Buraco O - Ouro X? - possível X V - Caverna visitada Percepção = [fedor,brisa,brilho, choque,grito]

Raciocinando e Agindo no Mundo do Wumpus Representação do conhecimento do agente: [nada,nada,nada,nada,nada] [nada,brisa,nada,nada,nada] 1 2 3 4 A 1 2 3 4 ok A V B? b ok (a) início (b) depois do 1o movimento

Raciocinando e Agindo no Mundo do Wumpus Depois de passar por (1,1), chega a (2,1)... [fedor,nada,nada,nada,nada] 1 2 3 4 ok A V b 1 2 3 4 ok A f V b B! W f b l B? W f ok B! (c) Decide ir para (2,2), único OK não visitado Vai para (2,2), (2,3) e encontra o ouro!!!

Exercício... Vamos achar o ouro? B! 4 3 O 2 B! W! 1 A 1 2 3 4

Caracterização do Ambiente

Exemplos de agentes

Ambiente Classes de ambientes Propriedades de um ambiente Físico: robôs Software: softbots Realidade virtual (simulação do ambiente físico): softbots e avatares Propriedades de um ambiente acessível x inacessível estático x dinâmico determinista x não-determinista discreto x contínuo episódico x não-episódico tamanho: número de percepções, ações, objetivos,...

Ambientes: propriedades Acessível: quando os sensores do agente conseguem perceber todos os aspectos relevantes do ambiente para a escolha da ação ex. wumpus não é acessível, xadrez é Determinista: o próximo estado do ambiente pode ser completamente determinado pelo estado atual e as ações selecionadas pelo agente (= incerteza do fruto da ação) semi-determinista: se tem outros atores agindo imprevisivelmente para mudar o “estado do mundo” ex. wumpus determinista, robocup não-determinista, xadres semi-determinista

Ambientes: propriedades Episódico: a experiência do agente é dividida em episódios e ação em um episódio não depende das ações que ocorreram em episódios prévios exemplo: classificador de imagens é episódico, xadrez não Estático: o ambiente não muda enquanto o agente está escolhendo a ação a realizar. Semi-estático: o ambiente não muda enquanto o agente delibera, mas o "score" do agente muda ex. xadrez c/ relógio semi-estático, xadrez estático, táxi dinâmico obs: há mundos dinâmicos e deterministas (ex. esteira de fábrica)

Ambientes: propriedades Discreto: quando existe um número distinto e claramente definido de percepções e ações em cada turno ex. médico (consulta) discreto, táxi dinâmico O Tamanho do ambiente é dado por: número de percepções, ações e objetivos possíveis

Exemplos de ambientes

Simulação do ambiente Às vezes é mais conveniente simular o ambiente mais simples permite testes prévios evita riscos, etc... O ambiente (programa) recebe os agentes como entrada fornece repetidamente a cada um deles as percepções corretas e recebe as ações atualiza os dados do ambiente em função dessas ações e de outros processos (ex. dia-noite) é definido por um estado inicial e uma função de atualização deve refletir a realidade

Arquiteturas de Agentes

Algoritmo básico Ciclo de Agente Arquiteturas Percebe Raciocina (interpreta percepção e escolhe ação) Executa ação Arquiteturas Agente tabela Agente reativo puro Agente reativo com estado interno (autômato) Agente cognitivo (baseado em objetivos) Agente otimizador Agente adaptativo autonomia complexidade

Agente tabela sensores ambiente efetuadores Funcionamento Vantagens percepções ações . . Agente Funcionamento Para cada percepção, procura na tabela a ação correspondente Vantagens muito eficiente!!

Agente tabela Limitações Mesmo Problemas simples -> tabelas muito grandes ex. xadrez 30^100 Nem sempre é possível, por ignorância ou questão de tempo, construir a tabela Não há autonomia nem flexibilidade Este agente só tem fins didáticos!!! Não vale nem a pena pensar nele

Agente puramente reativo Ambiente Sensores Regras Percepção Ação Efetuadores

Agente Reativo Puro Funcionamento Exemplo no Wumpus Usa regras associando diretamente percepção com ação ex. Se velocidade > 60 então multar ex. Se luz do freio do carro da frente acender, então frear Dada a percepção, encontra a primeira regra que casa e executa ação Exemplo no Wumpus IF visualPerception = glitter THEN action = pick (representação pseudo-lógica)

Agente Reativo Puro Vantagens e desvantagens Regras condição-ação: representação inteligível, modular e eficiente Não pode armazenar uma seqüência perceptiva, pouca autonomia Limitações do agente reativo puro no mundo do Wumpus um agente ótimo deveria: recuperar o ouro ou determinar que é muito perigoso pegar o ouro e em qualquer dos casos acima, voltar para (1,1) e sair da caverna. Um agente reativo nunca sabe quando sair, estar com o ouro e estar na caverna (1,1) não fazem parte da sua percepção (se pegou, esqueceu). esses agentes podem entrar em laços infinitos.

Agente reativo com estado interno Ambiente Interpretador de percepção Sensores Modelo dos ambientes passados e atual Atualizador do modelo do ambiente Escolhedor de ação Efetuadores

Agente reativo com estado interno Funcionamento: idem anterior + modelo do mundo (memória) Regras associando indiretamente percepção com ação via construção e manutenção de um modelo do ambiente Ação depende da percepção atual + anteriores + ações anteriores... Antes de agir, já atualiza o modelo do ambiente Ex. Fazer uma ultrapassagem em um carro Motivação O ambiente inteiro não é acessível no mesmo momento ex. ultrapassagem de um carro Percepções instantâneas iguais podem corresponder a estados diferentes ex. Wumpus: cavernas visitadas

Agente reativo com estado interno Novos conhecimentos (regras) para atualização do mundo percepção  modelo  modelo’ Modelo’  modelo’’ (talvez) Modelo’’  ação ação  modelo’’  modelo’’’ Regras percepção  modelo  modelo IF visualPercept at time T is glitter AND location of agent at time T is (X,Y) THEN location of gold at time T is (X,Y) X,Y,T see(glitter,T)  loc(agent,X,Y,T)  loc(gold,X,Y,T).

Regras de agente reativo com estado interno Regras modelo  modelo IF known that agent is with gold at time T AND known that location of agent at time T is (X,Y) THEN known that location of gold at time T is (X,Y) Regras modelo  ação IF known that location of agent at time T = (X,Y) AND known that location of gold at time T = (X,Y) THEN choose action at time T to be pick

Regras de agente reativo com estado interno Regras ação  modelo  modelo IF choosen action at time T was pick THEN known that agent is with gold at time T+1 Desvantagem: Autonomia, mas não muito não tem objetivo, não pensa no futuro (só na ação imediata)!!!

Agente deliberativo/cognitivo (baseado em objetivo) Ambiente Interpretador de percepção Modelo dos ambientes passados e atual Sensores Atualizador do modelo do ambiente Atualizador do objetivos Objetivos Preditor de ambientes futuros Modelo de ambientes futuros hipotéticos Escolhedor de ação Efetuadores

Agente Cognitivo Funcionamento (associação percepção-ação) Mediada por modelo do ambiente e objetivo do agente Pode envolver encadear regras para construir plano multi-passo necessário para atingir objetivo a partir de modelo ex. taxista encontrando a rota para o destino do passageiro ex. taxista freia porque quer evitar prejuízo e dor de cabeça no futuro Contém os 4 tipos de regras do agente reativo com estado interno + 2 novos tipos de regras: Regras: objetivo  modelo  ação Regras: objetivo  modelo  objetivo’ Trata o objetivo explicitamente e pensa no futuro!!!!

Regras de agente Cognitivo Regras objetivo  modelo  ação (ações) //O agente escolhe um caminho para o objetivo IF goal of agent at time T is to be in location (X,Y) AND agent is in (X-1, Y-1) at time T-N AND known that location (X,Y-1) is safe at time T-N AND known that location (X,Y) is safe at time T-N THEN choose action Go to X,Y via (X,Y-1)

Regras de agente deliberativo Regras objetivo  modelo  ação (ações) //O agente pode variar a escolha conforme o objetivo, como não matar o wumpus para pegar logo o ouro IF goal of agent is to get the gold AND agent is in (X-1, Y) at time T AND known that the gold is in location (X,Y) AND known that location (X,Y) is safe at time T AND known that Wumpus is in location (X-1,Y+1) at time T AND known that the agent has na arrow at time T THEN choose action Go to X,Y

Regras de agente deliberativo Regras objetivo  modelo  objetivo //Se o agente queria estar com o ouro e conseguiu, atualizar objetivo para ir para (1,1) IF goal of agent at time T is to be with gold at time T+N AND agent is with gold at time T+1 THEN update goal of agent at time T+1 to be in location (1,1) at time T+M

Agente cognitivo (baseado em objetivo) Vantagens e desvantagens: Mais complicado e ineficiente, porém mais flexível e autônomo ex. se começa a chover, já sabe que não pode confiar no freio Não trata objetivos conflitantes ex. chegar ao destino pelo caminho mais curto, seguro, barato, rápido e bonito

Agente otimizador (baseado em utilidade) Ambiente Interpretador de percepção Modelo dos ambientes passados e atual Sensores Atualizador do modelo do ambiente Objetivos potencialmente conflitantes Atualizador do objetivos Utilidades dos objetivos ou ações Preditor de ambientes futuros Modelo de ambientes futuros hipotéticos Escolhedor de ação Efetuadores

Regras de agente otimizador Associação percepção-ação: Mediada por modelo do ambiente, objetivos do agente e utilidades da realização parcial de conjuntos de objetivos Envolve métodos de otimização: busca, pesquisa operacional, etc. Contém 5 dos 6 tipos de regras do agente deliberativo, substituindo: regras objetivo  modelo  ação ...por: regras objetivo  modelo  utilidade, e regras utilidade  ação

Agente que aprende Vantagem: tem adaptabilidade (aprende) sensores crítico avaliação t trocas elemento de execução (agente) elemento de aprendizagem conhecimento a m b i e n t e objetivos de aprendizagem t Gerador de problemas efetuadores Vantagem: tem adaptabilidade (aprende) Ex. motorista sem o mapa da cidade