Sessão 6 – Jogos Bayesianos Teoria dos Jogos Sessão 6 – Jogos Bayesianos
Incertezas em jogos Informação imperfeita: lances dos adversários não são de conhecimento comum Informação incompleta: tipo do jogador adversário não é conhecido
Informação incompleta Premissas todos os jogos tem o mesmo número de jogadores e o mesmo espaço de estratégias as crenças dos jogadores são atualizadas pela formula de Bayes (posterior/prior)
Equilíbrio Bayesiano Um plano de ação para cada jogador (função dos tipos) tais que: Maximize a utilidade esperada para cada tipo de jogador levando em conta: as ações dos outros jogadores e, os tipos que cada jogador pode assumir.
Informação incompleta Premissas Todos os jogos tem o mesmo número de agentes e o mesmo espaço de estratégias As crenças dos agentes são atualizadas pela formula de Bayes (posterior/prior)
Incertezas sobre o jogo (1) (Dutta) Exemplo 1- Dois jogadores P1 e P2. P1 não sabe o tipo de P2 – que pode ser Tipo 1 ou Tipo 2. P2 sabe qual o seu tipo. P1/P2 C NC 0,0 7,-2 -2,7 5,5 P1/P2 C NC 0,-2 7,0 -2,5 5,7
Resolvendo o exemplo 1
Incertezas sobre o jogo (2) (Dutta) Exemplo 2 – Dois jogadores P1 e P2. P1 não sabe o tipo de P2 – que pode ser Tipo 1 ou Tipo 2. P2 sabe qual o seu tipo. P1/P2 C NC 0,0 7,-2 -2,7 5,5 P1/P2 C NC -2,-2 5,0 0,5 7,7
Resolvendo o exemplo 2
Exemplo 3- Jogo do Marketing (Romp)
Jogo do Marketing (2)
Resolvendo o Jogo do Marketing
Exemplo 4- O dilema do Xerife (1) (Coursera/Stanford: Game Theory) Um Xerife encontra um suspeito armado e ambos devem decidir ao mesmo tempo se devem atirar ou não no outro. O suspeito pode ser um criminoso com probabilidade p ou inocente com probabilidade (1 – p). O Xerife prefere atirar se o suspeita também atirar mas não atirar se o suspeito não atirar. Um criminoso prefere atirar mesmo se o Xerife não o faça, já que ele seria preso se não atirar. Um inocente prefere não atirar mesmo que o Xerife atire.
Exemplo 4- O dilema do Xerife (2) Atira Não Innocente -3,-1 -1,-2 -2,-1 0,0 Not Criminoso 2,-2 -1,1
Resolvendo o Dilema do Xerife
E se o jogo for repetido? 1- jogadores podem aprender sobre o tipo do outro observando o histórico de ações 2-jogadores podem tentar esconder sua verdadeira identidade, primeiro criando uma reputação, para poder tirar vantagem depois. A solução desse tipo de jogo utiliza o conceito de Subgame Perfect Nash Equilibrium, que deve satisfazer duas condições: (i) Promessas e ameaças devem ser credíveis. (ii) Jogadores atualizam suas crenças de acordo com a fórmula de Bayes.