14.11.2014 Views

Teoria dos Jogos - IAG - A Escola de Negócios da PUC-Rio

Teoria dos Jogos - IAG - A Escola de Negócios da PUC-Rio

Teoria dos Jogos - IAG - A Escola de Negócios da PUC-Rio

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Jogos</strong> Infinitamente Repeti<strong>dos</strong><br />

Nos jogos repeti<strong>dos</strong> finitos existe uma última <strong>da</strong>ta <strong>de</strong><br />

jogo. Mas em várias interações sociais não existe essa<br />

<strong>da</strong>ta-limite. Nesse caso, são mais a<strong>de</strong>quado os jogos que<br />

potencialmente po<strong>de</strong>m ser infinitamente repeti<strong>dos</strong>.<br />

Nos jogos infinitamente repeti<strong>dos</strong> é mais fácil sustentar<br />

como ENPS uma ação que não é EN no estágio-jogo.<br />

Ex.: cooperar no dilema <strong>dos</strong> prisioneiros po<strong>de</strong> ser ENPS no Γ E∞ .<br />

Mas é necessário usar estratégias <strong>de</strong> punição e recompensa.<br />

Um <strong>dos</strong> critérios p/ comparar estratégias é o VPL (valor<br />

presente líquido) do fluxo <strong>de</strong> lucros <strong>de</strong>scontado por δ < 1.<br />

O fator <strong>de</strong> <strong>de</strong>sconto δ po<strong>de</strong> ser vista como 1/(1 + µ), on<strong>de</strong> µ éa<br />

taxa <strong>de</strong> <strong>de</strong>sconto ajusta<strong>da</strong> ao risco (<strong>da</strong><strong>da</strong> pelo CAPM, por ex.).<br />

O lucro total (VPL) <strong>da</strong> firma i é <strong>da</strong>do por:<br />

VPL i = π i, 1 + (π i, 2 δ) + (π i, 3 δ 2 ) + … + (π i, t δ t − 1 ) + …<br />

Que é finito para π i, t finito, ∀ t. Note que a soma <strong>da</strong> PG infinita<br />

<strong>de</strong> razão menor que 1 é finita: 1 + δ + δ 2 + … = 1/(1 − δ).<br />

Estratégias <strong>de</strong> Punição com Repetição Infinita<br />

Em jogos repeti<strong>dos</strong> os teoremas populares usam as<br />

chama<strong>da</strong>s estratégias <strong>de</strong> punição (“trigger strategies”)<br />

para obter certos payoffs. As três mais usa<strong>da</strong>s são:<br />

Estratégia “Grim” (rígi<strong>da</strong>, intransigente): comece com a ação<br />

“cooperar” (C); continue com C a menos que algum jogador<br />

escolha “não-cooperar” (NC), nesse caso jogue NC p/ sempre.<br />

Na repetição infinita do dilema <strong>dos</strong> prisioneiros po<strong>de</strong>-se sustentar<br />

a cooperação (não-confessar) como ENPS com essa estratégia,<br />

pois quem <strong>de</strong>svia tem um ganho imediato, mas uma per<strong>da</strong> eterna.<br />

Estratégia “tit-for-tat” (“olho-por-olho…”): comece com a<br />

ação “cooperar” (C); nos outros perío<strong>dos</strong>, escolha em t a ação<br />

que o outro jogador escolheu em t − 1. Desvio: ações cíclicas.<br />

Não é ENPS no dilema <strong>dos</strong> prisioneiros, mas com ela Rapoport<br />

ganhou o torneio <strong>de</strong>sse jogo repetido 200 vezes (Axelrod, 1984)!<br />

Estratégia “minimax”: Punir visando a máxima per<strong>da</strong> ao outro<br />

jogador, que então minimiza a máxima per<strong>da</strong> ele que po<strong>de</strong> ter.<br />

Como na “grim”, po<strong>de</strong> ser ENPS a <strong>de</strong>pen<strong>de</strong>r do fator <strong>de</strong> <strong>de</strong>sconto.<br />

34

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!