Teoria dos Jogos - IAG - A Escola de Negócios da PUC-Rio

Teoria dos Jogos - IAG - A Escola de Negócios da PUC-Rio Teoria dos Jogos - IAG - A Escola de Negócios da PUC-Rio

iag.puc.rio.br
from iag.puc.rio.br More from this publisher
14.11.2014 Views

Dilema dos Prisioneiros: O Jogo da Propaganda Um exemplo de dilema dos prisioneiros na área de decisão de investimentos é o jogo da propaganda. Cenário: Duas firmas concorrentes, Firma 1 e Firma 2, têm de decidir quanto gastar em propaganda. Estratégias: muita propaganda, pouca propaganda. Os resultados são mostradas abaixo: Jogador 2 muita pouca Jogador 1 muita pouca 4; 4 10; 1 1; 10 6; 6 Equilíbrio em estratégias dominantes: Nesse jogo, ambas as firmas têm a mesma estratégia dominante. Dessa forma, o resultado do jogo é (4; 4). Dilema dos prisioneiros: o equilíbrio não é Pareto ótimo, não éo resultado que os jogadores escolheriam se eles pudessem cooperar de forma crível. Dilema dos Prisioneiros: História e Relevância O dilema dos prisioneiros é talvez o jogo mais conhecido porque é uma situação que se repete muito em economia, política e em outros ramos de conhecimento. Apesar de existir ganhos de cooperação, cada jogador tem um incentivo de não-cooperar para qualquer estratégia do outro. Um ex. em política é a corrida nuclear: apesar de construir bombas ser caro, muitos países querem evitar a pior situação (menor payoff) que seria o outro país ter a bomba e ele não ter. Outro exemplo é a chamada “Tragédia dos Comuns”, um caso clássico de sociologia, em que apesar da cooperação gerar benefícios, frequentemente ela não ocorre. Ver slides do anexo. O esquema dilema dos prisioneiros surgiu em jan/1950 quando os profs. M. Dresher e M. Flood usaram ele para criticar o então novo conceito de equilíbrio de Nash (EN). Veremos que o resultado desse jogo é um caso particular de EN A estória original é de A. Tucker (1950), orientador de Nash. 10

O Jogo do Aquecimento Global Outra aplicação do dilema dos prisioneiros é o drama do aquecimento global. A cooperação (redução de emissões) é melhor para todos, mas os países não reduzem as emissões. No discurso, todos dizem que é “urgente” impedir o aquecimento global, mas poucos realmente se comprometem com isso. Na prática o que eles dizem é que é urgente que todos os países, exceto o deles, reduzam as emissões. Ou seja, querem ter o benefício da redução de emissões, sem ter o custo de reduzir o crescimento econômico do seu país. Com a maioria dos países se comportando segundo os seus próprios interesses, o resultado deve ser o desastre ambiental, embora seja Pareto ótimo a cooperação. É o dilema dos prisioneiros. Ver no material o artigo traduzido do The Economist: “Quem perde e quem ganha no jogo do clima?” Esse problema gerado pelo dilema dos prisioneiros pode ser solucionado com jogos repetidos (a ser visto) e com a introdução de estratégias de punição e recompensa. Estratégia de Melhor Resposta Seja V i (σ i , σ − i ) o valor da estratégia mista σ i para o jogador i quando os demais jogam as estratégias mistas σ − i . A estratégia σ i éa melhor resposta de i para o perfil σ − i de J – 1 estratégias mistas dos outros jogadores se: V i (σ i , σ − i ) ≥ V i (σ i ’, σ − i ) , para qualquer σ i ’ ∈ ∆(S i ) ∆(S i ) é o conjunto simplex do conjunto das estratégias puras S i . O simplex é uma extensão do conjunto de estratégias puras S i que assinala probabilidades a todas as M estratégias puras disponíveis para o jogador i. A definição de estratégia pura de melhor resposta é similar. A estratégia pura pode ser vista como uma estratégia mista degenerada (prob. = 1 p/ uma estratégia e zero para as demais) O conceito de melhor resposta é importante, pois será visto que o equilíbrio de Nash pode ser visto como um ponto fixo de estratégias de melhor resposta simultânea. 11

O Jogo do Aquecimento Global<br />

Outra aplicação do dilema <strong>dos</strong> prisioneiros é o drama do<br />

aquecimento global. A cooperação (redução <strong>de</strong> emissões) é<br />

melhor para to<strong>dos</strong>, mas os países não reduzem as emissões.<br />

No discurso, to<strong>dos</strong> dizem que é “urgente” impedir o aquecimento<br />

global, mas poucos realmente se comprometem com isso.<br />

Na prática o que eles dizem é que é urgente que to<strong>dos</strong> os países,<br />

exceto o <strong>de</strong>les, reduzam as emissões.<br />

Ou seja, querem ter o benefício <strong>da</strong> redução <strong>de</strong> emissões, sem ter o<br />

custo <strong>de</strong> reduzir o crescimento econômico do seu país.<br />

Com a maioria <strong>dos</strong> países se comportando segundo os seus próprios<br />

interesses, o resultado <strong>de</strong>ve ser o <strong>de</strong>sastre ambiental, embora seja<br />

Pareto ótimo a cooperação. É o dilema <strong>dos</strong> prisioneiros.<br />

Ver no material o artigo traduzido do The Economist: “Quem<br />

per<strong>de</strong> e quem ganha no jogo do clima?”<br />

Esse problema gerado pelo dilema <strong>dos</strong> prisioneiros po<strong>de</strong><br />

ser solucionado com jogos repeti<strong>dos</strong> (a ser visto) e com a<br />

introdução <strong>de</strong> estratégias <strong>de</strong> punição e recompensa.<br />

Estratégia <strong>de</strong> Melhor Resposta<br />

Seja V i<br />

(σ i<br />

, σ − i<br />

) o valor <strong>da</strong> estratégia mista σ i<br />

para o<br />

jogador i quando os <strong>de</strong>mais jogam as estratégias mistas<br />

σ − i<br />

. A estratégia σ i<br />

éa melhor resposta <strong>de</strong> i para o perfil<br />

σ − i<br />

<strong>de</strong> J – 1 estratégias mistas <strong>dos</strong> outros jogadores se:<br />

V i<br />

(σ i<br />

, σ − i<br />

) ≥ V i<br />

(σ i<br />

’, σ − i<br />

) , para qualquer σ i<br />

’ ∈ ∆(S i<br />

)<br />

∆(S i<br />

) é o conjunto simplex do conjunto <strong>da</strong>s estratégias<br />

puras S i<br />

. O simplex é uma extensão do conjunto <strong>de</strong><br />

estratégias puras S i<br />

que assinala probabili<strong>da</strong><strong>de</strong>s a to<strong>da</strong>s<br />

as M estratégias puras disponíveis para o jogador i.<br />

A <strong>de</strong>finição <strong>de</strong> estratégia pura <strong>de</strong> melhor resposta é similar.<br />

A estratégia pura po<strong>de</strong> ser vista como uma estratégia mista<br />

<strong>de</strong>genera<strong>da</strong> (prob. = 1 p/ uma estratégia e zero para as <strong>de</strong>mais)<br />

O conceito <strong>de</strong> melhor resposta é importante, pois será<br />

visto que o equilíbrio <strong>de</strong> Nash po<strong>de</strong> ser visto como um<br />

ponto fixo <strong>de</strong> estratégias <strong>de</strong> melhor resposta simultânea.<br />

11

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!