Teoria dos Jogos - IAG - A Escola de Negócios da PUC-Rio
Teoria dos Jogos - IAG - A Escola de Negócios da PUC-Rio Teoria dos Jogos - IAG - A Escola de Negócios da PUC-Rio
Opções Reais: Teoria e Prática de Análise de Investimentos sob Incertezas Análise Estratégica de Investimentos com Teoria dos Jogos Marco Antonio Guimarães Dias, Professor Adjunto, tempo parcial Rio de Janeiro, Outubro de 2009 . Bibliografia Livros-texto (cobrem apenas parte da matéria): Parte de teoria dos jogos: MWG = Mas-Colell, A. & M.D. Whinston & J.R. Green (1995): “Microeconomic Theory” (espec. caps. 7 a 9); OR e Jogos de OR: DP = Dixit & Pindyck (1994): “Investment under Uncertainty” (dinâmica da indústria e jogos de OR: caps. 8 e 9). Bibliografia complementar que mais uso em teoria dos jogos: Dutta, P.K. (1999): “Strategies and Games”. MIT Press. Gibbons, R. (1992): "Game Theory for Applied Economists". Osborne, M.J. (2004): “An Introduction to Game Theory”. Fudenberg, D. & J. Tirole (1991): “Game Theory”. MIT Press Shy, O. (1995): “Industrial Organization – Theory and Applications”. Menezes, F.M. & P. K. Monteiro (2005): "An Introduction to Auction Theory". Bibliografia complementar que mais uso em jogos de OR: Huisman, K.J.M. (2001): “Technology Investment: A Game Theoretic Real Options Approach”. Smit, H.T.J. & L. Trigeorgis (2004): “Strategic Investment – Real Options and Games”. 1
- Page 2 and 3: O Que É a Teoria dos Jogos? A teo
- Page 4 and 5: T. Schelling e o Pensamento Estrat
- Page 6 and 7: Teoria dos Jogos: Origens e Conceit
- Page 8 and 9: Jogos Dinâmicos de Opção Jogos
- Page 10 and 11: Dilema dos Prisioneiros: O Jogo da
- Page 12 and 13: Equilíbrio de Nash (1950) O perfi
- Page 14 and 15: Equilíbrio de Nash (EN): Notas O
- Page 16 and 17: Software Mais Geral de Teoria dos J
- Page 18 and 19: Duopólio em Quantidades de Cournot
- Page 20 and 21: Curvas de Reação em Cournot A cu
- Page 22 and 23: Cournot em Oligopólios: N Firmas
- Page 24 and 25: Jogos Dinâmicos Até aqui vimos s
- Page 26 and 27: Equilíbrio de Nash Perfeito em Sub
- Page 28 and 29: Barreira de Entrada com Excesso de
- Page 30 and 31: Barreira de Entrada com Excesso de
- Page 32 and 33: Inconsistência Temporal O resulta
- Page 34 and 35: Jogos Infinitamente Repetidos Nos
- Page 36 and 37: Jogos de Informação Incompleta E
- Page 38 and 39: Crise 2007/8 e Informação Assimé
- Page 40 and 41: Desenho de Mecanismo e Princípio d
- Page 42 and 43: Leilões: Motivação e Conceitos B
- Page 44 and 45: Vickrey: Leilão de Segundo Maior L
- Page 46 and 47: História Resumida da Teoria dos Jo
- Page 48 and 49: A Tragédia dos Comuns Esse cláss
- Page 50 and 51: Batalha dos Sexos: EN em Estratégi
Opções Reais: <strong>Teoria</strong> e Prática <strong>de</strong> Análise <strong>de</strong><br />
Investimentos sob Incertezas<br />
Análise Estratégica <strong>de</strong><br />
Investimentos com <strong>Teoria</strong> <strong>dos</strong> <strong>Jogos</strong><br />
Marco Antonio Guimarães Dias,<br />
Professor Adjunto, tempo parcial<br />
<strong>Rio</strong> <strong>de</strong> Janeiro, Outubro <strong>de</strong> 2009 .<br />
Bibliografia<br />
Livros-texto (cobrem apenas parte <strong>da</strong> matéria):<br />
Parte <strong>de</strong> teoria <strong>dos</strong> jogos: MWG = Mas-Colell, A. & M.D. Whinston<br />
& J.R. Green (1995): “Microeconomic Theory” (espec. caps. 7 a 9);<br />
OR e <strong>Jogos</strong> <strong>de</strong> OR: DP = Dixit & Pindyck (1994): “Investment un<strong>de</strong>r<br />
Uncertainty” (dinâmica <strong>da</strong> indústria e jogos <strong>de</strong> OR: caps. 8 e 9).<br />
Bibliografia complementar que mais uso em teoria <strong>dos</strong> jogos:<br />
Dutta, P.K. (1999): “Strategies and Games”. MIT Press.<br />
Gibbons, R. (1992): "Game Theory for Applied Economists".<br />
Osborne, M.J. (2004): “An Introduction to Game Theory”.<br />
Fu<strong>de</strong>nberg, D. & J. Tirole (1991): “Game Theory”. MIT Press<br />
Shy, O. (1995): “Industrial Organization – Theory and Applications”.<br />
Menezes, F.M. & P. K. Monteiro (2005): "An Introduction to Auction Theory".<br />
Bibliografia complementar que mais uso em jogos <strong>de</strong> OR:<br />
Huisman, K.J.M. (2001): “Technology Investment: A Game<br />
Theoretic Real Options Approach”.<br />
Smit, H.T.J. & L. Trigeorgis (2004): “Strategic Investment – Real<br />
Options and Games”.<br />
1
O Que É a <strong>Teoria</strong> <strong>dos</strong> <strong>Jogos</strong>?<br />
A teoria <strong>dos</strong> jogos mo<strong>de</strong>la <strong>de</strong>cisões inter<strong>de</strong>pen<strong>de</strong>ntes<br />
entre agentes que se interagem (conflito ou cooperação).<br />
Os agentes po<strong>de</strong>m ser firmas, instituições, coalizões <strong>de</strong><br />
firmas ou pessoas, países, pessoas, animais irracionais, etc.<br />
O escopo <strong>de</strong> teoria <strong>dos</strong> jogos é bem amplo, sendo usado<br />
em vários ramos <strong>da</strong>s ciências sociais, como economia,<br />
mas também ciências biológicas (conflito <strong>de</strong> animais).<br />
Tem livros só com foco em biologia, em direito, finanças, etc.<br />
Sendo nosso foco em economia/finanças, vamos discutir<br />
a interação estratégica racional entre firmas ou pessoas.<br />
Não basta pensar qual a melhor <strong>de</strong>cisão para você, é necessário<br />
consi<strong>de</strong>rar o que os outros agentes po<strong>de</strong>m fazer e também que<br />
eles estão antecipando o que você po<strong>de</strong> fazer otimamente.<br />
É necessário “calçar os sapatos do outro jogador”, i. é, se colocar no<br />
lugar do outro, ver suas alternativas e ver o que ele sabe sobre você.<br />
Nossa ênfase será mais normativa, i. é, como o jogo <strong>de</strong>ve ser jogado.<br />
Mercado em Competição Perfeita<br />
Num mercado em competição perfeita to<strong>da</strong>s as firmas<br />
são (ou se comportam como) tomadoras <strong>de</strong> preço e<br />
produzem um mesmo bem homogêneo (commodity).<br />
As firmas não “exergam” uma curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> para<br />
maximizar o lucro ajustando quanti<strong>da</strong><strong>de</strong>s. Po<strong>de</strong>m produzir<br />
qualquer quanti<strong>da</strong><strong>de</strong> que o preço será o mesmo.<br />
Para a firma a curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> (q x P) é uma reta horizontal e a<br />
elastici<strong>da</strong><strong>de</strong> <strong>da</strong> <strong>de</strong>man<strong>da</strong> (η) é infinito. O mercado tudo absorve.<br />
As firmas não po<strong>de</strong>m ajustar preços para maximizar o lucro, pois<br />
a firma na<strong>da</strong> ven<strong>de</strong>ria com um preço maior e um preço menor<br />
seria sub-ótimo, já que reduziria seu lucro (ou geraria prejuízo).<br />
Já a indústria “enxerga” uma curva <strong>da</strong><br />
<strong>de</strong>man<strong>da</strong> Q(P) ou gráfico Q x P.<br />
É + usa<strong>da</strong> a função <strong>de</strong>man<strong>da</strong> inversa P(Q).<br />
O preço <strong>de</strong> equilíbrio num certo instante t<br />
é <strong>da</strong>do pela interseção <strong>da</strong>s curvas <strong>de</strong><br />
<strong>de</strong>man<strong>da</strong> x suprimento <strong>da</strong> indústria:<br />
P<br />
P E<br />
Equilíbrio S<br />
E<br />
D<br />
Q E<br />
Q<br />
2
Mercado em Competição Perfeita<br />
Além disso, não é permitido as firmas entrar em colusão<br />
p/ maximizar o lucro ajustando o nível <strong>de</strong> produção Q.<br />
O conceito <strong>de</strong> indústria em competição perfeita in<strong>de</strong>pen<strong>de</strong><br />
do número <strong>de</strong> firmas, po<strong>de</strong> ocorrer até com só 1 firma.<br />
O resultado do duopólio <strong>de</strong> Bertrand equivale a comp. perfeita.<br />
Mas dinamicamente uma indústria converge <strong>da</strong> competição<br />
imperfeita para a perfeita, na maioria <strong>dos</strong> casos, apenas quando<br />
o número <strong>de</strong> firmas cresce p/ uma gran<strong>de</strong> quanti<strong>da</strong><strong>de</strong> <strong>de</strong> firmas.<br />
O resultado clássico (Marshall) mais importante p/ nós é:<br />
Em competição perfeita, com livre entra<strong>da</strong> <strong>de</strong> firmas, o preço<br />
em equilíbrio é tal que o VPL <strong>da</strong> firma entrante é zero.<br />
O mercado em equilíbrio com preço P, é condicional ao<br />
estado <strong>da</strong> <strong>de</strong>man<strong>da</strong> e <strong>da</strong> oferta <strong>da</strong> indústria no tempo t.<br />
Depois, essa teoria microeconômica clássica será estendi<strong>da</strong> p/<br />
um mo<strong>de</strong>lo dinâmico <strong>de</strong> competição perfeita. As curvas <strong>de</strong><br />
oferta e <strong>de</strong>man<strong>da</strong> oscilam e logo o preço será estocástico.<br />
Estruturas <strong>de</strong> Competição num Mercado<br />
VPL entrar = 0 Tipo <strong>de</strong> Competição<br />
VPL entrar ≥ 0<br />
Perfeita<br />
‣ Firma tomadora <strong>de</strong> preço;<br />
‣ Decisão: quanti<strong>da</strong><strong>de</strong> a produzir.<br />
Oligopólio<br />
‣ I<strong>de</strong>m duopólio.<br />
Duopólio<br />
‣ Firma tem <strong>de</strong>man<strong>da</strong> residual;<br />
‣ Decisão: quanti<strong>da</strong><strong>de</strong> ou preço.<br />
Imperfeita<br />
Monopólio<br />
‣ Firma vê curva <strong>de</strong> <strong>de</strong>man<strong>da</strong>;<br />
‣ Decisão: quanti<strong>da</strong><strong>de</strong> ou preço.<br />
Não-Cooperativo<br />
Cooperativo<br />
Estático<br />
‣ Colusão: tácita ou coor<strong>de</strong>na<strong>da</strong>.<br />
Dinâmico<br />
Seqüencial<br />
‣ Mo<strong>de</strong>los <strong>de</strong> lí<strong>de</strong>r-seguidor;<br />
‣ Decisão: quanti<strong>da</strong><strong>de</strong> ou preço.<br />
A<strong>da</strong>ptado <strong>de</strong> “Industrial<br />
Organization”, O. Shy (1995)<br />
Simultâneo<br />
Bertrand<br />
‣Decisão: preço<br />
<strong>Jogos</strong> Repeti<strong>dos</strong><br />
Cournot<br />
‣Decisão: quanti<strong>da</strong><strong>de</strong><br />
3
T. Schelling e o Pensamento Estratégico<br />
O raciocínio estratégico <strong>da</strong> T.J. é bem ilustrado a seguir:<br />
Prêmio Nobel <strong>de</strong> 2005, T. Schelling se diz só um usuário<br />
<strong>da</strong> teoria <strong>dos</strong> jogos, mas ele <strong>de</strong>u várias contribuições:<br />
A obra clássica <strong>de</strong> Thomas Schelling, “Estratégia do Conflito”<br />
(1960) <strong>de</strong>u muita intuição sobre conflitos tais como a guerra<br />
fria, assim como em outras situações <strong>de</strong> conflito e cooperação.<br />
O conceito <strong>de</strong> “commitment” crível: atitu<strong>de</strong>s aparentemente<br />
irracionais <strong>de</strong> eliminar opções para <strong>de</strong>ixar claro o compromisso<br />
<strong>de</strong> que ele irá seguir um caminho, criando uma ameaça crível.<br />
Ex.: caso do conquistador espanhol Cortés, que queimava os<br />
próprios navios para <strong>de</strong>ixar claro ao seu pessoal e ao inimigo que<br />
a opção <strong>de</strong> recuar seria impossível. Outro ex.: queimar pontes.<br />
Coor<strong>de</strong>nação tácita com o conceito <strong>de</strong> ponto focal.<br />
Ex.: um casal marca encontro em New York ao meio-dia, mas<br />
não especifica o local. Pontos focais: Empire State e Penn Station.<br />
Deu contribuições à teoria <strong>de</strong> barganha (1956), especialmente a<br />
discussão <strong>de</strong> ameaças críveis e não-críveis (citei na minha tese).<br />
OR e <strong>Jogos</strong>: <strong>Teoria</strong>s Complementares<br />
Em jogos <strong>de</strong> opções reais, o problema <strong>de</strong> maximização <strong>de</strong><br />
valor <strong>da</strong> firma que analisa um investimento, <strong>de</strong>ve<br />
consi<strong>de</strong>rar a presença <strong>de</strong> outras firmas como jogadores:<br />
Os “players” reagem otimamente aos processos estocásticos<br />
relevantes (exógeno) e às ações <strong>da</strong>s outras firmas (endógeno).<br />
On<strong>de</strong> “endógeno” significa que <strong>de</strong>pen<strong>de</strong> do nosso controle ótimo<br />
e “exógeno” não <strong>de</strong>pen<strong>de</strong> (entra como restrição na otimização).<br />
A teoria <strong>dos</strong> jogos é necessária e entra nas condições <strong>de</strong> contorno<br />
(principalmente), com consi<strong>de</strong>rações sobre o equilíbrio do jogo.<br />
As teorias <strong>dos</strong> jogos e <strong>de</strong> OR são teorias complementares:<br />
A teoria <strong>dos</strong> jogos tradicional sozinha ignora os avanços <strong>da</strong><br />
teoria <strong>de</strong> finanças sobre risco-retorno e sobre o valor <strong>da</strong><br />
flexibili<strong>da</strong><strong>de</strong> gerencial sob incerteza (ignora as opções reais).<br />
A teoria <strong>da</strong>s opções reais (OR) tradicional sozinha ignora o<br />
fato que o exercício <strong>de</strong> opções pelas outras firmas po<strong>de</strong> alterar<br />
o valor <strong>da</strong> sua opção real (ignora a interação estratégica).<br />
Conceitos <strong>de</strong> equilíbrio sob incerteza com opções são requeri<strong>dos</strong>.<br />
4
Conceitos Básicos <strong>de</strong> <strong>Teoria</strong> <strong>dos</strong> <strong>Jogos</strong><br />
Um jogo po<strong>de</strong> ser cooperativo ou não-cooperativo:<br />
Num jogo cooperativo é permitido aos jogadores fazerem<br />
acor<strong>dos</strong> entre si (um contrato, “acordo <strong>de</strong> cavalheiros”, etc.)<br />
Nos jogos não-cooperativos não são permiti<strong>dos</strong> acor<strong>dos</strong>.<br />
<strong>Jogos</strong> não-cooperativos são mais a<strong>de</strong>qua<strong>dos</strong> para mo<strong>de</strong>lar a<br />
competição e a evolução do mercado (microeconomia).<br />
<strong>Jogos</strong> cooperativos são mais a<strong>de</strong>qua<strong>dos</strong> p/ mo<strong>de</strong>lar barganha,<br />
contratos, a firma, acor<strong>dos</strong> sociais, acor<strong>dos</strong> internacionais...<br />
<strong>Jogos</strong> cooperativos são usa<strong>dos</strong> para mo<strong>de</strong>lar a firma, por ex.<br />
<strong>Jogos</strong> não-cooperativos usam conceitos <strong>de</strong> equilíbrio para<br />
prever o resultado <strong>de</strong> um jogo (em geral não são Pareto ótimo).<br />
<strong>Jogos</strong> cooperativos geralmente usam axiomas para estabelecer<br />
regras <strong>de</strong> como se <strong>de</strong>ve jogar. Busca-se o Pareto ótimo.<br />
Enfocaremos quase que só os jogos não-cooperativos por<br />
serem muito mais usa<strong>dos</strong> em economia e finanças (em<br />
especial a competição) do que os jogos cooperativos.<br />
Conceitos Básicos <strong>de</strong> <strong>Teoria</strong> <strong>dos</strong> <strong>Jogos</strong><br />
Os jogos po<strong>de</strong>m ser classifica<strong>dos</strong> como jogos <strong>de</strong> somafixa<br />
e jogos <strong>de</strong> soma variável (esses são mais relevantes).<br />
Regras do jogo (não-cooperativo, se não especificado):<br />
Os lances <strong>dos</strong> jogadores são simultâneos ou alterna<strong>dos</strong>?<br />
Quem joga e quando?<br />
O que ca<strong>da</strong> jogador sabe (conjunto <strong>de</strong> informação) na sua vez<br />
<strong>de</strong> jogar? O que os outros jogadores sabem nesse instante?<br />
Quais as ações e planos (estratégias) possíveis?<br />
Resulta<strong>dos</strong> e payoffs: para ca<strong>da</strong> conjunto <strong>de</strong> estratégias,<br />
qual é o resultado do jogo? Quanto vale esse resultado?<br />
Na teoria <strong>dos</strong> jogos tradicional, que em muitos casos analisa as<br />
<strong>de</strong>cisões <strong>de</strong> indivíduos, usa-se a função utili<strong>da</strong><strong>de</strong> espera<strong>da</strong>.<br />
Para firmas, a mo<strong>de</strong>rna teoria <strong>de</strong> finanças recomen<strong>da</strong> usar<br />
valores <strong>de</strong> mercado ou valores <strong>de</strong> opções reais (ativos reais).<br />
Nos jogos <strong>de</strong> opções reais os payoffs são valores <strong>de</strong> opções reais.<br />
5
<strong>Teoria</strong> <strong>dos</strong> <strong>Jogos</strong>: Origens e Conceitos<br />
A mo<strong>de</strong>rna teoria <strong>dos</strong> jogos começa com Nash em 1950’s<br />
O chamado equilíbrio <strong>de</strong> Nash é o conceito mais importante e<br />
mais aceito <strong>da</strong> teoria <strong>dos</strong> jogos não-cooperativos.<br />
É a base <strong>de</strong> outros equilíbrios (perfeito, Bayesiano, etc.)<br />
Nash também formulou a mais importante solução em jogos<br />
cooperativos: a solução <strong>de</strong> Nash para jogos <strong>de</strong> barganha.<br />
Conceitos antigos como o minimax e maximin (ver anexo), vem<br />
per<strong>de</strong>ndo o interesse na literatura econômica.<br />
Algumas <strong>de</strong>finições básicas <strong>de</strong> teoria <strong>dos</strong> jogos.<br />
Defini-se estratégia s i do jogador i como uma regra <strong>de</strong> <strong>de</strong>cisão<br />
ou plano contingente completo que <strong>de</strong>screve as ações a serem<br />
toma<strong>da</strong>s em ca<strong>da</strong> possível evolução do jogo on<strong>de</strong> o jogador i é<br />
chamado a jogar. Se a estratégia for <strong>de</strong>terminística, é chama<strong>da</strong><br />
<strong>de</strong> estratégia pura, se probabilística é chama<strong>da</strong> estratégia mista.<br />
As estratégias <strong>dos</strong> outros jogadores são <strong>de</strong>nota<strong>da</strong>s por s − i .<br />
Um jogo é <strong>de</strong>scrito especificando os jogadores, as regras, os<br />
possíveis resulta<strong>dos</strong> e os valores (“payoffs”) <strong>de</strong>sses resulta<strong>dos</strong>.<br />
Representação Formal <strong>dos</strong> <strong>Jogos</strong><br />
Os jogos não-cooperativos po<strong>de</strong>m ser formaliza<strong>dos</strong> e<br />
apresenta<strong>dos</strong> em dois formatos (a serem <strong>de</strong>talha<strong>dos</strong>):<br />
Na forma normal (ou estratégica), <strong>de</strong>nota<strong>da</strong> por Γ N , com uma<br />
representação por matrizes para os payoffs <strong>dos</strong> jogadores;<br />
Na forma extensiva, <strong>de</strong>nota<strong>da</strong> por Γ E , com uma árvore <strong>de</strong> jogos.<br />
Árvore <strong>de</strong> jogos éuma árvore <strong>de</strong> <strong>de</strong>cisão generaliza<strong>da</strong> para<br />
múltiplos <strong>de</strong>cisores (os jogadores).<br />
Os jogos cooperativos precisam <strong>de</strong> um terceiro formato:<br />
É preciso consi<strong>de</strong>rar a possibili<strong>da</strong><strong>de</strong> <strong>de</strong> coalizões, isto é, subconjuntos<br />
<strong>dos</strong> N jogadores. Existem 2 N − 1 coalizões possíveis.<br />
As coalizões S ⊆ N jogam entre si diferentes tipos <strong>de</strong> jogos e<br />
internamente possuem uma regra <strong>de</strong> divisão do payoff ganho.<br />
A forma coalizão, <strong>de</strong>nota<strong>da</strong> por Γ C , através <strong>da</strong> <strong>de</strong>finição do par<br />
{N; C} no jogo <strong>de</strong> N jogadores e com função característica C(S).<br />
A função característica C(S) representa as possibili<strong>da</strong><strong>de</strong>s <strong>de</strong><br />
cooperação para a coalizão S. É a utili<strong>da</strong><strong>de</strong> total <strong>da</strong> coalização S<br />
(ou riqueza ou po<strong>de</strong>r <strong>de</strong> S) a ser transferi<strong>da</strong> aos seus membros.<br />
6
ExemplonaForma Normal ouEstratégica<br />
Exemplo: jogo do par ou ímpar com disputa <strong>de</strong> 1 R$<br />
Estratégias puras<br />
para o jog. 1<br />
Jogador 2<br />
(ímpar)<br />
par ímpar<br />
Estratégias puras<br />
para o jog. 2<br />
par<br />
Jogador 1<br />
(par)<br />
ímpar<br />
1; 0 0; 1<br />
0; 1 1; 0<br />
Payoff do jog. 1 Payoff do jog. 2<br />
Veremos que o único equilíbrio do jogo do par ou ímpar é o<br />
equilíbrio probabilístico ou em estratégias mistas: ca<strong>da</strong> jogador<br />
joga “par” com 50% <strong>de</strong> chance e “ímpar”com 50% chances.<br />
Dado um conjunto <strong>de</strong> estratégias puras S i<br />
, uma estratégia mista para<br />
um jogador i é uma função σ i<br />
: S i<br />
→ [0, 1], que assinala a ca<strong>da</strong> estratégia<br />
pura s i<br />
∈ S i<br />
, uma probabili<strong>da</strong><strong>de</strong> σ i<br />
(s i<br />
) ≥ 0. A soma <strong>dos</strong> σ p/ to<strong>dos</strong> s i é= 1.<br />
Jogo do Par ou Ímpar na Forma Extensiva<br />
A forma extensiva é mais usa<strong>da</strong> para jogos dinâmicos e com<br />
lances seqüenciais. Mas po<strong>de</strong> ser usa<strong>da</strong> também p/ jogos<br />
com lances simultâneos, como no jogo do par ou ímpar:<br />
par<br />
Jogador 1<br />
ímpar<br />
Jogador 2<br />
par ímpar par ímpar<br />
Elipse significa que o<br />
jog. 2 não sabe em qual<br />
<strong>dos</strong> dois nós ele está.<br />
(usa-se tb. reta traceja<strong>da</strong>)<br />
Convenção payoff:<br />
jog. 1 pediu par<br />
jog. 2 pediu ímpar<br />
(1; 0) (0; 1) (0; 1) (1; 0)<br />
Nos jogos simultâneos ou <strong>de</strong> informação imperfeita, usa-se uma<br />
elipse circun<strong>da</strong>ndo os nós do mesmo conjunto <strong>de</strong> informação.<br />
Se o jogo fosse <strong>de</strong> lances alterna<strong>dos</strong>, o jogador 2 saberia em<br />
que nó ele estaria e po<strong>de</strong>ria ganhar $1 com a melhor resposta.<br />
7
<strong>Jogos</strong> Dinâmicos <strong>de</strong> Opção<br />
<strong>Jogos</strong> dinâmicos envolvem seqüências <strong>de</strong> ações.<br />
Constitui a maioria <strong>dos</strong> jogos <strong>de</strong> opções reais.<br />
Ex.: jogo <strong>de</strong> opção real com duas firmas. Elas <strong>de</strong>ci<strong>de</strong>m<br />
<strong>de</strong> forma seqüencial se exercem (E) ou não exercem (NE)<br />
uma opção <strong>de</strong> entrar. Os payoffs são valores <strong>de</strong> opções.<br />
D i = valor em duopólio <strong>da</strong> firma i e M i = valor em monopólio <strong>de</strong> i.<br />
E<br />
E<br />
(D 1 ; D 2 ) (M 1 ; 0)<br />
Firma 1<br />
Firma 2<br />
NE E<br />
NE<br />
(0; M 2 )<br />
NE<br />
Note que na forma normal<br />
não se po<strong>de</strong>ria capturar a<br />
dinâmica do jogo. Por isso é<br />
necessária a forma extensiva.<br />
Aqui o jogo é <strong>de</strong> informação<br />
perfeita, pois a firma 2 <strong>de</strong>ci<strong>de</strong><br />
sabendo o lance jogado pela<br />
firma 1.<br />
(0; 0)<br />
Conceitos Básicos <strong>de</strong> <strong>Teoria</strong> <strong>dos</strong> <strong>Jogos</strong><br />
Um jogo é dito <strong>de</strong> informação perfeita se ca<strong>da</strong> conjunto<br />
<strong>de</strong> informação só contém um nó <strong>de</strong> <strong>de</strong>cisão <strong>da</strong> árvore.<br />
Caso contrário é dito <strong>de</strong> informação imperfeita. Ex.: pôquer.<br />
Já o jogo <strong>de</strong> xadrêz é exemplo <strong>de</strong> jogo <strong>de</strong> informação perfeita.<br />
Algumas premissas usuais em teoria <strong>dos</strong> jogos:<br />
O jogo é assumido ser <strong>de</strong> memória perfeita (“perfect recall”), i.<br />
é, uma jogadora nunca esquece a informação que sabia antes<br />
<strong>de</strong> chegar até aquele estágio do jogo.<br />
Também se assume conhecimento comum (“common<br />
knowledge”), i. é, ca<strong>da</strong> jogador conhece a estrutura do jogo<br />
(inclusive os valores) e sabem que os outros também conhecem,<br />
que sabem que os outros sabem que eles conhecem, etc.<br />
Um perfil <strong>de</strong> estratégias puras <strong>de</strong> um jogo com J jogadores<br />
é um vetor s = (s 1<br />
, s 2<br />
, … s J<br />
) em que s i<br />
é escolhi<strong>da</strong> pelo<br />
jogador i. Po<strong>de</strong> ser escrito como (s i<br />
, s − i<br />
) para ressaltar o<br />
ponto <strong>de</strong> vista <strong>de</strong> i em relação aos outros J – 1 jogadores.<br />
8
Estratégia Dominante e o Dilema <strong>dos</strong> Prisioneiros<br />
Estratégia dominante é uma estratégia que é ótima para<br />
um jogador in<strong>de</strong>pen<strong>de</strong>ntemente <strong>da</strong>(s) estratégia(s)<br />
escolhi<strong>da</strong>(s) pelo(s) outro(s) jogador(es) (s − i ).<br />
Equilíbrio com estratégias dominantes é quando ca<strong>da</strong> jogador<br />
possui e joga a sua estratégia dominante. Ex. clássico a seguir.<br />
O dilema <strong>dos</strong> prisioneiros é um jogo clássico que ilustra a<br />
não-cooperação como equilíbrio com estratégia dominante.<br />
Dois ladrões são presos e coloca<strong>dos</strong> em salas separa<strong>da</strong>s. Para ca<strong>da</strong><br />
ladrão, o <strong>de</strong>tetive propõe que ele confesse o crime e sirva <strong>de</strong><br />
testemunha contra o outro. Se um <strong>dos</strong> ladrões confessar o crime e o<br />
outro não, aquele que confessou será posto em liber<strong>da</strong><strong>de</strong> e o outro<br />
cumprirá pena <strong>de</strong> 10 anos. Se os dois confessarem, ambos ficarão<br />
presos por 3 anos. Se nenhum <strong>dos</strong> dois confessarem, a penali<strong>da</strong><strong>de</strong><br />
será <strong>de</strong> apenas um ano. Qual o resultado mais provável do jogo?<br />
Note que se eles pu<strong>de</strong>ssem se comunicar e fazer acor<strong>dos</strong> críveis <strong>de</strong><br />
serem cumpri<strong>dos</strong>, a estratégia cooperativa (não-confessar) seria a<br />
melhor para ambos. Sem acordo, só há o incentivo <strong>de</strong> trair o outro.<br />
O Jogo Dilema <strong>dos</strong> Prisioneiros<br />
Os payoffs são “anos <strong>de</strong> ca<strong>de</strong>ia” com sinal negativo.<br />
Assim, valores mais próximos <strong>de</strong> zero são os preferíveis.<br />
confessa<br />
(não-coopera)<br />
Prisioneiro 2<br />
não confessa<br />
(coopera)<br />
Prisioneiro 1<br />
confessa<br />
(não-coopera)<br />
não confessa<br />
(coopera)<br />
−3; −3 0; −10<br />
−10; 0 −1; −1<br />
O equilíbrio é em estratégias dominantes (um caso<br />
particular <strong>de</strong> equilíbrio <strong>de</strong> Nash) e é muito comum em<br />
várias situações sociais (ex.: a tragédia <strong>dos</strong> comuns).<br />
9
Dilema <strong>dos</strong> Prisioneiros: O Jogo <strong>da</strong> Propagan<strong>da</strong><br />
Um exemplo <strong>de</strong> dilema <strong>dos</strong> prisioneiros na área <strong>de</strong><br />
<strong>de</strong>cisão <strong>de</strong> investimentos é o jogo <strong>da</strong> propagan<strong>da</strong>.<br />
Cenário: Duas firmas concorrentes, Firma 1 e Firma 2,<br />
têm <strong>de</strong> <strong>de</strong>cidir quanto gastar em propagan<strong>da</strong>.<br />
Estratégias: muita propagan<strong>da</strong>, pouca propagan<strong>da</strong>.<br />
Os resulta<strong>dos</strong> são mostra<strong>da</strong>s abaixo:<br />
Jogador 2<br />
muita pouca<br />
Jogador 1<br />
muita<br />
pouca<br />
4; 4<br />
10; 1<br />
1; 10 6; 6<br />
<br />
<br />
Equilíbrio em estratégias dominantes: Nesse jogo, ambas as firmas têm a<br />
mesma estratégia dominante. Dessa forma, o resultado do jogo é (4; 4).<br />
Dilema <strong>dos</strong> prisioneiros: o equilíbrio não é Pareto ótimo, não éo resultado<br />
que os jogadores escolheriam se eles pu<strong>de</strong>ssem cooperar <strong>de</strong> forma crível.<br />
Dilema <strong>dos</strong> Prisioneiros: História e Relevância<br />
O dilema <strong>dos</strong> prisioneiros é talvez o jogo mais conhecido<br />
porque é uma situação que se repete muito em<br />
economia, política e em outros ramos <strong>de</strong> conhecimento.<br />
Apesar <strong>de</strong> existir ganhos <strong>de</strong> cooperação, ca<strong>da</strong> jogador tem um<br />
incentivo <strong>de</strong> não-cooperar para qualquer estratégia do outro.<br />
Um ex. em política é a corri<strong>da</strong> nuclear: apesar <strong>de</strong> construir<br />
bombas ser caro, muitos países querem evitar a pior situação<br />
(menor payoff) que seria o outro país ter a bomba e ele não ter.<br />
Outro exemplo é a chama<strong>da</strong> “Tragédia <strong>dos</strong> Comuns”, um caso<br />
clássico <strong>de</strong> sociologia, em que apesar <strong>da</strong> cooperação gerar<br />
benefícios, frequentemente ela não ocorre. Ver sli<strong>de</strong>s do anexo.<br />
O esquema dilema <strong>dos</strong> prisioneiros surgiu em jan/1950<br />
quando os profs. M. Dresher e M. Flood usaram ele para<br />
criticar o então novo conceito <strong>de</strong> equilíbrio <strong>de</strong> Nash (EN).<br />
Veremos que o resultado <strong>de</strong>sse jogo é um caso particular <strong>de</strong> EN<br />
A estória original é <strong>de</strong> A. Tucker (1950), orientador <strong>de</strong> Nash.<br />
10
O Jogo do Aquecimento Global<br />
Outra aplicação do dilema <strong>dos</strong> prisioneiros é o drama do<br />
aquecimento global. A cooperação (redução <strong>de</strong> emissões) é<br />
melhor para to<strong>dos</strong>, mas os países não reduzem as emissões.<br />
No discurso, to<strong>dos</strong> dizem que é “urgente” impedir o aquecimento<br />
global, mas poucos realmente se comprometem com isso.<br />
Na prática o que eles dizem é que é urgente que to<strong>dos</strong> os países,<br />
exceto o <strong>de</strong>les, reduzam as emissões.<br />
Ou seja, querem ter o benefício <strong>da</strong> redução <strong>de</strong> emissões, sem ter o<br />
custo <strong>de</strong> reduzir o crescimento econômico do seu país.<br />
Com a maioria <strong>dos</strong> países se comportando segundo os seus próprios<br />
interesses, o resultado <strong>de</strong>ve ser o <strong>de</strong>sastre ambiental, embora seja<br />
Pareto ótimo a cooperação. É o dilema <strong>dos</strong> prisioneiros.<br />
Ver no material o artigo traduzido do The Economist: “Quem<br />
per<strong>de</strong> e quem ganha no jogo do clima?”<br />
Esse problema gerado pelo dilema <strong>dos</strong> prisioneiros po<strong>de</strong><br />
ser solucionado com jogos repeti<strong>dos</strong> (a ser visto) e com a<br />
introdução <strong>de</strong> estratégias <strong>de</strong> punição e recompensa.<br />
Estratégia <strong>de</strong> Melhor Resposta<br />
Seja V i<br />
(σ i<br />
, σ − i<br />
) o valor <strong>da</strong> estratégia mista σ i<br />
para o<br />
jogador i quando os <strong>de</strong>mais jogam as estratégias mistas<br />
σ − i<br />
. A estratégia σ i<br />
éa melhor resposta <strong>de</strong> i para o perfil<br />
σ − i<br />
<strong>de</strong> J – 1 estratégias mistas <strong>dos</strong> outros jogadores se:<br />
V i<br />
(σ i<br />
, σ − i<br />
) ≥ V i<br />
(σ i<br />
’, σ − i<br />
) , para qualquer σ i<br />
’ ∈ ∆(S i<br />
)<br />
∆(S i<br />
) é o conjunto simplex do conjunto <strong>da</strong>s estratégias<br />
puras S i<br />
. O simplex é uma extensão do conjunto <strong>de</strong><br />
estratégias puras S i<br />
que assinala probabili<strong>da</strong><strong>de</strong>s a to<strong>da</strong>s<br />
as M estratégias puras disponíveis para o jogador i.<br />
A <strong>de</strong>finição <strong>de</strong> estratégia pura <strong>de</strong> melhor resposta é similar.<br />
A estratégia pura po<strong>de</strong> ser vista como uma estratégia mista<br />
<strong>de</strong>genera<strong>da</strong> (prob. = 1 p/ uma estratégia e zero para as <strong>de</strong>mais)<br />
O conceito <strong>de</strong> melhor resposta é importante, pois será<br />
visto que o equilíbrio <strong>de</strong> Nash po<strong>de</strong> ser visto como um<br />
ponto fixo <strong>de</strong> estratégias <strong>de</strong> melhor resposta simultânea.<br />
11
Equilíbrio <strong>de</strong> Nash (1950)<br />
O perfil <strong>de</strong> estratégias s = (s 1<br />
, s 2<br />
, … s J<br />
) é um equilíbrio <strong>de</strong><br />
Nash (EN) em estratégias puras <strong>de</strong> um jogo se, para todo<br />
jogador i = 1, 2, …, J, vale a <strong>de</strong>sigual<strong>da</strong><strong>de</strong>:<br />
V i<br />
(s i<br />
, s − i<br />
) ≥ V i<br />
(s i<br />
’, s − i<br />
) , para qualquer s i<br />
’ ∈ S i<br />
O EN implica que as estratégias que fazem parte <strong>de</strong>sse<br />
equilíbrio são simultaneamente as melhores respostas para<br />
to<strong>dos</strong> os jogadores. Esse é um resultado fun<strong>da</strong>mental.<br />
Dessa forma, não há incentivo para nenhum jogador <strong>de</strong>sviar<br />
<strong>de</strong>sse equilíbrio, unilateralmente. Ex.: dilema <strong>dos</strong> prisioneiros.<br />
Para saber se é equilíbrio <strong>de</strong> Nash, basta fazer a seguinte<br />
pergunta a ca<strong>da</strong> jogador separa<strong>da</strong>mente: mu<strong>da</strong>ndo a sua<br />
estratégia você ficaria melhor (aumentaria V i<br />
)? Se as respostas<br />
<strong>de</strong> to<strong>dos</strong> os jogadores forem negativas, então é um EN.<br />
A <strong>de</strong>finição <strong>de</strong> EN para estratégias mistas é similar à apresenta<strong>da</strong>.<br />
Para se testar se o perfil σ é EN, basta testar <strong>de</strong>svios <strong>de</strong> σ para as<br />
estratégias puras s. Se não houver incentivo para <strong>de</strong>sviar, σ éEN.<br />
Eq. <strong>de</strong> Nash: Competição Internacional<br />
Embraer x Bombadier no mercado <strong>de</strong> jatos executivos<br />
Suponha que sem subsídios para a Bombadier, a matriz<br />
<strong>de</strong> payoffs para a fabricação <strong>de</strong> um novo mo<strong>de</strong>lo <strong>de</strong> jato é:<br />
Desenvolve<br />
Bombadier<br />
Não Desenvolve<br />
Embraer<br />
Desenvolve<br />
−10; −10 100; 0<br />
Não Desenvolve<br />
0 ; 100 0; 0<br />
Ou seja, dois EN em estratégias puras (e um EN em<br />
estratégias mistas). Na prática, existem os riscos <strong>de</strong> ambos<br />
<strong>de</strong>senvolverem o jato e terem prejuízo, ou não investirem.<br />
12
Mercado <strong>de</strong> Jatos Executivos com Subsídios<br />
Agora suponha que o governo do Canadá dá $ 20 <strong>de</strong><br />
subsídio para a Bombadier para <strong>de</strong>senvolver jatos<br />
executivos (ex.: taxas <strong>de</strong> juros abaixo do mercado).<br />
A nova matriz <strong>de</strong> payoffs mostra a mu<strong>da</strong>nça do EN:<br />
Desenvolve<br />
Bombadier<br />
Não Desenvolve<br />
Embraer<br />
Desenvolve<br />
−10; +10 100; 0<br />
Não Desenvolve<br />
0; 120 0; 0<br />
Ou seja, o subsídio fez com que a estratégia investir (<strong>de</strong>senvolver<br />
o projeto <strong>de</strong> jato executivo) se tornasse estratégia dominante para<br />
a Bombadier. O único EN é a Bombadier sozinha no mercado.<br />
<strong>Jogos</strong> Repeti<strong>dos</strong>: Cooperação é Possível<br />
No dilema <strong>dos</strong> prisioneiros vimos que não é equilíbrio<br />
{cooperar; cooperar}, mesmo sendo Pareto dominante.<br />
No entanto, foi assumido que o jogo é jogado apenas uma vez.<br />
Existem casos em que o jogo po<strong>de</strong> ser repetido pelas<br />
firmas e o resultado {cooperar; cooperar} po<strong>de</strong> ser EN.<br />
Com a repetição, ca<strong>da</strong> firma po<strong>de</strong> criar reputação sobre o seu<br />
comportamento e apren<strong>de</strong>r sobre o comportamento <strong>dos</strong> rivais.<br />
Ocorre no caso <strong>de</strong> poucas firmas, com <strong>de</strong>man<strong>da</strong> e custos estáveis.<br />
Estu<strong>dos</strong> experimentais tais como “torneios <strong>de</strong> repeti<strong>dos</strong><br />
dilema <strong>de</strong> prisioneiros”, mostra que a estratégia “tit-fortat”<br />
(retribuição/retaliação) po<strong>de</strong> sustentar a cooperação<br />
Tit-for tat: estratégia é cooperar no instante inicial e continuar<br />
cooperando enquanto o outro coopera. Retaliar (não cooperar)<br />
se o outro não-coopera. Voltar a cooperar se o outro o fizer.<br />
Teoremas populares (“folk theorems”) para jogos repeti<strong>dos</strong><br />
infinitamente, mostram que a cooperação po<strong>de</strong> ser EN.<br />
13
Equilíbrio <strong>de</strong> Nash (EN): Notas<br />
O conceito <strong>de</strong> equilíbrio <strong>de</strong> Nash (EN) po<strong>de</strong> ser<br />
intepretado e usado <strong>de</strong> várias maneiras:<br />
Normativo: aconselhar to<strong>dos</strong> os jogadores. O conselho tem <strong>de</strong><br />
ser equilíbrio no sentido <strong>de</strong> ter relativa estabili<strong>da</strong><strong>de</strong>, não sendo<br />
ótimo para um jogador ganhar mais ao não seguir o conselho.<br />
EN é melhor resposta simultânea e não há incentivo em <strong>de</strong>sviar.<br />
Predição: Num processo dinâmico <strong>de</strong> ajustes, o EN po<strong>de</strong> ser<br />
interpretado como um ponto estável. Muito usado em biologia.<br />
Sustentabili<strong>da</strong><strong>de</strong>: é um acordo “self-enforcing” (<strong>de</strong> autocumprimento),<br />
pois não precisa <strong>de</strong> aju<strong>da</strong> externa para manter<br />
ao ser do próprio interesse <strong>de</strong> ca<strong>da</strong> jogador seguir o EN.<br />
O conceito <strong>de</strong> EN ajudou a <strong>de</strong>ixar claro a distinção entre<br />
jogos não-cooperativos e jogos cooperativos:<br />
Em jogos cooperativos há acor<strong>dos</strong> que po<strong>de</strong>m ser força<strong>dos</strong> (em<br />
tribunais, contratos, etc.) Em jogos não-cooperativos nãohátais<br />
mecanismos ⇒ só resulta<strong>dos</strong> <strong>de</strong> equilíbrios são sustentáveis.<br />
Eq. <strong>de</strong> Nash: Exercício & Experimento<br />
Esse exercício é interessante como um experimento que<br />
po<strong>de</strong> ser feito em sala <strong>de</strong> aula, mas que você po<strong>de</strong> fazer<br />
numa ro<strong>da</strong> <strong>de</strong> amigos(as) e/ou familiares.<br />
Ilustra a necessi<strong>da</strong><strong>de</strong> do pensamento estratégico para toma<strong>da</strong> <strong>de</strong><br />
<strong>de</strong>cisão. Ou seja, tem <strong>de</strong> pensar no que os outros farão, etc.<br />
Peça para ca<strong>da</strong> participante escrever o seu nome e um<br />
número entre zero e 100 numa folha <strong>de</strong> papel.<br />
Informe antes que o ganhador do jogo será aquele que<br />
escrever o número mais próximo <strong>da</strong> meta<strong>de</strong> <strong>da</strong> média<br />
<strong>dos</strong> números escritos.<br />
Após a primeira ro<strong>da</strong><strong>da</strong>, conhecido o vencedor e o valor<br />
médio, peça a to<strong>dos</strong> que joguem novamente o jogo.<br />
O que ocorreu com a média e o lance vencedor, <strong>da</strong>do a “lição”<br />
obti<strong>da</strong> com o resultado <strong>da</strong> primeira vez que foi jogado?<br />
Determine o equilíbrio <strong>de</strong> Nash (EN) <strong>de</strong>sse jogo.<br />
14
Jogo “Assurance” ou “Stag-Hunt”<br />
O jogo Stag-Hunt e suas variantes, também conheci<strong>da</strong>s<br />
como “assurance game” (jogo <strong>da</strong> garantia) ou jogo <strong>de</strong><br />
coor<strong>de</strong>nação ou dilema <strong>da</strong> confiança, tem sido usado<br />
para mo<strong>de</strong>lar conflitos sociais (ex.: livro <strong>de</strong> Brian, 2004,<br />
“Stag Hunt and Evolution of Social Structure”).<br />
Mostra o dilema entre a segurança x cooperação social.<br />
Estória (Rousseau): dois caçadores po<strong>de</strong>m caçar uma lebre<br />
(hare) ou um cervo adulto (stag). A lebre po<strong>de</strong> ser caça<strong>da</strong> por<br />
uma só pessoa, mas o cervo necessita <strong>dos</strong> dois (cooperação).<br />
Jogo tem dois EN em estratégias puras (e um em est. mistas),<br />
sendo um risco dominante e outro payoff dominante. Ex.:<br />
Caçador 2<br />
Cervo Lebre<br />
Cervo 4 ; 4 0 ; 3<br />
Caçador 1<br />
Lebre 3 ; 0 3 ; 3<br />
Software Para <strong>Jogos</strong> na Forma Normal<br />
Um <strong>dos</strong> programas disponíveis na internet para resolver<br />
jogos na forma normal é um applet Java que fica em:<br />
http://www.gametheory.net/Mike/applets/NormalForm/NormalForm.html<br />
Existe também uma versão em português (link na pág. acima).<br />
O applet acha os equilíbrios para jogos <strong>de</strong> 2 jogadoras com até<br />
4 estratégias puras (matrizes até 4 x 4) e estratégias mistas só<br />
para o caso <strong>de</strong> matriz 2 x 2. Ver abaixo o ex. batalha <strong>dos</strong> sexos.<br />
Ele permite carregar alguns exemplos clássicos já prontos:<br />
15
Software Mais Geral <strong>de</strong> <strong>Teoria</strong> <strong>dos</strong> <strong>Jogos</strong><br />
O software Gambit é um software mais geral que<br />
resolve jogos na forma normal e na forma extensiva.<br />
Mesmo na forma normal, permite mais <strong>de</strong> dois jogadores<br />
e é menos limitado que o anterior. Escrito em C++, tem<br />
interface amigável para Windows. Última versão jan/2007.<br />
Webpage do Gambit: http://gambit.sourceforge.net/<br />
Inclui links para download e documentação (com arquivos<br />
<strong>de</strong> exemplos). Exs. <strong>de</strong> janelas (formas normal e extensiva):<br />
Preços e Curva <strong>de</strong> Deman<strong>da</strong> Inversa<br />
A curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> <strong>de</strong> um produto relaciona preços com a <strong>de</strong>man<strong>da</strong>.<br />
Preço mais baixo tem maior <strong>de</strong>man<strong>da</strong> e preço alto tem menor <strong>de</strong>man<strong>da</strong>.<br />
No duopólio, as firmas têm como <strong>da</strong>do uma função <strong>de</strong>man<strong>da</strong><br />
inversa p = f(Q T ): o preço do produto é função <strong>da</strong> produção <strong>da</strong><br />
indústria Q T = q 1 + q 2 . As estratégias <strong>da</strong>s firmas são q 1 e q 2 .<br />
Ver os gráficos <strong>da</strong>s curvas <strong>de</strong> <strong>de</strong>man<strong>da</strong> exponencial e linear (planilha).<br />
Nas figuras aparecem duas curvas <strong>de</strong> <strong>de</strong>man<strong>da</strong>, uma <strong>de</strong>las eleva<strong>da</strong><br />
refletindo uma economia aqueci<strong>da</strong> (vermelha) e a outra mais baixa,<br />
refletindo um <strong>de</strong>saquecimento do consumo (curva azul).<br />
16
Competição por Quanti<strong>da</strong><strong>de</strong>s em Duopólio<br />
Duas firmas divi<strong>de</strong>m um mercado geográfico <strong>de</strong> um produto.<br />
Equilíbrio <strong>de</strong> Cournot (1838): simultaneamente e <strong>de</strong> forma<br />
in<strong>de</strong>pen<strong>de</strong>nte os jogadores escolhem as quanti<strong>da</strong><strong>de</strong>s, e o<br />
preço é tal que o total ofertado é igual a <strong>de</strong>man<strong>da</strong>.<br />
Veremos que o resultado <strong>de</strong> Cournot é um EN único para esse jogo<br />
em que as estratégias são quanti<strong>da</strong><strong>de</strong>s escolhi<strong>da</strong>s simultaneamente.<br />
Curva <strong>de</strong> reação <strong>de</strong> Cournot: especifica a produção ótima <strong>de</strong> uma<br />
firma em função <strong>da</strong>s possíveis produções <strong>da</strong> outra firma.<br />
Equilíbrio <strong>de</strong> Stackelberg: sequencialmente, em dois estágios,<br />
uma firma (lí<strong>de</strong>r) estabelece sua produção e <strong>de</strong>pois a outra firma<br />
(seguidor), observando o lí<strong>de</strong>r, estabelece a sua própria produção.<br />
A produção e o lucro no mo<strong>de</strong>lo <strong>de</strong> Stackelberg são maiores para o<br />
lí<strong>de</strong>r e menores para o seguidor (vantagem <strong>de</strong> jogar primeiro). O<br />
lí<strong>de</strong>r maximiza o lucro <strong>da</strong>do a curva <strong>de</strong> reação do seguidor.<br />
Iremos ver <strong>de</strong>pois que esse resultado é um EN perfeito em subjogos<br />
para o jogo seqüencial em que as estratégias são quanti<strong>da</strong><strong>de</strong>s. Mas<br />
ele tem problemas <strong>de</strong> inconsistência temporal: não é EN se o jogo<br />
continuar após a entra<strong>da</strong> do seguidor (há incentivo p/ <strong>de</strong>sviar).<br />
Monopólio com Deman<strong>da</strong> Linear<br />
Da<strong>da</strong> a relação 1-1 entre preço e quanti<strong>da</strong><strong>de</strong> estabeleci<strong>da</strong><br />
na curva <strong>de</strong> <strong>de</strong>man<strong>da</strong>, um monopolista po<strong>de</strong> escolher ou<br />
preço ou quanti<strong>da</strong><strong>de</strong> a produzir, mas não ambas.<br />
O monopolista irá maximizar o lucro seja usando o preço<br />
ou usando a quanti<strong>da</strong><strong>de</strong> como variável <strong>de</strong> controle.<br />
Seja uma curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> linear (a mais usa<strong>da</strong>) <strong>da</strong><strong>da</strong><br />
por p = a – b Q. Assuma que o custo fixo do monopolista<br />
é zero e o custo variável é c. O lucro do monopolista é:<br />
π M = p Q – c Q ⇒ π M = (a – b Q) Q – c Q = (a –c) Q –b Q 2 .<br />
Para maximizar o lucro usa-se a condição <strong>de</strong> 1ª or<strong>de</strong>m<br />
(CPO): ∂π M /∂Q = 0 (checar a <strong>de</strong> 2ª or<strong>de</strong>m: ∂ 2 π M /∂Q 2 < 0).<br />
Os valores obti<strong>dos</strong> (quanti<strong>da</strong><strong>de</strong>, preço e lucro, respectiv.) são:<br />
q<br />
M<br />
a−<br />
c<br />
2b<br />
= pM<br />
a+<br />
c<br />
=<br />
2<br />
π<br />
M<br />
(a − c)<br />
=<br />
4b<br />
2<br />
17
Duopólio em Quanti<strong>da</strong><strong>de</strong>s <strong>de</strong> Cournot<br />
No problema <strong>da</strong> escolha ótima <strong>de</strong> quanti<strong>da</strong><strong>de</strong> q i , a(s)<br />
firma(s) resolvem problemas <strong>de</strong> maximização <strong>de</strong> lucro π i .<br />
Para maximizar o lucro usa-se a condição <strong>de</strong> 1ª or<strong>de</strong>m<br />
(CPO): ∂π i /∂q i = 0 (checar a <strong>de</strong> 2ª or<strong>de</strong>m: ∂ 2 π i /∂q i2 < 0).<br />
No caso do duopólio, o equilíbrio <strong>de</strong> Nash-Cournot é<br />
obtido com ambas as firmas escolhendo as quanti<strong>da</strong><strong>de</strong>s<br />
que maximizam o lucro, consi<strong>de</strong>rando no problema <strong>de</strong><br />
otimização que a firma rival estará fazendo o mesmo.<br />
Pois o EN é a melhor resposta simultânea (não há incentivo<br />
para nenhum jogador <strong>de</strong>sviar se estiver sendo jogado o EN) e é<br />
assumido conhecimento comum (a firma sabe que a outra ...).<br />
Melhor resposta simultânea: curvas <strong>de</strong> melhor resposta se cruzam.<br />
Se o custo operacional (fixo + variável) <strong>de</strong> ca<strong>da</strong> firma é<br />
C i (q i ) e a função <strong>de</strong>man<strong>da</strong> é p(Q T ), as funções lucros são:<br />
π 1 = q 1 p(Q T ) − C 1 (q 1 ) e π 2 = q 2 p(Q T ) − C 2 (q 2 )<br />
Duopólio em Equilíbrio <strong>de</strong> Nash-Cournot<br />
Seja uma curva inversa <strong>de</strong> <strong>de</strong>man<strong>da</strong> linear (por ser mais<br />
simples, é a mais usa<strong>da</strong>), on<strong>de</strong> os preços são <strong>da</strong><strong>dos</strong> por:<br />
p(Q T<br />
) = a − b Q T<br />
⇒ p(Q T<br />
) = a − b (q 1<br />
+ q 2<br />
) ,<br />
com q 1 ≥ 0 ; q 2 ≥ 0 ; e a e b tal que p > 0<br />
Se o custo fixo é zero, a função lucro <strong>da</strong> firma i (1 ou 2) é:<br />
π i = q i a − q i b (q 1 + q 2 ) − c i q i = q i (a − c i ) − q i b (q 1 + q 2 )<br />
On<strong>de</strong> c i é chamado <strong>de</strong> custo operacional variável <strong>da</strong> firma i.<br />
A curva <strong>de</strong> reação ou curva <strong>de</strong> melhor resposta <strong>da</strong> firma i<br />
(i = 1; 2) em relação a produção <strong>da</strong> firma j (j ≠ i), q i *(q j ),<br />
é obti<strong>da</strong> com a condição <strong>de</strong> 1ª or<strong>de</strong>m (CPO).<br />
A interseção <strong>da</strong>s duas curvas <strong>de</strong> reação, q 1<br />
*(q 2<br />
) e q 2<br />
*(q 1<br />
),<br />
é o ponto <strong>de</strong> melhor resposta simultânea ⇒ éEN!<br />
Para tal, basta substituir a curva <strong>de</strong> melhor resposta <strong>de</strong><br />
uma na <strong>da</strong> outra, isto é, obter q 1<br />
*(q 2<br />
*) e q 2<br />
*(q 1<br />
*). O par<br />
{q 1<br />
*(q 2<br />
*); q 2<br />
*(q 1<br />
*)} é EN (próx. sli<strong>de</strong>):<br />
18
Competição <strong>de</strong> Cournot em Duopólios<br />
Nesse caso com custo fixo igual a zero e <strong>de</strong>man<strong>da</strong> linear,<br />
as curvas <strong>de</strong> reação q i *(q j ), os lucros π i , o preço e as<br />
quanti<strong>da</strong><strong>de</strong>s em EN-Cournot {q 1 *(q 2 *); q 2 *(q 1 *)} são:<br />
Funções melhor<br />
resposta (reação):<br />
Funções Lucro<br />
em EN-Cournot:<br />
Preço em EN-Cournot:<br />
Quanti<strong>da</strong><strong>de</strong>s em EN<br />
(estratégias em EN):<br />
q(q)<br />
1 2<br />
a−c − b q<br />
2b<br />
a−c − b q<br />
2b<br />
1 2<br />
2 1<br />
= q(q)<br />
2 1<br />
=<br />
p<br />
EN-C<br />
= a − b Q<br />
q(q)<br />
=<br />
EN-C<br />
T<br />
a− 2 c + c<br />
3b<br />
* * 1 2<br />
1 2<br />
=<br />
a+ c + c<br />
3<br />
q(q)<br />
1 2<br />
=<br />
a− 2 c + c<br />
3b<br />
* * 2 1<br />
2 1<br />
Assim, quanto menor o seu próprio custo e maior o custo do oponente,<br />
maior o seu lucro e a sua produção no EN-Cournot (como esperado).<br />
Como a > c i , o preço em EN é maior que o custo médio <strong>da</strong>s firmas.<br />
Os gráficos a seguir ilustram o cruzamento <strong>da</strong>s curvas <strong>de</strong> reação (EN).<br />
Curvas <strong>de</strong> Reação em Cournot<br />
A curva <strong>de</strong> reação <strong>da</strong> firma (jogador) 1 dá a melhor<br />
resposta q 1 a ca<strong>da</strong> possível estratégia q 2 <strong>da</strong> firma 2.<br />
Solução <strong>de</strong> Monopólio (só firma 1 produz)<br />
a−<br />
c 1<br />
2b<br />
q 1<br />
Curva <strong>de</strong> Reação q 1 *(q 2 )<br />
q 2<br />
Produção q 2 equivale a<br />
Competição Perfeita<br />
(firma 1 não produz)<br />
a−<br />
c 1<br />
b<br />
A curva <strong>de</strong> reação <strong>da</strong> firma 2 é similar (troca os eixos <strong>dos</strong> X com<br />
os <strong>dos</strong> Y). Girando um <strong>dos</strong> gráficos (para que os eixos coinci<strong>da</strong>m)<br />
po<strong>de</strong>remos ver o cruzamentos <strong>da</strong>s curvas (= EN), ver sli<strong>de</strong>s:<br />
19
Curvas <strong>de</strong> Reação em Cournot<br />
A curva <strong>de</strong> reação <strong>da</strong> firma (jogador) 2 dá a melhor<br />
resposta q 2 a ca<strong>da</strong> possível estratégia q 1 <strong>da</strong> firma 1.<br />
q 2<br />
Girando ⇒<br />
a−<br />
c 2<br />
Curva <strong>de</strong> Reação q 2 *(q 1 )<br />
2b<br />
a−<br />
c 2<br />
b<br />
q 1<br />
q 2<br />
Curva <strong>de</strong> Reação q 2 *(q 1 )<br />
q 1<br />
q 1<br />
a−<br />
c 2<br />
b<br />
Curva <strong>de</strong> Reação q 2 *(q 1 )<br />
a −<br />
c 2<br />
2<br />
2b<br />
2b<br />
q 2<br />
a−<br />
c 2<br />
b<br />
Curvas <strong>de</strong> Reação e EN em Cournot<br />
O cruzamento <strong>da</strong>s curvas <strong>de</strong> reação é o ponto em que<br />
temos melhor resposta simultânea ⇒ EN.<br />
q 1<br />
q 2<br />
a−<br />
c 2<br />
b<br />
a−<br />
c 1<br />
2b<br />
Curva <strong>de</strong> Reação q 2 *(q 1 )<br />
EN-Cournot<br />
Curva <strong>de</strong> Reação q 1 *(q 2 )<br />
a−<br />
c 2<br />
2b<br />
a−<br />
c 1<br />
b<br />
20
Exemplo Numérico: Competição por Quanti<strong>da</strong><strong>de</strong>s<br />
Consi<strong>de</strong>re uma curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> inversa linear, <strong>da</strong><strong>da</strong> pela<br />
equação: p = 30 − Q T<br />
(ver planilha duopolio_sob_certeza.xls)<br />
Por simplici<strong>da</strong><strong>de</strong>, seja o custo variável igual a zero, ou, <strong>de</strong><br />
forma alternativa, consi<strong>de</strong>re p a margem <strong>de</strong> lucro operacional.<br />
A função lucro π i<br />
<strong>da</strong> firma i é a margem vezes as ven<strong>da</strong>s:<br />
π i = p q i = (30 − Q T ) q i<br />
Na competição perfeita, as firmas irão produzir até a margem p<br />
cair a zero (logo, produzirão q 1 = q 2 = 15 ⇒ Q T = 30 ⇒ p = 0);<br />
No monopólio, a única firma escolhe Q T p/ maximizar o lucro<br />
(<strong>de</strong>riva<strong>da</strong> do lucro π em relação à produção = 0 ⇒ Q T = 15); e<br />
Colusão é quando as firmas se juntam e agem como monopólio<br />
Vimos que no duopólio on<strong>de</strong> as estratégias simultâneas<br />
são quanti<strong>da</strong><strong>de</strong>s, o equilíbrio <strong>de</strong> Cournot é o EN do jogo.<br />
A curva <strong>de</strong> reação <strong>da</strong> firma i é obti<strong>da</strong> pela maximização ∂π i / ∂q i =<br />
0, que dá as curvas <strong>de</strong> melhor resposta q i = f(q j ) p/ ca<strong>da</strong> jogador.<br />
O cruzamento <strong>de</strong>ssas curvas é o EN <strong>de</strong> Cournot (ponto fixo).<br />
Duopólio: Vários Possíveis Resulta<strong>dos</strong><br />
Para enten<strong>de</strong>r os possíveis equilíbrios, serão plota<strong>da</strong>s as curvas<br />
<strong>de</strong> reação <strong>da</strong>s duas firmas, i. é, as funções melhor resposta <strong>dos</strong><br />
dois jogadores <strong>da</strong><strong>da</strong> as estratégias <strong>da</strong>s outras firmas.<br />
Curva <strong>de</strong> Reação <strong>da</strong> Firma 2<br />
(vale para Cournot e Stackelberg)<br />
Equilíbrio <strong>de</strong> Stackelberg<br />
Equilíbrio Competitivo<br />
(*) Margem <strong>de</strong>pois <strong>da</strong> entra<strong>da</strong> do seguidor.<br />
Antes <strong>da</strong> entra<strong>da</strong> do seguidor a margem do<br />
lí<strong>de</strong>r é p = 30 – 15 = 15 = margem <strong>da</strong> colusão.<br />
Lucro = π i<br />
= (30 − Q T ) q i<br />
Uma solução<br />
<strong>de</strong> Colusão<br />
Curva <strong>de</strong><br />
Contrato<br />
Equilíbrio <strong>de</strong> Cournot<br />
Curva <strong>de</strong> Reação em<br />
Cournot, Firma 1<br />
Margem = p = 30 − Q T<br />
21
Cournot em Oligopólios: N Firmas<br />
Seja o caso <strong>de</strong> oligopólio com N firmas (N > 1) com<br />
<strong>de</strong>cisão simultânea competindo em quanti<strong>da</strong><strong>de</strong>s<br />
(Cournot). Consi<strong>de</strong>re as N firmas homogêneas (mesmo<br />
custo unitário c) e <strong>de</strong>man<strong>da</strong> linear (custo fixo = 0).<br />
A produção <strong>de</strong> ca<strong>da</strong> firma e a produção total <strong>da</strong> indústria em<br />
EN-Cournot é (basta resolver para 1 firma homogênea):<br />
q<br />
i<br />
= q =<br />
a − c<br />
(N + 1) b<br />
⇒ Q = q = N q =<br />
T<br />
∑<br />
i<br />
N (a − c)<br />
(N + 1) b<br />
O preço <strong>de</strong> equilíbrio no mercado (“market clearing price”) é:<br />
2<br />
a + N c<br />
(a − c)<br />
2<br />
p =<br />
Já o lucro <strong>de</strong> ca<strong>da</strong> firma é: π<br />
i<br />
= = b q<br />
2<br />
i<br />
N + 1<br />
(N + 1) b<br />
Agora po<strong>de</strong>mos ver o que ocorre no mercado quando N →∞:<br />
a − c<br />
lim Q<br />
T<br />
=<br />
lim p = c<br />
N →∞<br />
N →∞<br />
b<br />
Que são os resulta<strong>dos</strong> do caso <strong>de</strong> competição perfeita sem custo<br />
<strong>de</strong> entra<strong>da</strong> para produção e preço (= custo marginal; lucro = 0).<br />
Comparação <strong>dos</strong> Mo<strong>de</strong>los<br />
A produção <strong>da</strong> indústria é maior em competição perfeita (cp)<br />
do que em Cournot (C) que é maior que a do monopólio (m):<br />
(a −c) N (a −c) (a −c)<br />
Q<br />
cp<br />
= > Q<br />
C<br />
= > Q<br />
m<br />
=<br />
b (N+<br />
1) b 2 b<br />
Além disso, em Cournot a produção <strong>da</strong> indústria Q aumenta<br />
com a competição (n o <strong>de</strong> firmas N) e no limite ten<strong>de</strong> a c.p.:<br />
∂Q C<br />
(a − c)<br />
= > 0<br />
(a − c)<br />
2<br />
lim Q<br />
C<br />
= = Qcp<br />
∂ N (N+ 1) b<br />
N→∞<br />
b<br />
Já o preço é o contrário: o maior é em monopólio, seguido <strong>de</strong><br />
Cournot, e o menor preço é competição perfeita (= custo c):<br />
a + c a + N c<br />
p<br />
m<br />
= > p<br />
C<br />
= > p<br />
cp<br />
= c<br />
2 N + 1<br />
A competição (N gran<strong>de</strong>) reduz o preço:<br />
∂p C<br />
− (a − c)<br />
=<br />
2<br />
∂ N (N + 1)<br />
< 0<br />
(pois a > c)<br />
Exercício: mostre que o lucro <strong>da</strong> indústria tem a mesma<br />
or<strong>de</strong>nação acima para o preço e que diminui com N.<br />
22
Oligopólio <strong>de</strong> Cournot em Fusões & Aquisições<br />
Para ilustrar o caso <strong>de</strong> N firmas em Cournot, imagine<br />
um mercado petroquímico com 4 firmas homogêneas.<br />
Uma on<strong>da</strong> <strong>de</strong> fusões e aquisições fez com que o mercado<br />
fosse reduzido <strong>de</strong> 4 para 2 firmas, também homogêneas.<br />
Assuma que existam barreiras <strong>de</strong> entra<strong>da</strong> <strong>de</strong> produtos <strong>de</strong><br />
firmas estrangeiras <strong>de</strong>vido a custos <strong>de</strong> transporte e tarifas<br />
alfan<strong>de</strong>gárias, <strong>de</strong> forma que só essas firmas competem.<br />
Isso é realista no Brasil apenas <strong>de</strong>ntro <strong>de</strong> certos limites <strong>de</strong> preços.<br />
Assuma que a curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> do mix <strong>de</strong> produtos é<br />
linear e <strong>da</strong><strong>da</strong> por p = 180 – 8 Q T , on<strong>de</strong> p = preço do mix<br />
<strong>de</strong> produtos e o custo médio unitário é c = 70 $/uni<strong>da</strong><strong>de</strong>.<br />
Determine os preços, quanti<strong>da</strong><strong>de</strong>s e lucros em equil. <strong>de</strong> Nash-<br />
Cournot antes e <strong>de</strong>pois <strong>da</strong>s fusões. Quem ganha e quem per<strong>de</strong>?<br />
Agora consi<strong>de</strong>re que as fusões permitiram uma redução <strong>de</strong><br />
custo unitário para c´ = 60 $/uni<strong>da</strong><strong>de</strong>. Quais são os novos<br />
preços, quanti<strong>da</strong><strong>de</strong>s e lucros? Use a planilha oligopolio.xls.<br />
Oligopólio <strong>de</strong> Cournot em Fusões & Aquisições<br />
Os resulta<strong>dos</strong> do caso <strong>de</strong> fusões sem reduzir custos são:<br />
Assim, as firmas ganharam com as fusões, mas em<br />
<strong>de</strong>trimento <strong>da</strong> ren<strong>da</strong> <strong>dos</strong> consumidores (maiores preços).<br />
Os resulta<strong>dos</strong> do caso <strong>de</strong> fusões com redução <strong>de</strong> custos são:<br />
Ain<strong>da</strong> assim os preços subiram, embora menos que o caso anterior.<br />
Qual seria a redução <strong>de</strong> custo necessária para que os<br />
preços ao consumidor não aumentem? R: c´ = 48 $/unid.<br />
23
<strong>Jogos</strong> Dinâmicos<br />
Até aqui vimos só jogos estáticos, on<strong>de</strong> os jogadores se<br />
encontravam uma só vez, o tempo não era uma variável.<br />
Agora serão vistos jogos dinâmicos on<strong>de</strong> o tempo é<br />
relevante e/ou os jogadores se encontram várias vezes.<br />
Os jogos dinâmicos po<strong>de</strong>m ser jogos repeti<strong>dos</strong> ou não-repeti<strong>dos</strong>.<br />
Os jogos dinâmicos po<strong>de</strong>m ser <strong>de</strong>terminísticos ou estocásticos.<br />
Antes, os elementos ação e estratégia se confundiam, mas<br />
em jogos dinâmicos é necessário lembrar a diferença:<br />
Uma estratégia s i do jogador i éum plano completo <strong>de</strong> ações tal<br />
que especifica uma ação factível a i, c em ca<strong>da</strong> contingência c na<br />
qual o jogador i possa ser chamado a jogar.<br />
Ca<strong>da</strong> contingência c po<strong>de</strong> ser interpreta<strong>da</strong> como ca<strong>da</strong> instante t.<br />
A ação <strong>de</strong> um jogador po<strong>de</strong> ou não ser observável pelo(s) outro(s).<br />
Para analisar jogos dinâmicos precisamos do conceito <strong>de</strong><br />
Equilíbrio <strong>de</strong> Nash Perfeito em Subjogos (ENPS).<br />
Refinamentos do EN: Equilíbrio Perfeito<br />
O gran<strong>de</strong> problema prático do EN é que geralmente se<br />
têm múltiplos ENs. Isso é freqüente em jogos dinâmicos.<br />
A pergunta natural é: qual o equilíbrio que <strong>de</strong>ve prevalecer?<br />
Em jogos dinâmicos, o conceito <strong>de</strong> EN não consegue eliminar<br />
várias estratégias não-críveis. É necessário adicionar uma<br />
racionali<strong>da</strong><strong>de</strong> seqüencial no caminho do equilíbrio.<br />
Princípio <strong>da</strong> racionali<strong>da</strong><strong>de</strong> seqüencial: a estratégia <strong>de</strong> um jogador<br />
<strong>de</strong>ve especificar ações ótimas em to<strong>dos</strong> os pontos <strong>da</strong> árvore <strong>de</strong> jogos.<br />
Selten (1965) introduziu o conceito <strong>de</strong> equilíbrio <strong>de</strong> Nash<br />
perfeito em subjogos (ENPS) para jogos dinâmicos.<br />
ENPS usa o princípio <strong>da</strong> racionali<strong>da</strong><strong>de</strong> seqüencial e o<br />
conhecido processo <strong>de</strong> otimização backwards (retro-indução):<br />
Estabelece primeiro as estratégias ótimas nos nós terminais e<br />
<strong>de</strong>pois vai estabelecendo as estratégias ótimas nos nós anteriores.<br />
O precursor foi o teorema Zermelo (1913) que po<strong>de</strong> ser enunciado<br />
assim “todo jogo finito <strong>de</strong> informação perfeita tem um EN em<br />
estratégias puras que po<strong>de</strong> ser obtido através <strong>de</strong> retro-indução”.<br />
24
Subjogos<br />
Antes <strong>de</strong> <strong>de</strong>finir o ENPS é necessário <strong>de</strong>finir subjogo:<br />
Subjogo é um subconjunto do jogo Γ E<br />
com as proprie<strong>da</strong><strong>de</strong>s: (a)<br />
começa num conjunto <strong>de</strong> informação que contém apenas um<br />
nó <strong>de</strong> <strong>de</strong>cisão e contém to<strong>dos</strong> os nós sucessores; (b) não há<br />
conjuntos <strong>de</strong> informação quebra<strong>dos</strong>, i. é, se o nó <strong>de</strong> <strong>de</strong>cisão x<br />
está no subjogo, então ca<strong>da</strong> nó x’ ∈ H(x) (i. é, o conjunto <strong>de</strong><br />
informação on<strong>de</strong> está x) também estará no subjogo.<br />
Todo jogo tem pelo menos um subjogo que é o próprio jogo.<br />
Firma 1<br />
não é subjogo (não contém<br />
E NE to<strong>dos</strong> os nós sucessores)<br />
Firma 2<br />
E NE E<br />
(D 1 ; D 2 ) (M 1 ; 0) (0; M 2 )<br />
NE<br />
(0; 0)<br />
subjogo<br />
Quantos subjogos existem?<br />
R: 3 subjogos.<br />
Subjogos<br />
Exemplo <strong>da</strong> segun<strong>da</strong> condição para ser subjogo:<br />
Esse jogo só tem um único subjogo que é o próprio jogo.<br />
Po<strong>de</strong> ser interpretado como um jogo simultâneo ou como<br />
um jogo seqüencial on<strong>de</strong> a ação <strong>da</strong> firma 1 não é observável.<br />
Firma 1<br />
E<br />
NE<br />
Firma 2<br />
E NE E<br />
(D 1 ; D 2 ) (M 1 ; 0) (0; M 2 )<br />
NE<br />
(0; 0)<br />
Não é subjogo, pois não<br />
po<strong>de</strong> haver conjuntos <strong>de</strong><br />
informação quebra<strong>dos</strong>.<br />
Informação imperfeita x incompleta.<br />
Caso acima é informação imperfeita. Veremos <strong>de</strong>pois o outro caso.<br />
25
Equilíbrio <strong>de</strong> Nash Perfeito em Subjogos<br />
O perfil <strong>de</strong> estratégias σ = (σ 1<br />
, σ 2<br />
, … σ J<br />
) no jogo na<br />
forma extensiva Γ E<br />
éum Equilíbrio <strong>de</strong> Nash Perfeito em<br />
Subjogos se ele induz um EN em ca<strong>da</strong> subjogo <strong>de</strong> Γ E<br />
.<br />
No jogo finito com informação perfeita ele po<strong>de</strong> ser obtido<br />
backwards e o Teorema <strong>de</strong> Zermelo diz que existe o ENPS.<br />
O ENPS é único caso nenhum jogador tenha os mesmos payoffs<br />
em nós terminais quaisquer. Faremos um exemplo numérico.<br />
Existe uma ligação estreita óbvia entre o conceito <strong>de</strong> ENPS e o<br />
<strong>de</strong> programação dinâmica: ambos usam otimização backwards.<br />
Para <strong>de</strong>terminar o ENPS inicia-se procurando o(s) EN nos nós<br />
terminais, substitui-se esse subjogo pelos payoffs do EN e analisa o<br />
sujogo pre<strong>de</strong>cessor, procurando o EN, etc., até chegar ao início.<br />
Nos casos <strong>de</strong> jogos infinitos, a <strong>de</strong>finição <strong>de</strong> ENPS permanece no<br />
sentido <strong>de</strong> que induz EN em to<strong>dos</strong> os subjogos, apesar <strong>de</strong> não ter<br />
a “última <strong>da</strong>ta” para trabalhar backwards. Faremos um exemplo.<br />
Trabalhar com horizonte infinito é fácil, pois o tempo <strong>de</strong>ixa <strong>de</strong> ser<br />
variável <strong>de</strong> estado (sempre terá um horizonte infinito pela frente).<br />
Equilíbrio <strong>de</strong> Nash Perfeito em Subjogos<br />
Jogo abaixo: a forma normal mostra que existem<br />
dois EN. Forma extensiva mostra que só um é ENPS.<br />
1<br />
u<br />
2<br />
d<br />
0<br />
3<br />
½<br />
2<br />
U<br />
L<br />
1<br />
u<br />
D<br />
R<br />
2<br />
-2<br />
-2<br />
d<br />
1<br />
-1<br />
1<br />
UL<br />
UR<br />
DL<br />
DR<br />
0<br />
0<br />
½<br />
-2<br />
3<br />
3<br />
2<br />
-2<br />
0<br />
0<br />
1<br />
1<br />
3<br />
3<br />
-1<br />
-1<br />
• Dois EN em estratégias puras (ver forma normal). Mas um <strong>de</strong>les<br />
não é crível (não é sequencialmente racional).<br />
• Um ENPS em estratégias puras: (DL ; u). É o EN “crível”.<br />
26
Procedimento Backward Induction<br />
O procedimento <strong>de</strong> retro-indução (backward induction) é:<br />
Começe nos nós terminais do jogo e i<strong>de</strong>ntifique quem joga.<br />
Ache a <strong>de</strong>cisão ótima do jogador nos nós <strong>de</strong> <strong>de</strong>cisão comparando<br />
os payoffs que os jogadores recebem em ca<strong>da</strong> nó terminal.<br />
Registre essa escolha, ela é parte <strong>da</strong> estratégia ótima <strong>dos</strong> jogadores.<br />
Po<strong>da</strong>r a árvore cortando to<strong>dos</strong> os ramos que se originaram <strong>de</strong> #1.<br />
Atribuir a ca<strong>da</strong> um <strong>de</strong>sses novos nós terminais os payoffs obti<strong>dos</strong><br />
quando a ação ótima é realiza<strong>da</strong> nesse nó.<br />
Uma nova árvore <strong>de</strong> jogo existe e é menor que a original.<br />
Se não existirem mais nós <strong>de</strong> <strong>de</strong>cisão, o jogo termina. Se ain<strong>da</strong><br />
existirem nós <strong>de</strong> <strong>de</strong>cisão, aplicar os passos #1 a #4 até não haver<br />
mais nós <strong>de</strong> <strong>de</strong>cisão.<br />
Para ca<strong>da</strong> jogador, selecione as <strong>de</strong>cisões ótimas em ca<strong>da</strong> nó. Esse<br />
conjunto <strong>de</strong> <strong>de</strong>cisões constitem as estratégias ótimas <strong>de</strong>sse jogo.<br />
O resultado é um equilíbrio <strong>de</strong> Nash perfeito em subjogos.<br />
O ENPS po<strong>de</strong> ser único ou não (mesmo payoff em nós <strong>de</strong> <strong>de</strong>cisão).<br />
Ex: Barreira <strong>de</strong> Entra<strong>da</strong> com Excesso <strong>de</strong> Capaci<strong>da</strong><strong>de</strong><br />
O caso a seguir é uma variante do mo<strong>de</strong>lo <strong>de</strong> Stackelberg<br />
<strong>de</strong> lí<strong>de</strong>r e seguidor (caso mais geral é visto em segui<strong>da</strong>).<br />
A motivação <strong>de</strong>sse exemplo é um famoso caso <strong>de</strong> 1945: o<br />
processo antitrust contra o po<strong>de</strong>r <strong>de</strong> monopólio <strong>da</strong> Alcoa,<br />
que dominava 90% do mercado <strong>de</strong> alumínio nos EUA.<br />
A Alcoa foi con<strong>de</strong>na<strong>da</strong> porque o juiz enten<strong>de</strong>u que o rápido<br />
acúmulo <strong>de</strong> capaci<strong>da</strong><strong>de</strong> <strong>de</strong> produção por parte <strong>da</strong> Alcoa, que<br />
excedia muito os níveis <strong>de</strong> <strong>de</strong>man<strong>da</strong>, tinha como objetivo criar<br />
uma barreira <strong>de</strong> entra<strong>da</strong> para inibir a entra<strong>da</strong> <strong>de</strong> competidores.<br />
Veremos que a teoria <strong>dos</strong> jogos e o ENPS po<strong>de</strong> justificar a<br />
<strong>de</strong>cisão do juiz americano, assim como o argumento usado.<br />
Suponha que duas firmas estão consi<strong>de</strong>rando entrar ou<br />
não no mercado, e também como (capaci<strong>da</strong><strong>de</strong>) entrar.<br />
Seja P o preço <strong>de</strong> equilíbrio e Q T a produção total <strong>da</strong> indústria<br />
que aqui é a soma <strong>da</strong>s produções <strong>da</strong>s duas firmas q 1 + q 2 .<br />
27
Barreira <strong>de</strong> Entra<strong>da</strong> com Excesso <strong>de</strong> Capaci<strong>da</strong><strong>de</strong><br />
Seja uma curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> inversa linear <strong>da</strong><strong>da</strong> por:<br />
P = 900 – Q T ou P = 900 – q 1 –q 2<br />
Assuma que existem só duas alternativas <strong>de</strong><br />
investimento em capaci<strong>da</strong><strong>de</strong>s: pequena e gran<strong>de</strong>.<br />
A uni<strong>da</strong><strong>de</strong> pequena <strong>de</strong>man<strong>da</strong> um investimento I p<br />
= US$<br />
50.000 e permite produzir 100 uni<strong>da</strong><strong>de</strong>s.<br />
A uni<strong>da</strong><strong>de</strong> gran<strong>de</strong> teria <strong>de</strong> investir I g<br />
= US$ 175.000 e<br />
permitiria produzir qualquer quanti<strong>da</strong><strong>de</strong> <strong>de</strong> uni<strong>da</strong><strong>de</strong>s.<br />
Assim, só a uni<strong>da</strong><strong>de</strong> pequena é que tem restrição <strong>de</strong> capaci<strong>da</strong><strong>de</strong>.<br />
Suponha que em ambos os casos o custo operacional é zero.<br />
Assuma que a entra<strong>da</strong> <strong>da</strong>s firmas é seqüencial:<br />
Primeiro a firma 1 <strong>de</strong>ci<strong>de</strong> se entra e com que capaci<strong>da</strong><strong>de</strong> e<br />
<strong>de</strong>pois a firma 2, observando a ação <strong>da</strong> firma 1, <strong>de</strong>ci<strong>de</strong> se<br />
entra ou não e com que capaci<strong>da</strong><strong>de</strong>.<br />
Determine o Equilíbrio <strong>de</strong> Nash Perfeito em Subjogos (ENPS).<br />
Barreira <strong>de</strong> Entra<strong>da</strong> com Excesso <strong>de</strong> Capaci<strong>da</strong><strong>de</strong><br />
Para achar o ENPS, vamos fazer alguns cálculos:<br />
Suponha que a firma i está sozinha no mercado. Assim, o preço<br />
duma uni<strong>da</strong><strong>de</strong> é P = 900 – q i e a receita R i = q i (900 – q i ).<br />
O lucro <strong>de</strong> i é maximizado escolhendo q i = 450, que dá uma<br />
receita (= lucro oper., pois o custo oper. = 0) <strong>de</strong> R* i = 202.500.<br />
Mas a firma i só produz 450 se ela investir na uni<strong>da</strong><strong>de</strong> gran<strong>de</strong>.<br />
Se ela investiu na uni<strong>da</strong><strong>de</strong> pequena, ela só produziria 100 e só<br />
obteria uma receita (lucro) <strong>de</strong> R = 80.000.<br />
Suponha que esses valores estão to<strong>dos</strong> em valor presente, <strong>de</strong><br />
forma que os VPLs <strong>dos</strong> dois casos anteriores seriam:<br />
Uni<strong>da</strong><strong>de</strong> gran<strong>de</strong>: VPL g = R – I g = 202.500 – 175.000 = $ 27.500.<br />
Uni<strong>da</strong><strong>de</strong> pequena: VPL p = R – I p = 80.000 – 50.000 = $ 30.000.<br />
Agora suponha que ambas as firmas estão no mercado. Assim,<br />
a receita <strong>da</strong> firma i é R i = q i (900 – q i –q j ). A função melhor<br />
resposta <strong>de</strong> i é <strong>da</strong><strong>da</strong> pela condição <strong>de</strong> primeira or<strong>de</strong>m: ∂R i /∂q i<br />
= 0 ⇒ q* i = 450 – q j /2. Resolvendo o sistema q* 1 = 450 – q* 2 /2 e<br />
q* 2 = 450 – q* 1 /2 obtemos q* 1 = q* 2 = 300.<br />
28
Barreira <strong>de</strong> Entra<strong>da</strong> com Excesso <strong>de</strong> Capaci<strong>da</strong><strong>de</strong><br />
Esse cálculo consi<strong>de</strong>ra que ambas as firmas não têm restrição <strong>de</strong><br />
capaci<strong>da</strong><strong>de</strong>s (investiram em uni<strong>da</strong><strong>de</strong>s gran<strong>de</strong>s).<br />
Nesse caso sem restrição e com as duas firmas no mercado, as<br />
firmas teriam receitas R i = (900 – 300 – 300) 300 = 90.000. Nesse<br />
caso os VPLs seriam negativos: VPL 1 = VPL 2 = 90.000 – 175.000<br />
⇒ VPL 1 = VPL 2 = – 85.000.<br />
Se ambas as firmas estão no mercado, mas com capaci<strong>da</strong><strong>de</strong><br />
restrita, a receita será R i = (900 – 100 – 100) 100 = 70.000.<br />
Logo, VPL 1 = VPL 2 = 70.000 – 50.000 ⇒ VPL 1 = VPL 2 = 20.000.<br />
Se ambas as firmas estão no mercado, uma (i) com capaci<strong>da</strong><strong>de</strong><br />
sem restrição e a outra (j) com capaci<strong>da</strong><strong>de</strong> restrita, então a que<br />
não tem restrição produziria no ótimo q* i = 450 – 100/2 = 400.<br />
Logo, o preço será P = 900 – 400 – 100 = 400; as receitas <strong>da</strong>s duas<br />
firmas serão: R i = 400 x 400 = 160.000 e R i = 400 x 100 = 40.000.<br />
Os VPLs serão: VPL i = 160.000 – 175.000 ⇒ VPL i = – 15.000 e<br />
VPL j = 40.000 – 50.000 ⇒ VPL j = – 10.000.<br />
Assim, uma análise não-estratégica recomen<strong>da</strong>ria entrar com a planta<br />
pequena ou não entrar. Mas análise estratégica <strong>da</strong>rá outro resultado!<br />
Barreira <strong>de</strong> Entra<strong>da</strong> com Excesso <strong>de</strong> Capaci<strong>da</strong><strong>de</strong><br />
Esse jogo seqüencial é mostrado na forma extensiva, on<strong>de</strong> N = não-entrar;<br />
P = entrar com capaci<strong>da</strong><strong>de</strong> pequena; e G = entrar com capaci<strong>da</strong><strong>de</strong> gran<strong>de</strong>.<br />
N (0; 0)<br />
Firma 2<br />
P (0; 30)<br />
Firma 1<br />
N<br />
P<br />
Firma 2<br />
G<br />
N<br />
P<br />
G<br />
(0; 27,5)<br />
(30; 0)<br />
(20; 20)<br />
(− 10; − 15)<br />
Backwards:<br />
Primeiro a<br />
escolha ótima<br />
<strong>da</strong> firma 2 em<br />
ca<strong>da</strong> subjogo<br />
terminal.<br />
G<br />
N<br />
(27,5; 0)<br />
P<br />
(− 15; − 10)<br />
Firma 2<br />
G<br />
(− 85; − 85)<br />
29
Barreira <strong>de</strong> Entra<strong>da</strong> com Excesso <strong>de</strong> Capaci<strong>da</strong><strong>de</strong><br />
Agora po<strong>de</strong>mos substituir os subjogos terminais pelo payoff advindo <strong>da</strong><br />
escolha ótima <strong>da</strong> firma 2. Com isso ficará claro a escolha ótima <strong>da</strong> firma 1.<br />
Firma 1<br />
N<br />
P<br />
(0; 30)<br />
(20; 20)<br />
A firma 1 escolhe a ação ótima<br />
nesse subjogo, consi<strong>de</strong>rando as<br />
respostas ótimas <strong>da</strong> firma 2.<br />
G<br />
(27,5; 0)<br />
Assim, o único ENPS é o par <strong>de</strong> estratégias (G; N), ou<br />
seja, a firma 1 entra com capaci<strong>da</strong><strong>de</strong> gran<strong>de</strong> e a firma 2<br />
não entra no mercado. Com isso, temos um monopólio!<br />
Esse resultado é interessante, já que sem competição (sem a<br />
firma 2 ameaçar entrar), o ótimo para a firma 1 seria entrar<br />
com uma capaci<strong>da</strong><strong>de</strong> pequena (VPL = 30 > 27,5).<br />
Logo, o excesso <strong>de</strong> capaci<strong>da</strong><strong>de</strong> inibiu a entra<strong>da</strong> do competidor!<br />
Exemplo 2: Equilíbrio <strong>de</strong> Stackelberg<br />
Stackelberg: entra<strong>da</strong> em um mercado com competição<br />
em quanti<strong>da</strong><strong>de</strong>s e com ações seqüenciais, i. é, primeiro<br />
entra a firma 1 (lí<strong>de</strong>r) com q 1 e <strong>de</strong>pois, observando a<br />
quanti<strong>da</strong><strong>de</strong> q 1 , entra a firma 2 (seguidor) com q 2 *(q 1 ).<br />
Firmas iguais com custo marginal c. As firmas já têm capaci<strong>da</strong><strong>de</strong>s<br />
irrestritas. Deman<strong>da</strong> p(Q) = a − b Q. Determine o único ENPS.<br />
Firma 1<br />
q 1<br />
0 q 1<br />
Firma 2<br />
q 2<br />
0 q 2<br />
(π 1 ; π 2 )<br />
Lembrando: em jogos dinâmicos finitos buscase<br />
o ENPS por retro-indução (“backwards”).<br />
Assim, primeiro verifica-se o q 2 ótimo para a<br />
firma 2, <strong>da</strong>do que a firma 1 já entrou com q 1 .<br />
A firma 2 observou q 1 e a melhor resposta <strong>da</strong><br />
firma 2 é a sua curva <strong>de</strong> reação q 2 *(q 1 ).<br />
A firma 1 sabe que a firma 2 irá observar o<br />
valor q 1 e sabe que a rival irá jogar q 2 *(q 1 ).<br />
Assim, basta a firma 1 jogar q 1 * <strong>de</strong> forma a<br />
maximizar π 1 , <strong>da</strong>do que a rival joga q 2 *(q 1 ).<br />
30
Exemplo: Equilíbrio <strong>de</strong> Stackelberg<br />
Vimos que a função lucro π 1 <strong>da</strong> firma 1 e a curva <strong>de</strong><br />
reação q 2 *(q 1 ) <strong>da</strong> firma 2 p/ C i (q i ) = c i q i , são <strong>da</strong><strong>da</strong>s por:<br />
π 1 = q 1 P(Q T ) − C 1 (q 1 ) ⇒ π 1 = q 1 (a − c 1 ) − q 1 b (q 1 + q 2 )<br />
* a−c 2<br />
− b q1<br />
Firmas<br />
* a−c − b q1<br />
q(q)<br />
2 1<br />
=<br />
2b homogêneas<br />
⇒ q(q)<br />
2 1<br />
=<br />
2b<br />
Assim, temos um problema <strong>de</strong> maximização <strong>de</strong> π 1 ,<br />
escolhendo q 1 e substituindo q 2 pela função q 2 *(q 1 ):<br />
a − c − b q<br />
Max P(q<br />
1<br />
+ q(q))<br />
2 1<br />
q<br />
1<br />
− C(q)<br />
1<br />
1 1<br />
q<br />
= Max q<br />
1<br />
(a − c) − b q<br />
1<br />
(q<br />
1<br />
+ )<br />
1<br />
q1<br />
2 b<br />
Aplicando a CPO (condição <strong>de</strong> primeira or<strong>de</strong>m) ∂π 1 /∂q 1 = 0:<br />
* (a − c)<br />
* (a − c)<br />
q<br />
1<br />
= ⇒ q<br />
2<br />
=<br />
2 b<br />
4 b<br />
Exercício: Mostre que o lucro π 1 > π 2 e <strong>de</strong>termine o preço P.<br />
A firma 2 tem menor lucro por ter mais informação que a<br />
firma 1 (sabe q 1 ): aqui é <strong>de</strong>svantagem ser informado!<br />
No jogo do par-ou-ímpar, ao contrário, ter mais informação era melhor.<br />
Inconsistência Temporal<br />
O resultado <strong>de</strong> Stackelberg é não apenas EN como<br />
também ENPS, <strong>de</strong>s<strong>de</strong> que o jogo termine no 2 o estágio.<br />
A figura abaixo (do exemplo <strong>da</strong> parte 1, com P(Q) = 30 - Q)<br />
mostra que a quanti<strong>da</strong><strong>de</strong> q 1 não é melhor resposta para q 2 .<br />
Assim, se houvesse um terceiro estágio seria ótimo para o lí<strong>de</strong>r<br />
reduzir a sua produção q 1 para aumentar o seu lucro π 1 .<br />
Esse problema é chamado <strong>de</strong> problema <strong>de</strong> inconsistência temporal.<br />
Stackelberg:<br />
* (a − c)<br />
q<br />
1<br />
=<br />
2 b<br />
* (a − c)<br />
q<br />
2<br />
=<br />
4 b<br />
Na prática a pergunta é:<br />
Será a estratégia q 1 um<br />
compromisso crível?<br />
31
Inconsistência Temporal<br />
O resultado <strong>de</strong> Stackelberg é um exemplo do problema<br />
<strong>de</strong> inconsistência temporal (“time inconsistency”):<br />
Como a quanti<strong>da</strong><strong>de</strong> q 1 <strong>de</strong> Stackelberg não é a melhor resposta<br />
para o q 2 do seguidor, se o jogo continua essas quanti<strong>da</strong><strong>de</strong>s<br />
<strong>de</strong>ixam <strong>de</strong> ser equilíbrio, pois existe um incentivo para o lí<strong>de</strong>r<br />
mu<strong>da</strong>r (reduzir) o valor <strong>de</strong> q 1 num terceiro estágio do jogo.<br />
Ver, por ex., o livro do Fu<strong>de</strong>nberg & Tirole (1991, pgs. 74-77).<br />
Inconsistência temporal em geral <strong>de</strong>screve a situação<br />
on<strong>de</strong> as preferências do <strong>de</strong>cisor mu<strong>da</strong>m ao longo do tempo<br />
O que é preferido num certo instante é inconsistente com o que<br />
é preferido num outro instante do tempo. Os jogadores com<br />
freqüência “re-otimizam” no curto-prazo, abandonando o<br />
plano <strong>de</strong> longo-prazo que antes era ótimo por um que era pior.<br />
É comum que a série <strong>de</strong> <strong>de</strong>cisões “ótimas” <strong>de</strong> curto-prazo tenha<br />
resulta<strong>dos</strong> piores do que o compromisso do plano <strong>de</strong> longo-prazo.<br />
Esse tema é relacionado com “credibili<strong>da</strong><strong>de</strong>” e “compromisso”.<br />
Inconsistência Temporal e Commitment<br />
Esse tema ganhou populari<strong>da</strong><strong>de</strong> após ser premiado com<br />
o Nobel <strong>de</strong> Economia <strong>de</strong> 2004 para Kydland & Prescott.<br />
O paper clássico (que inaugurou um tema em macroeconomia)<br />
<strong>de</strong>les é “Rules Rather than Discretion: The Inconsistency of<br />
Optimal Plans”, Journal of Political Economy, 1977.<br />
Política monetária: Banco Central em vez <strong>de</strong> perseguir meta <strong>de</strong><br />
longo-prazo (commitment) <strong>de</strong> baixa inflação, ele po<strong>de</strong> afrouxar a<br />
política <strong>de</strong>vido ao incentivo <strong>de</strong> aumentar o emprego com emissão<br />
<strong>de</strong> moe<strong>da</strong> (“curva Phillips”). No final há <strong>de</strong>semprego e inflação!<br />
Essa inconsistência está muito liga<strong>da</strong> ao conceito <strong>de</strong><br />
compromisso (“commitment”) não-crível. Ex. na política:<br />
Um governo po<strong>de</strong> anunciar que não negocia com terroristas<br />
em caso <strong>de</strong> seqüestros. Entretanto, o terrorista sabe que isso é<br />
um compromisso não-crível, vazio (“bravata”), a menos que<br />
haja uma lei com punição prevista para quem negociar.<br />
Para um compromisso ser crível é necessário que não hajam<br />
incentivos para <strong>de</strong>sviar no curto e longo-prazo.<br />
32
Inconsistência Temporal e Macroeconomia<br />
Uma política macroeconômica tem inconsistência<br />
temporal quando o governo anuncia uma política <strong>de</strong><br />
longo-prazo ótima (ex.: baixa inflação), mas <strong>de</strong> forma<br />
que há incentivos para <strong>de</strong>sviar no curto-prazo.<br />
Os agentes econômicos são racionais ⇒ consi<strong>de</strong>ram que o<br />
compromisso do governo é não-crível e reajustam os preços<br />
Uma maneira <strong>de</strong> conduzir uma política monetária<br />
com consistência temporal é <strong>da</strong>r autonomia ou<br />
in<strong>de</strong>pendência ao Banco Central para que faça essa<br />
política <strong>de</strong> forma a cumprir uma meta <strong>de</strong> inflação.<br />
O BC tem <strong>de</strong> ser avaliado por cumprir essa meta e não<br />
por agra<strong>da</strong>r empresários ou centrais sindicais.<br />
Assim o BC não terá incentivos <strong>de</strong> <strong>de</strong>sviar no curto-prazo.<br />
É isso que tem sido feito no Brasil e em outros países com<br />
muito sucesso. Credibili<strong>da</strong><strong>de</strong> do BC é a palavra-chave.<br />
<strong>Jogos</strong> Repeti<strong>dos</strong><br />
Jogo repetido é um jogo na forma extensiva que consiste<br />
<strong>de</strong> algum número <strong>de</strong> repetições <strong>de</strong> um jogo básico<br />
chamado estágio-jogo (“stage-game”).<br />
O estágio-jogo é geralmente um jogo bem conhecido <strong>de</strong> dois<br />
jogadores. O jogo todo é às vezes chamado <strong>de</strong> superjogo.<br />
Os jogos repeti<strong>dos</strong> po<strong>de</strong>m ser finitos ou infinitos. Geralmente<br />
os equilíbrios são totalmente diferentes em ca<strong>da</strong> caso.<br />
Quando a ameaça <strong>de</strong> retaliação é crível, alguns resulta<strong>dos</strong> que<br />
não seriam EN no stage-game muitas vezes são sustentáveis no<br />
superjogo. Isso ocorre principalmente em jogos infinitos.<br />
Mas po<strong>de</strong> ocorrer em jogos repeti<strong>dos</strong> finitos, especialmente os<br />
que têm múltiplos EN no estágio-jogo. Veremos um exemplo.<br />
Nos jogos repeti<strong>dos</strong> finitos <strong>de</strong> informação perfeita, se o<br />
estágio-jogo tem um único EN (como no dilema <strong>dos</strong><br />
prisioneiros), então o único ENPS é sempre jogar o EN.<br />
A prova (“backwards”) é óbvia.<br />
33
<strong>Jogos</strong> Infinitamente Repeti<strong>dos</strong><br />
Nos jogos repeti<strong>dos</strong> finitos existe uma última <strong>da</strong>ta <strong>de</strong><br />
jogo. Mas em várias interações sociais não existe essa<br />
<strong>da</strong>ta-limite. Nesse caso, são mais a<strong>de</strong>quado os jogos que<br />
potencialmente po<strong>de</strong>m ser infinitamente repeti<strong>dos</strong>.<br />
Nos jogos infinitamente repeti<strong>dos</strong> é mais fácil sustentar<br />
como ENPS uma ação que não é EN no estágio-jogo.<br />
Ex.: cooperar no dilema <strong>dos</strong> prisioneiros po<strong>de</strong> ser ENPS no Γ E∞ .<br />
Mas é necessário usar estratégias <strong>de</strong> punição e recompensa.<br />
Um <strong>dos</strong> critérios p/ comparar estratégias é o VPL (valor<br />
presente líquido) do fluxo <strong>de</strong> lucros <strong>de</strong>scontado por δ < 1.<br />
O fator <strong>de</strong> <strong>de</strong>sconto δ po<strong>de</strong> ser vista como 1/(1 + µ), on<strong>de</strong> µ éa<br />
taxa <strong>de</strong> <strong>de</strong>sconto ajusta<strong>da</strong> ao risco (<strong>da</strong><strong>da</strong> pelo CAPM, por ex.).<br />
O lucro total (VPL) <strong>da</strong> firma i é <strong>da</strong>do por:<br />
VPL i = π i, 1 + (π i, 2 δ) + (π i, 3 δ 2 ) + … + (π i, t δ t − 1 ) + …<br />
Que é finito para π i, t finito, ∀ t. Note que a soma <strong>da</strong> PG infinita<br />
<strong>de</strong> razão menor que 1 é finita: 1 + δ + δ 2 + … = 1/(1 − δ).<br />
Estratégias <strong>de</strong> Punição com Repetição Infinita<br />
Em jogos repeti<strong>dos</strong> os teoremas populares usam as<br />
chama<strong>da</strong>s estratégias <strong>de</strong> punição (“trigger strategies”)<br />
para obter certos payoffs. As três mais usa<strong>da</strong>s são:<br />
Estratégia “Grim” (rígi<strong>da</strong>, intransigente): comece com a ação<br />
“cooperar” (C); continue com C a menos que algum jogador<br />
escolha “não-cooperar” (NC), nesse caso jogue NC p/ sempre.<br />
Na repetição infinita do dilema <strong>dos</strong> prisioneiros po<strong>de</strong>-se sustentar<br />
a cooperação (não-confessar) como ENPS com essa estratégia,<br />
pois quem <strong>de</strong>svia tem um ganho imediato, mas uma per<strong>da</strong> eterna.<br />
Estratégia “tit-for-tat” (“olho-por-olho…”): comece com a<br />
ação “cooperar” (C); nos outros perío<strong>dos</strong>, escolha em t a ação<br />
que o outro jogador escolheu em t − 1. Desvio: ações cíclicas.<br />
Não é ENPS no dilema <strong>dos</strong> prisioneiros, mas com ela Rapoport<br />
ganhou o torneio <strong>de</strong>sse jogo repetido 200 vezes (Axelrod, 1984)!<br />
Estratégia “minimax”: Punir visando a máxima per<strong>da</strong> ao outro<br />
jogador, que então minimiza a máxima per<strong>da</strong> ele que po<strong>de</strong> ter.<br />
Como na “grim”, po<strong>de</strong> ser ENPS a <strong>de</strong>pen<strong>de</strong>r do fator <strong>de</strong> <strong>de</strong>sconto.<br />
34
Exemplo Estilo Dilema <strong>dos</strong> Prisioneiros<br />
Seja um jogo repetido infinitamente em que o estágiojogo<br />
é do estilo dilema <strong>dos</strong> prisioneiros com os payoffs:<br />
Jogador 2<br />
Coopera Não-Coopera<br />
Jogador 1<br />
Coopera<br />
Não-Coopera<br />
3; 3 0; 5<br />
5; 0 1; 1<br />
Com repetição infinita, note que ca<strong>da</strong> subjogo é igual ao<br />
anterior com exceção talvez <strong>da</strong> sua história pregressa.<br />
Com a estratégia “grim” e o fator <strong>de</strong> <strong>de</strong>sconto δ∈[0, 1],<br />
não há incentivo para <strong>de</strong>sviar <strong>da</strong> estratégia grim se:<br />
3 (1 + δ + δ 2 +…) = 3 / (1 − δ) ≥ 5 + 1(δ + δ 2 +…) = 5 + δ / (1 − δ)<br />
Algebrando se vê que isso ocorre se e somente se δ≥½.<br />
Esse valor limite (½) <strong>de</strong>pen<strong>de</strong> <strong>da</strong> estrutura <strong>de</strong> payoffs do jogo.<br />
<strong>Jogos</strong> Estocásticos Repeti<strong>dos</strong> (Shapley)<br />
A versão clássica <strong>de</strong> jogos estocásticos é <strong>de</strong>vido a<br />
Shapley (1953). Hoje existe uma nova literatura mais<br />
complexa <strong>de</strong> jogos <strong>de</strong> opções, que consi<strong>de</strong>ra processos<br />
estocásticos e exercício ótimo <strong>de</strong> opções (reais ou financ.)<br />
A versão clássica é um jogo dinâmico repetido (finito ou<br />
infinito) em que existem probabili<strong>da</strong><strong>de</strong>s <strong>de</strong> transição <strong>de</strong><br />
um estágio-jogo para outro estágio.<br />
Assim, a ca<strong>da</strong> estágio do jogo o payoff é em geral diferente,<br />
existindo probabili<strong>da</strong><strong>de</strong>s p/ ca<strong>da</strong> possível estado <strong>da</strong> natureza.<br />
A ca<strong>da</strong> estágio os jogadores <strong>de</strong>vem tomar ações que <strong>de</strong>pen<strong>de</strong>m<br />
não só do estado (e a matriz <strong>de</strong> payoffs) corrente, mas também<br />
<strong>dos</strong> possíveis esta<strong>dos</strong> nos próximos estágios do jogo.<br />
<strong>Jogos</strong> estocásticos clássicos são generalizações <strong>de</strong> jogos<br />
repeti<strong>dos</strong> para um ambiente <strong>de</strong> payoffs estocásticos.<br />
Ver no anexo o caso do jogo <strong>de</strong> cotas <strong>da</strong> OPEP em que a<br />
<strong>de</strong>man<strong>da</strong> é estocástica, mas com só dois esta<strong>dos</strong> <strong>da</strong> natureza.<br />
35
<strong>Jogos</strong> <strong>de</strong> Informação Incompleta<br />
Em muitos jogos é mais realista consi<strong>de</strong>rar que existe<br />
informação incompleta sobre os payoffs <strong>dos</strong> rivais.<br />
Nesses jogos, ca<strong>da</strong> firma só recebe informações parciais sobre<br />
os valores do jogo, representa<strong>da</strong>s por distribuições <strong>de</strong><br />
probabili<strong>da</strong><strong>de</strong>s a priori sobre os possíveis cenários <strong>dos</strong> payoffs.<br />
Um <strong>dos</strong> jogos <strong>de</strong>ssa classe mais importantes é o jogo <strong>de</strong><br />
informação assimétrica, em que existe uma parte<br />
informa<strong>da</strong> e outra parte não (ou menos) informa<strong>da</strong>.<br />
Assimetria <strong>de</strong> informação já <strong>de</strong>u 5 prêmios Nobel em economia<br />
Iremos ver alguns casos clássicos, como os jogos <strong>de</strong> sinalização.<br />
O método geral para resolver os jogos <strong>de</strong> informação<br />
incompleta é o método Bayesiano (Harsanyi, 1967-68).<br />
O jogo original é transformado num jogo equivalente <strong>de</strong> Bayes<br />
com informação completa, embora imperfeita.<br />
Harsanyi <strong>de</strong>senvolveu o conceito <strong>de</strong> equilíbrio Bayesiano.<br />
Informação Incompleta e Equilíbrio Bayesiano<br />
Nesse jogo <strong>de</strong> informação incompleta, a natureza faz o<br />
primeiro lance escolhendo a realização <strong>de</strong> θ i<br />
, a variável<br />
aleatória (v.a.) sobre o valor ou “tipo” <strong>de</strong> ca<strong>da</strong> jogador i.<br />
Ca<strong>da</strong> jogador i tem uma função valor V i<br />
(s i<br />
, s − i<br />
, θ i<br />
), on<strong>de</strong> θ i<br />
∈Θ i<br />
é uma v.a. escolhi<strong>da</strong> pela natureza, só observa<strong>da</strong> pelo jogador i.<br />
É assumido, como premissa, que a distribuição conjunta <strong>dos</strong><br />
payoffs (valores) <strong>dos</strong> jogadores são <strong>de</strong> conhecimento comum.<br />
Estratégia pura p/ o jogador i é a regra <strong>de</strong> <strong>de</strong>cisão ou função<br />
s i<br />
(θ i<br />
) que dá a escolha para ca<strong>da</strong> realização do seu tipo θ i<br />
.<br />
O valor esperado condicional do jogador i é <strong>da</strong>do por:<br />
O equilíbrio Bayesiano <strong>de</strong> Nash (EBN) é <strong>de</strong>finido <strong>de</strong> forma<br />
similar ao EN, mas para valores espera<strong>dos</strong> condicionais.<br />
Um perfil <strong>de</strong> estratégias puras s = (s 1<br />
, s 2<br />
, … s J<br />
) é EBN se, para<br />
to<strong>dos</strong> os J jogadores:<br />
36
Informação Incompleta Vira Imperfeita<br />
Harsanyi transformou um jogo <strong>de</strong> informação incompleta em<br />
um jogo <strong>de</strong> informação completa mas imperfeita. Para isso, a<br />
natureza joga. Ex.: informação incompleta sobre a firma 1:<br />
Natureza joga:<br />
Com probabili<strong>da</strong><strong>de</strong> p, a<br />
firma 1 é do tipo alto custo<br />
Com probabili<strong>da</strong><strong>de</strong> 1 - p, a<br />
firma 1 é do tipo baixo custo<br />
Firma1tipoAC<br />
E<br />
NE<br />
informação<br />
imperfeita<br />
E<br />
Firma1tipoBC<br />
NE<br />
Firma 2<br />
E<br />
NE<br />
E<br />
NE<br />
E<br />
NE<br />
E<br />
NE<br />
(D 1 ; D 2 ) (M 1 ; 0)<br />
(0; M 2 )<br />
(0; 0)<br />
(D’ 1 ; D’ 2 ) (M’ 1 ; 0)<br />
(0; M 2 )<br />
(0; 0)<br />
Crise 2007/8 e Informação Assimétrica<br />
A crise financeira que começou em agosto <strong>de</strong> 2007<br />
(crédito imobiliário sub-prime) e se agravou a partir <strong>de</strong><br />
setembro <strong>de</strong> 2008 (crise sistêmica), é um exemplo radical<br />
<strong>da</strong> gravi<strong>da</strong><strong>de</strong> do problema <strong>de</strong> assimetria <strong>de</strong> informação.<br />
Assimetria <strong>de</strong> informação: como um banco não sabe se o outro<br />
tem ou não títulos “podres”, ele não empresta para o outro que<br />
fica com problemas para “fechar o caixa” do dia.<br />
Se um banco, mesmo sólido, não honrar um pagamento <strong>de</strong>vido<br />
a essa paralisia no mercado interbancário, ele po<strong>de</strong> sofrer uma<br />
“corri<strong>da</strong> bancária” e quebrar. Se quebra, não honra os seus<br />
<strong>de</strong>mais compromissos, criando mais dificul<strong>da</strong><strong>de</strong>s p/ os outros ...<br />
Assim, rapi<strong>da</strong>mente ocorre um gran<strong>de</strong> problema <strong>de</strong> liqui<strong>de</strong>z<br />
<strong>de</strong>vido a essa falta <strong>de</strong> confiança entre os bancos. A crise <strong>de</strong><br />
confiança é alavanca<strong>da</strong> pela assimetria <strong>de</strong> informação.<br />
A crise financeira <strong>de</strong> 1929 se tornou recessão e <strong>de</strong>pois<br />
<strong>de</strong>pressão nos anos 30: o Banco Central (FED) errou ao<br />
restringir ain<strong>da</strong> mais o crédito/reduzir liqui<strong>de</strong>z.<br />
37
Crise 2007/8 e Informação Assimétrica<br />
Os Bancos Centrais apren<strong>de</strong>ram com o erro <strong>de</strong> 1929 e<br />
hoje em dia a atuação padrão <strong>dos</strong> BCs nesses momentos<br />
é prover liqui<strong>de</strong>z no mercado interbancário para reduzir<br />
os efeitos <strong>da</strong> informação assimétrica entre os bancos.<br />
Isso é o que tem sido feito <strong>de</strong>s<strong>de</strong> agosto/07 por BCs <strong>dos</strong> EUA,<br />
Europa e Japão. No início, essa política foi bem sucedi<strong>da</strong>.<br />
O problema é que o volume <strong>de</strong> créditos “podres” parece<br />
ser muito maior que se imaginava. Terão os BCs cacifes<br />
suficientes p/ conter a crise? Qual o tamanho do rombo?<br />
O “pacote” aprovado pelo congresso americano em 03/10/2008<br />
é uma maneira <strong>de</strong> tentar revelar o tamanho do problema, ao<br />
propor a compra <strong>de</strong>sses títulos “podres”, assim como isolar o<br />
problema que causou a crise <strong>de</strong> confiança interbancária.<br />
Sem ele, po<strong>de</strong>ria acontecer o mesmo problema do Japão nos anos<br />
90 (crise imobiliária também) que teve prolonga<strong>da</strong> recessão.<br />
Problemas: custo ↑↑ do pacote; dúvi<strong>da</strong> se será ele suficiente já que<br />
persiste a assimetria <strong>de</strong> informação; e quanto pagar pelos títulos.<br />
Crise 2007/8: Epílogo?<br />
Em julho <strong>de</strong> 2009 aparentemente a crise <strong>de</strong> confiança no<br />
sistema financeiro terminou e a economia se recupera.<br />
Isso po<strong>de</strong> ser comemorado como um sucesso nas políticas <strong>dos</strong><br />
governos (especialmente os Banco Centrais) p/ reduzir os efeitos<br />
<strong>da</strong> assimetria <strong>de</strong> informação (provendo liqui<strong>de</strong>z ao mercado<br />
bancário e <strong>da</strong>ndo estímulos econômicos a economia real).<br />
Não foi repetido o erro <strong>de</strong> 1929. Se fosse, a situação seria bem pior.<br />
Há indicadores surpreen<strong>de</strong>ntes <strong>de</strong> recuperação econômica.<br />
Bancos americanos estão mostrando lucros semestrais eleva<strong>dos</strong>.<br />
Já a redução <strong>da</strong> assimetria <strong>de</strong> informação em sí (quem <strong>de</strong>tém os<br />
títulos podres) foi apenas parcialmente alcança<strong>da</strong>, já que a<br />
mu<strong>da</strong>nça nas regras contábeis <strong>de</strong> marcação a mercado está<br />
ocultando problemas com ativos podres (assimetria persiste).<br />
Marcação a mercado aqui significa lançar no balanço o valor <strong>de</strong><br />
mercado dum ativo e não o valor nominal. Os bancos americanos<br />
estão po<strong>de</strong>ndo colocar o valor nominal <strong>de</strong> vários ativos no balanço.<br />
O problema é que não é claro se isso causará crises mais adiante.<br />
Também, o custo elevado <strong>de</strong> estímulo <strong>da</strong> economia, po<strong>de</strong>rá causar<br />
problemas fiscais nos governos, com inflação, elevação <strong>dos</strong> juros, etc.<br />
38
Caso <strong>da</strong> Enron: Auditoria, Consultoria e Incentivos<br />
Um exemplo <strong>de</strong> falha <strong>de</strong> mercado foi a falência <strong>da</strong> Enron e o<br />
papel(ão) <strong>da</strong>s cias. “in<strong>de</strong>pen<strong>de</strong>ntes” <strong>de</strong> auditoria. Esse caso foi<br />
analisado por Stiglitz (Valor Econômico, 17/02/02):<br />
Firmas <strong>de</strong> auditoria <strong>de</strong> balanços existem para evitar que a assimetria<br />
<strong>de</strong> informação cause prejuízos ao investidor por omissão ou falsi<strong>da</strong><strong>de</strong>.<br />
A firma <strong>de</strong> auditoria joga jogos repeti<strong>dos</strong> com os investidores, logo<br />
teria o incentivo <strong>da</strong> reputação p/ bem informá-los sobre a Enron.<br />
No entanto, quando a mesma empresa que audita também presta<br />
consultoria, aparece outro (e perverso) incentivo <strong>de</strong> curto-prazo:<br />
“agra<strong>da</strong>r os clientes que não gostam <strong>de</strong> relatórios <strong>de</strong>sfavoráveis”.<br />
A auditora <strong>da</strong> Enron em 2001 chegou ao cúmulo <strong>de</strong> aju<strong>da</strong>r a<br />
<strong>de</strong>struir diversos documentos (supostas provas <strong>de</strong> irregulari<strong>da</strong><strong>de</strong>s).<br />
A. Levitt, ex-presi<strong>de</strong>nte <strong>da</strong> SEC, tentou no passado proibir a mistura <strong>de</strong><br />
ativi<strong>da</strong><strong>de</strong>s <strong>de</strong> auditoria e consultoria pela mesma empresa.<br />
Stiglitz argumenta que “a questão central <strong>de</strong> nossa época é<br />
encontrar o equilíbrio certo entre governo e mercado”.<br />
Mesmo com essas imperfeições no mercado, Stiglitz adverte:<br />
“precisamos resistir a tentação <strong>de</strong> ir para o extremo oposto”.<br />
Prêmio Nobel em 2007<br />
Esse prêmio Nobel em 2007 foi p/ a teoria <strong>de</strong> <strong>de</strong>senho<br />
<strong>de</strong> mecanismos, relaciona<strong>da</strong> com jogos Bayesianos.<br />
Veremos exemplos: bônus p/ gerentes e <strong>de</strong>senho <strong>de</strong> leilões.<br />
Foram três ganhadores, sendo que dois <strong>de</strong>les<br />
(Maskin e Myerson) têm na teoria <strong>dos</strong> jogos seu<br />
principal foco <strong>de</strong> pesquisas (mas Hurwicz também<br />
usou conceitos <strong>de</strong> teoria <strong>dos</strong> jogos nessa teoria).<br />
Hurwicz (falecido em 2008) foi o fun<strong>da</strong>dor <strong>da</strong> teoria e <strong>de</strong><br />
conceitos tais como o <strong>de</strong> “incentivo-compatível”.<br />
Myerson foi quem fez o link entre mecanismos incetivocompatível<br />
e jogos Bayesianos, o princípio <strong>da</strong> revelação II.<br />
Maskin refinou essa teoria com a teoria <strong>da</strong> implementação<br />
e tem outras contribuições em jogos cooperativos e nãocooperativos,<br />
<strong>de</strong>sigual<strong>da</strong><strong>de</strong> <strong>de</strong> ren<strong>da</strong>, patentes, etc.<br />
Myerson e Maskin estiveram no <strong>Rio</strong> em 2008 (LACEA).<br />
Tive a honra <strong>de</strong> ser o apresentador <strong>da</strong> palestra do Maskin.<br />
39
Desenho <strong>de</strong> Mecanismo e Princípio <strong>da</strong> Revelação<br />
A teoria do <strong>de</strong>senho <strong>de</strong> mecanismo combina o mo<strong>de</strong>lo <strong>de</strong><br />
principal-agente com o conceito <strong>de</strong> equilíbrio Nash-Bayesiano.<br />
Mecanismo é um jogo: especifica as estratégias possíveis e os payoffs.<br />
Mecanismo direto é aquele que simplesmente pergunta ao agente<br />
para revelar a sua informação priva<strong>da</strong>.<br />
Estratégias disponíveis são simplesmente reportar sobre o seu tipo.<br />
Se for ótimo (ENB) para um jogador revelar a ver<strong>da</strong><strong>de</strong>, tal<br />
mecanismo é chamado <strong>de</strong> incentivo-compatível.<br />
O teorema do princípio <strong>da</strong> revelação diz que se po<strong>de</strong> restringir a<br />
busca do mecanismo ótimo para aqueles que sejam diretos<br />
(pergunta o tipo) e incentivo-compatível (revelador <strong>da</strong> ver<strong>da</strong><strong>de</strong>).<br />
Prova-se que não há per<strong>da</strong> <strong>de</strong> payoff ao <strong>de</strong>scartar os mecanismos<br />
que não aten<strong>da</strong>m ao princípio <strong>da</strong> revelação.<br />
O link com jogos Bayesianos é <strong>de</strong>vido a Myerson (1979):<br />
Princípio <strong>da</strong> Revelação II: Qualquer equilíbrio Nash-Bayesiano<br />
(ENB) <strong>de</strong> qualquer jogo Bayesiano, po<strong>de</strong> ser representado por um<br />
mecanismo direto incentivo-compatível.<br />
Ex.: Incentivos para Gerentes em Corporações<br />
Exemplo simples <strong>de</strong> mecanismo incentivando tanto<br />
revelar a ver<strong>da</strong><strong>de</strong> sobre a meta factível <strong>de</strong> produção<br />
(Q f ), como maior empenho <strong>da</strong><strong>da</strong> a meta.<br />
Um bônus baseado no nível <strong>de</strong> produção Q incentiva maior<br />
empenho, mas incentiva mais os gerentes <strong>de</strong> UNs maiores e<br />
<strong>de</strong>sestimula gerentes <strong>de</strong> UNs menores.<br />
Também bônus baseado na diferença Q − Q f estimula os<br />
gerentes a reportarem valores baixos para Q f .<br />
Weitzman (1976) propõe o seguinte mecanismo para<br />
induzir os gerentes a reportarem a ver<strong>da</strong><strong>de</strong> sobre Q f e ao<br />
mesmo tempo induzir esforço para aumentar Q:<br />
Bônus B = β Q f<br />
+ α (Q − Q f<br />
) se Q > Q f<br />
e<br />
B = β Q f<br />
− γ (Q f<br />
− Q) se Q ≤ Q f<br />
On<strong>de</strong>: γ > β > α > 0<br />
40
Incentivos para Gerentes em Corporações<br />
Vejamos um exemplo numérico (Pindyck & Rubinfeld, 1995,<br />
Microeconomics, pp.613-616), com γ = 0,5 ; β = 0,3 ; α = 0,2.<br />
Assuma que a ver<strong>da</strong><strong>de</strong>ira meta factível é Q f = 20.000 uni<strong>da</strong><strong>de</strong>s.<br />
Bônus<br />
($/ano)<br />
B = 0,3 Q f + 0,2 (Q − Q f ) se Q > Q f<br />
B = 0,3 Q f − 0,5 (Q f − Q) se<br />
Q ≤ Q f<br />
Q f<br />
= 30.000<br />
9.000 Q f<br />
= 20.000<br />
Q f<br />
= 10.000<br />
6.000<br />
3.000<br />
$6.000 é o nível que a se<strong>de</strong> quer pagar<br />
Resultado: bônus obe<strong>de</strong>ce<br />
o princípio <strong>da</strong> revelação<br />
(dizer a ver<strong>da</strong><strong>de</strong> sobre Q f<br />
é<br />
ótimo) e tem incentivo para<br />
aumentar a produção Q<br />
10.000 20.000 30.000 40.000<br />
Produção Q (uni<strong>da</strong><strong>de</strong>s/ano)<br />
Introdução à <strong>Teoria</strong> <strong>dos</strong> Leilões<br />
Do ponto <strong>de</strong> vista <strong>de</strong> mo<strong>de</strong>lagem, a teoria <strong>dos</strong> leilões<br />
po<strong>de</strong> ser vista como uma aplicação <strong>da</strong> teoria <strong>de</strong> <strong>de</strong>senho<br />
<strong>de</strong> mecanismos ou <strong>de</strong> jogos Bayesianos.<br />
Leilão po<strong>de</strong> ser visto como um mecanismo <strong>de</strong> mercado<br />
para equilibrar oferta e <strong>de</strong>man<strong>da</strong> (market clearing mec.).<br />
Outros mecanismos incluem a ven<strong>da</strong> a preço fixo (ex.: loja<br />
comum) e barganha (ex.: na ven<strong>da</strong> <strong>de</strong> uma casa, se barganha a<br />
diferença <strong>de</strong> valor p/ o comprador e o valor p/ o ven<strong>de</strong>dor).<br />
Leilão é mais flexível que a ven<strong>da</strong> a preço fixo e talvez consuma<br />
menos tempo que a barganha, mas não garante o maior preço.<br />
Leilão: regras <strong>de</strong> formação <strong>de</strong> preço são explícitas e conheci<strong>da</strong>s.<br />
Leilões são usa<strong>dos</strong> para produtos em que não existe mercado<br />
estabelecido. Exs.: objetos raros, privatizações, carros usa<strong>dos</strong>…<br />
São usa<strong>dos</strong> porque o ven<strong>de</strong>dor está incerto sobre o preço <strong>de</strong> ven<strong>da</strong>.<br />
Geralmente quem estabelece as regras do leilão é o<br />
ven<strong>de</strong>dor, que está incerto sobre o preço do objeto.<br />
Há informação incompleta para o leiloeiro e para os “bid<strong>de</strong>rs”.<br />
41
Leilões: Motivação e Conceitos Básicos<br />
A essência <strong>de</strong> qualquer situação <strong>de</strong> leilão é que os<br />
compradores valoram o bem <strong>de</strong> forma diferente:<br />
Seja porque eles têm valores priva<strong>dos</strong> diferentes (ex.: mercado<br />
<strong>de</strong> arte, colecionador versus mero admirador) ou porque eles<br />
têm estimativas diferentes do valor inter<strong>de</strong>pen<strong>de</strong>nte do bem<br />
(ex.: áreas para exploração <strong>de</strong> petróleo, as firmas têm<br />
diferentes estimativas <strong>de</strong> probabilid. <strong>de</strong> sucesso, volume, etc.),<br />
mas to<strong>dos</strong> ven<strong>de</strong>riam petróleo ao mesmo valor <strong>de</strong> mercado.<br />
Valor comum é um caso especial <strong>de</strong> valor inter<strong>de</strong>pen<strong>de</strong>nte<br />
<br />
Muitas situações <strong>da</strong> economia tb. po<strong>de</strong>m ser mo<strong>de</strong>la<strong>da</strong>s<br />
como leilões. Ex.: as aquisições (“takeovers”) <strong>de</strong> firmas:<br />
Dois tipos <strong>de</strong> takeover: (a) disciplinar, pois a firma estaria mal<br />
administra<strong>da</strong> e a firma po<strong>de</strong> se valorizar com novos gerentes;<br />
(b) sinergético, em que a firma compradora teria benefícios<br />
específicos com a junção <strong>da</strong>s firmas. No caso disciplinar temos<br />
valor comum e no caso sinergético temos valor privado.<br />
Formatos ou Tipos <strong>de</strong> Leilões<br />
Os leilões po<strong>de</strong>m ser classifica<strong>dos</strong> <strong>de</strong> diversas maneiras.<br />
Po<strong>de</strong>m ser abertos (lances públicos, oral ou não) ou sela<strong>dos</strong>.<br />
Leilões abertos po<strong>de</strong>m ser com preços ascen<strong>de</strong>ntes (inglês, o<br />
mais popular) ou com preços <strong>de</strong>scen<strong>de</strong>ntes (holandês).<br />
Leilões fecha<strong>dos</strong> (sela<strong>dos</strong>) <strong>de</strong> primeiro preço e <strong>de</strong> segundo preço.<br />
Leilões <strong>de</strong> objeto único ou <strong>de</strong> múltiplos objetos.<br />
Leilões <strong>de</strong> primeiro preço (ou 1 o lance), o mais alto lance (bid)<br />
ganha o bem e paga o seu bid. Leilões <strong>de</strong> 2 o preço (lance) o<br />
preço mais alto também ganha, mas só paga o 2 o maior bid.<br />
O leilão <strong>de</strong> 2º lance (ou <strong>de</strong> Vickrey) tem sido usado, por ex.,<br />
para ven<strong>da</strong> <strong>de</strong> manuscritos antigos pelo Antebellum Covers.<br />
Outro tipo <strong>de</strong> leilão é o leilão em que to<strong>dos</strong> pagam (“all-pay<br />
auction”). Usado para mo<strong>de</strong>lar situações tais como: disputa<br />
por me<strong>da</strong>lha <strong>de</strong> ouro nas olimpía<strong>da</strong>s; eleições; lobbies, etc.<br />
Nem sempre o leiloeiro consegue a maior receita. Ver ex. em:<br />
http://isc.temple.edu/economics/Econ_92/Game%20Hwk/Auctions/hwk11-auctions.htm<br />
42
Estratégias Ótimas do Comprador<br />
A <strong>de</strong>cisão <strong>de</strong> quanto oferecer (“bi<strong>da</strong>r”) num leilão é uma<br />
<strong>de</strong>cisão sob incerteza. Em alguns casos é bem simples:<br />
No leilão aberto inglês, se você tem um valor privado = v, então<br />
a regra é permanecer no leilão enquanto o último lance b ≤ v.<br />
Nesse caso sua estratégia ótima in<strong>de</strong>pen<strong>de</strong> <strong>da</strong>s estratégias <strong>dos</strong><br />
outros jogadores: não é necessário estimar os planos <strong>dos</strong> rivais.<br />
No leilão selado <strong>de</strong> 2º lance, veremos que é ótimo <strong>da</strong>r um lance<br />
igual ao seu valor privado (b = v), já que se ganhar paga ≤ v.<br />
O caso <strong>de</strong> leilão selado <strong>de</strong> 1º lance não é tão simples:<br />
O melhor seria ganhar o leilão com lance b < v, mas pagando o<br />
mínimo possível: b apenas um pouco maior que o 2º maior bid.<br />
Se <strong>de</strong>r um lance muito baixo, a chance <strong>de</strong> ganhar diminui; se<br />
<strong>de</strong>r um lance muito alto, o payoff v – b é pequeno se ganhar.<br />
Estratégia ótima: escolha b <strong>de</strong> forma a maximizar o payoff<br />
esperado = probabilid. <strong>de</strong> vencer x payoff se vencer (= v – b).<br />
Regra prática: presuma que você tem a maior valoração,<br />
estime a 2ª maior valoração (v 2 ) e dê um lance b = v 2 .<br />
Vickrey: Leilão <strong>de</strong> Segundo Maior Lance<br />
Num leilão <strong>de</strong> valor privado, ca<strong>da</strong> pessoa (tipo) avalia o bem<br />
<strong>de</strong> forma diferente (e ninguém quer pagar mais do que vale).<br />
Leilãoselado<strong>de</strong> segundo lance: ganha o envelope com o<br />
maior lance, mas só paga o valor do segundo maior lance.<br />
Vickrey em 1961 (logo, antes <strong>de</strong> Harsanyi em 1967/8<br />
formular o equilíbrio Bayesiano, consi<strong>de</strong>rar tipos, etc.)<br />
mostrou as estratégias ótimas para esse leilão:<br />
Vickrey mostrou que <strong>da</strong>r um lance igual a quanto vale o bem para<br />
ca<strong>da</strong> tipo éumaestratégia dominante e in<strong>de</strong>pen<strong>de</strong> do tipo.<br />
Será ótimo p/ to<strong>dos</strong> os jogadores revelar quanto realmente vale o bem p/<br />
ca<strong>da</strong> um (ca<strong>da</strong> tipo irá <strong>da</strong>r um lance diferente) e ganha quem acreditar<br />
que o bem é mais valioso. Ou seja, será ótimo “bi<strong>da</strong>r” seu próprio valor.<br />
Portanto, o leilão <strong>de</strong> 2º lance aten<strong>de</strong> ao princípio <strong>da</strong> revelação.<br />
Logo, esse leilão incentiva ca<strong>da</strong> tipo a dizer a ver<strong>da</strong><strong>de</strong> sobre o valor<br />
do bem e ganha quem mais está interessado no bem (é eficiente).<br />
Com muitos tipos participando do leilão, no limite, o leiloeiro conseguiria<br />
ven<strong>de</strong>r o bem pelo valor máximo (menos δ) do tipo com maior avaliação.<br />
43
Vickrey: Leilão <strong>de</strong> Segundo Maior Lance<br />
Vamos mostrar que é ótimo para ca<strong>da</strong> pessoa (tipo) <strong>da</strong>r o lance<br />
exatamente igual a quanto vale para ela.<br />
Suponha que o objeto valha V θ para o tipo θ.<br />
Será que existe algum incentivo para <strong>da</strong>r um lance maior ou menor?<br />
Se o tipo θ <strong>de</strong>r um lance V + > V θ então se ele ganhar o objeto (isto é, se V + ><br />
V 2 on<strong>de</strong> V 2 éo segundo maior lance) po<strong>de</strong>m ocorrer dois cenários:<br />
V θ<br />
V 2 V 2<br />
V +<br />
Se V 2 < V θ<br />
então ele obtém a mesma utili<strong>da</strong><strong>de</strong> V θ<br />
− V 2<br />
tanto com lance V + como V θ<br />
Se V + > V 2 > V θ<br />
então ele obtém utili<strong>da</strong><strong>de</strong> negativa V θ<br />
− V 2<br />
com o lance V + e assim<br />
ele estaria pior se <strong>de</strong>sviando <strong>de</strong> V θ<br />
. Logo ele não tem incentivo para <strong>de</strong>sviar e jogar V +<br />
Se o tipo θ <strong>de</strong>r um lance V − < V θ então po<strong>de</strong>m ocorrer dois cenários:<br />
V 2<br />
V −<br />
V 2<br />
V θ<br />
Se V 2 < V − então ele obtém a mesma utili<strong>da</strong><strong>de</strong> V θ<br />
− V 2<br />
tanto com lance V − como V θ<br />
Se V − < V 2 < V θ<br />
então ele não ganharia o objeto e estaria pior jogando V − pois ele<br />
po<strong>de</strong>ria ganhar com V θ<br />
e obter utili<strong>da</strong><strong>de</strong> positiva. Logo não há incentivo para jogar V −<br />
Logo, jogar o seu valor V θ é equilíbrio separador dominante (Nash-Bayesiano).<br />
MATERIAL<br />
ANEXO<br />
Os anexos nos materiais do curso contém sli<strong>de</strong>s que<br />
reforçam os conceitos teóricos e/ou apresentam<br />
exemplos adicionais que não serão discuti<strong>dos</strong> em<br />
sala <strong>de</strong> aula, mas que po<strong>de</strong>m ser úteis para um<br />
melhor entendimento <strong>de</strong> conceitos apresenta<strong>dos</strong>.<br />
44
Websites Úteis<br />
Existem muitos websites com materiais <strong>de</strong> teoria <strong>dos</strong> jogos.<br />
Dois websites muito ricos em materiais e informação são:<br />
http://www.gametheory.net/<br />
http://plato.stanford.edu/entries/game-theory/<br />
Experiência do professor em teoria <strong>dos</strong> jogos e jogos <strong>de</strong> OR:<br />
Paper pioneiro em jogos <strong>de</strong> opções reais (1997, Dallas, EUA):<br />
1º jogo <strong>de</strong> OR <strong>de</strong> guerra <strong>de</strong> atrito; 1º jogo <strong>de</strong> OR em petróleo).<br />
Mais dois papers (esses com o Prof. José Paulo) em jogos <strong>de</strong><br />
OR, sendo um recém publicado e outro aceito para publicação.<br />
Tese <strong>de</strong> doutorado: capítulo <strong>de</strong> jogos <strong>de</strong> OR. Ver capítulo 4 (e<br />
aplicação no capítulo 5) do arquivo <strong>da</strong> tese em:<br />
http://www.puc-rio.br/marco.ind/pdf/tese_doutor_marco_dias.pdf<br />
Ministra curso <strong>de</strong> teoria <strong>dos</strong> jogos na Petrobras também, além <strong>de</strong><br />
usar em aplicações <strong>de</strong> teoria <strong>de</strong> jogos em parceiras <strong>da</strong> Petrobras.<br />
Competição Imperfeita e <strong>Teoria</strong> <strong>dos</strong> <strong>Jogos</strong><br />
A ferramenta neo-clássica para análise <strong>de</strong> competição<br />
imperfeita éa teoria <strong>dos</strong> jogos (“game theory”).<br />
A teoria <strong>dos</strong> jogos ganhou o Nobel <strong>de</strong> Economia em 1994 com<br />
Nash (equilíbrio básico), Harsanyi (equilíbrio com informação<br />
incompleta) e Selten (equilíbrio perfeito em jogos dinâmicos).<br />
Ganhou <strong>de</strong> novo em 2005 com Aumann (jogos repeti<strong>dos</strong> e<br />
cooperação) e Schelling (teoria do conflito e do “commitment”).<br />
Aplicações <strong>da</strong> teoria <strong>dos</strong> jogos também ganharam o Nobel em<br />
1996 (teoria <strong>dos</strong> incentivos com informação assimétrica) com<br />
Mirrlees e Vickrey; em 2001 (teor. <strong>de</strong> merca<strong>dos</strong> com informação<br />
assimétrica) com Akerlof, Spence e Stiglitz; e em 2007 (teoria <strong>de</strong><br />
<strong>de</strong>senho <strong>de</strong> mecanismos) com Hurwicz, Maskin e Myerson.<br />
A teoria <strong>dos</strong> jogos também permite analisar interações<br />
estratégicas <strong>de</strong> cooperação entre as firmas.<br />
Do ponto <strong>de</strong> vista <strong>da</strong> firma, a teoria <strong>dos</strong> jogos permite<br />
mo<strong>de</strong>lar <strong>de</strong> forma endógena os efeitos <strong>da</strong> competição e<br />
<strong>da</strong>s oportuni<strong>da</strong><strong>de</strong>s <strong>de</strong> cooperação.<br />
45
História Resumi<strong>da</strong> <strong>da</strong> <strong>Teoria</strong> <strong>dos</strong> <strong>Jogos</strong><br />
Veremos <strong>de</strong> forma resumi<strong>da</strong> os principais fatos históricos.<br />
Em 1913, Zermelo estabelece o 1º teorema <strong>da</strong> teoria <strong>dos</strong> jogos;<br />
Déca<strong>da</strong> <strong>de</strong> 20: Borel, formulação <strong>de</strong> estratégias mistas e solução<br />
minimax; John von Neumann provou o famoso teorema minimax.<br />
1944: von Neumann & Morgenstern publicam o 1º livro <strong>de</strong> T. <strong>dos</strong> J.<br />
1950-1953: Nash publica seus famosos artigos, com os conceitos <strong>de</strong><br />
equilíbrio <strong>de</strong> Nash em jogos não-cooperativos e a solução <strong>de</strong> Nash em<br />
jogos cooper. <strong>de</strong> barganha. Inicia a era mo<strong>de</strong>rna <strong>da</strong> teoria <strong>dos</strong> jogos.<br />
1960: Schelling publica seu famoso livro “The Strategy of Conflict”.<br />
1965: Selten publica o paper sobre equilíbrio perfeito em sub-jogos.<br />
1967-68: Harsanyi publica artigos sobre equilíbrio Nash-Bayesiano.<br />
1972: Maynard Smith publica artigo sobre eq. evolucionário estável.<br />
1994: Prêmio Nobel em Economia para Nash, Selten e Harsanyi.<br />
2005: Prêmio Nobel em Economia para Aumann e Schelling.<br />
2007: Prêmio Nobel em Economia p/ Hurwicz, Maskin e Myerson.<br />
Para muito mais <strong>de</strong>talhes históricos, ver na internet:<br />
http://www.econ.canterbury.ac.nz/personal_pages/paul_walker/gt/hist.htm<br />
Forma Normal x Forma Extensiva<br />
Duas formas extensivas po<strong>de</strong>m ter a mesma forma normal. Exemplo:<br />
Firma 1<br />
A<br />
B<br />
(1; 2)<br />
Firma 2<br />
C<br />
D<br />
(3; 1)<br />
(2; 4)<br />
A<br />
B<br />
C<br />
D<br />
1; 2 1; 2<br />
3; 1 2; 4<br />
Reta traceja<strong>da</strong>:<br />
firma 2 não sabe<br />
em que nó está.<br />
Firma 1<br />
A<br />
B<br />
Firma 2<br />
Firma 2<br />
C (1; 2) Note que os jogos são diferentes:<br />
na árvore <strong>de</strong> cima o jogador 2<br />
sabe o que o jogador 1 jogou.<br />
D Precisamos <strong>da</strong> forma extensiva.<br />
(1; 2)<br />
●Na árvore <strong>de</strong> baixo eu estou<br />
(3; 1)<br />
C<br />
usando uma reta traceja<strong>da</strong> para<br />
dizer que o jogador 2 não sabe em<br />
D<br />
que nó está (conjunto <strong>de</strong><br />
(2; 4) informação com dois nós).<br />
46
Dilema <strong>dos</strong> Prisioneiros: Exemplos<br />
A Tragédia <strong>dos</strong> Comuns (Hume, 1739): dois pescadores e um<br />
único lago têm incentivo <strong>de</strong> fazer pesca pre<strong>da</strong>tória, embora o<br />
melhor para ambos (Pareto ótimo) seja a pescaria leve:<br />
Pescador 1<br />
Estratégias<br />
Pescaria Leve<br />
Pescaria Intensa<br />
Pescador 2<br />
Pescaria Leve Pescaria Intensa<br />
32, 32<br />
28, 35<br />
35, 28 30, 30<br />
Se os ci<strong>da</strong>dões respon<strong>de</strong>rem só a incentivos priva<strong>dos</strong>, os recursos<br />
públicos serão <strong>de</strong>masia<strong>da</strong>mente <strong>de</strong>pleta<strong>dos</strong>. Além disso, os bens<br />
públicos não serão provi<strong>dos</strong> (ver a seguir) e isso justifica os impostos.<br />
Bens Públicos: contribuição para uma construir uma ponte:<br />
ninguém contribui se for opcional (que é pior para ambos).<br />
Contribuinte 1<br />
Estratégias<br />
Contribui<br />
Não Contribui<br />
Contribuinte 2<br />
Contribui Não Contribui<br />
32, 32<br />
28, 35<br />
35, 28 30, 30<br />
Características e Nomes <strong>da</strong>s Estratégias<br />
Contribuinte 1<br />
Estratégias<br />
Contribui<br />
Não Contribui<br />
Contribui<br />
Contribuinte 2<br />
Não Contribui<br />
Dominância <strong>de</strong> Pareto: nenhum jogador está pior e pelo menos um<br />
está melhor. Ex.: (32, 32) Pareto domina (30, 30).<br />
(35, 28) domina (30, 30)? Não, pois 28 < 30.<br />
(32, 32), (28, 35) e (35, 28) são ditos Pareto Ótimo, pois só se po<strong>de</strong><br />
melhorar o valor <strong>de</strong> um às custas do prejuízo do outro.<br />
Desses o mais eficiente (maior ganho conjunto) é o (32, 32) que soma 64.<br />
Free Ri<strong>de</strong>r (benefício grátis): No caso <strong>de</strong> (35, 28), dizemos que o<br />
contribuinte 1 está sendo um free ri<strong>de</strong>r, pois tem o benefício <strong>da</strong> ponte<br />
mas na<strong>da</strong> paga por ela.<br />
Externali<strong>da</strong><strong>de</strong> Negativa: o jogador 1 passando <strong>de</strong> pagante para nãopagante<br />
gera uma externali<strong>da</strong><strong>de</strong> negativa para o jogador 2, pois<br />
reduz o valor do jogador 2, que arcará com uma maior contribuição.<br />
Conflito individual x social. Sonegadores prejudicam os pagantes.<br />
32, 32<br />
28, 35<br />
35, 28 30, 30<br />
47
A Tragédia <strong>dos</strong> Comuns<br />
Esse clássico <strong>da</strong> sociologia (Hume, 1739) é um caso<br />
particular do dilema <strong>dos</strong> prisioneiros. Mostra o seguinte:<br />
Se o “bolo” é comum, as pessoas (a maioria) são incentiva<strong>da</strong>s a<br />
contribuirem o mínimo possível e a tirarem o máximo proveito.<br />
Caso clássico: a colônia <strong>de</strong> Plymouth (EUA, 1621) assinou um<br />
contrato coletivo em que to<strong>da</strong> a produção era comum e entregue<br />
para armazenamento comunitário, sendo que ca<strong>da</strong> indivíduo<br />
receberia uma fração igual, não importando a sua contribuição.<br />
O resultado foi que a produção era insuficiente até para consumo<br />
próprio: faltava comi<strong>da</strong>, mas sobrava ócio e acomo<strong>da</strong>ção. Os<br />
homens lamentavam ter <strong>de</strong> “trabalhar para a esposa e filho <strong>dos</strong><br />
outros”, sem ter recompensa. A experiência foi um fracasso.<br />
Dois anos <strong>de</strong>pois foi <strong>de</strong>sfeito o contrato, ca<strong>da</strong> família obteve a sua<br />
própria terra e a comuni<strong>da</strong><strong>de</strong> teve estímulo e progrediu.<br />
Como já dizia Aristóteles: “Aquilo que é comum ao maior<br />
número <strong>de</strong>spertará sobre si os menores cui<strong>da</strong><strong>dos</strong>”.<br />
Ver artigo “A Tragédia <strong>dos</strong> Comuns” <strong>de</strong> João Mauad (O Globo,<br />
julho <strong>de</strong> 2009) na pasta 72, para <strong>de</strong>talhes.<br />
Competição com Projetos <strong>de</strong> P&D<br />
Mesmo com apenas duas firmas no mercado<br />
(duopólio), a competição po<strong>de</strong> ser muito intensa.<br />
Em indústrias maduras, é freqüente a competição em<br />
preços através <strong>de</strong> inovações <strong>de</strong> redução <strong>de</strong> custo.<br />
O gasto em P&D para reduzir custos po<strong>de</strong> não ser Pareto<br />
ótimo para as firmas, mas freqüentemente é a estratégia<br />
dominante para ambas as firmas (dilema <strong>dos</strong> prisioneiros):<br />
Firma 1<br />
P&D<br />
Não-P&D<br />
P&D<br />
20 ; 10 40 ; −10<br />
−10 ; 30<br />
Firma 2<br />
Não-P&D<br />
30 ; 20<br />
A estratégia <strong>de</strong> P&D nesse<br />
contexto cria barreiras <strong>de</strong><br />
entra<strong>da</strong> para novas firmas<br />
interessa<strong>da</strong>s nesse mercado.<br />
Ocorre mais se a <strong>de</strong>man<strong>da</strong><br />
é mais elástica com o preço.<br />
Uma alternativa ao P&D<br />
(não analisa<strong>da</strong>) é reduzir<br />
custos com ganhos <strong>de</strong> escala.<br />
48
Equil. <strong>de</strong> Nash: Jogo Batalha <strong>dos</strong> Sexos<br />
Uma versão do jogo clássico <strong>da</strong> batalha <strong>dos</strong> sexos é:<br />
Um casal tem <strong>de</strong> <strong>de</strong>cidir o que fazer na sexta-feira à noite.<br />
Eles concor<strong>da</strong>m em ir ao cinema, mas ele prefere assistir<br />
um filme <strong>de</strong> ação e ela prefere assistir um romance.<br />
Ir ao cinema sozinho é o pior resultado (menor utili<strong>da</strong><strong>de</strong>).<br />
As utili<strong>da</strong><strong>de</strong>s são mostra<strong>da</strong>s abaixo. Quais os EN do jogo?<br />
ELE<br />
Dica: ver as melhores respostas simultâneas <strong>dos</strong> jogadores.<br />
ELA<br />
Resposta:<br />
Ação Romance Os EN em estratégias puras<br />
são dois: {ação; ação} e<br />
Ação 2; 1 0; 0<br />
{romance; romance}. Tem<br />
um EN em estratég. mistas<br />
que é jogar uma estratégia<br />
com probabili<strong>da</strong><strong>de</strong> <strong>de</strong> 2/3<br />
Romance 0; 0 1; 2 e a outra com prob. 1/3.<br />
Ver sli<strong>de</strong>s seguintes.<br />
Batalha <strong>dos</strong> Sexos: Solução em Est. Mistas<br />
Sejam π 1<br />
e π 2<br />
as probabili<strong>da</strong><strong>de</strong>s com que ele e ela,<br />
respectivamente, escolhem “filme <strong>de</strong> ação”.<br />
O payoff esperado <strong>de</strong>le (Payoff 1<br />
) será <strong>da</strong>do por:<br />
2 π 1<br />
π 2<br />
+(1−π 1<br />
) (1 −π 2<br />
)=π 1<br />
(3 π 2<br />
− 1) +1−π 2<br />
O payoff esperado <strong>de</strong>la (Payoff 2<br />
) será <strong>da</strong>do por:<br />
π 1<br />
π 2<br />
+2(1−π 1<br />
) (1 −π 2<br />
) = π 2<br />
(3 π 1<br />
− 2) +2 (1−π 1<br />
)<br />
Curvas <strong>de</strong> reação <strong>da</strong>s firmas 1 e 2 (<strong>de</strong>riva e faz = 0):<br />
∂Payoff 1 /∂ π 1 = 0 = 3 π 2 − 1 ⇒ π 2 = 1/3 ⇒ qualquer π 1 éótimose π 2 = 1/3<br />
Se ela joga π 2 < 1/3, por ex. π 2 = 0, Payoff 1 = 1 − π 1 ⇒ ótimo: π 1 = 0;<br />
Se ela joga π 2 > 1/3, por ex. π 2 = 1, Payoff 1 = 2 π 1 ⇒ ótimo 1 : π 1 = 1, etc.<br />
⎧ 0 caso π 1<br />
2<br />
<<br />
3<br />
⎪<br />
π<br />
1<br />
1<br />
= ⎨qualquer valor entre 0 e 1 caso π<br />
2<br />
=<br />
3<br />
⎪<br />
⎪1 caso π 1<br />
2<br />
><br />
⎩<br />
3<br />
⎧ 0 caso π 2<br />
1<br />
<<br />
3<br />
⎪<br />
π<br />
2<br />
2<br />
= ⎨qualquer valor entre 0 e 1 caso π1<br />
=<br />
3<br />
⎪<br />
⎪1 caso π 2<br />
1<br />
><br />
⎩<br />
3<br />
49
Batalha <strong>dos</strong> Sexos: EN em Estratégias Mistas<br />
π 2<br />
1<br />
Equilíbrios<br />
<strong>de</strong> Nash com<br />
estratégias<br />
puras<br />
1/3<br />
Curva <strong>de</strong> reação <strong>de</strong>la<br />
Repare que as curvas <strong>de</strong><br />
reação não são funções.<br />
Elas são correspondências.<br />
Curva <strong>de</strong> reação <strong>de</strong>le<br />
Equilíbrio <strong>de</strong> Nash<br />
com estratégias<br />
mistas.<br />
2/3 1<br />
Equilíbrios em estratégias mistas: três, sendo um não-<strong>de</strong>generado,<br />
que é ele jogar “ação” com 2/3 <strong>de</strong> probabili<strong>da</strong><strong>de</strong>; e ela jogar<br />
“ação” com 1/3 <strong>de</strong> probabili<strong>da</strong><strong>de</strong> (⇒ ela joga “romance” com 2/3).<br />
Esse caso resulta: {ação; ação} tem probab. 2/3 x 1/3 = 2/9 <strong>de</strong> ocorrer;<br />
{romance; romance} tem 1/3 x 2/3 = 2/9; e irem sozinhos, probab. = 5/9.<br />
π 1<br />
Tópicos em EN em Estratégias Mistas<br />
O valor <strong>de</strong> uma estratégia mista é o valor esperado <strong>dos</strong><br />
“payoffs” <strong>da</strong>s relevantes estratégias puras randomiza<strong>da</strong>s.<br />
As probabili<strong>da</strong><strong>de</strong>s <strong>da</strong>s estratégias mistas são resulta<strong>dos</strong> <strong>da</strong> análise<br />
<strong>de</strong> equilíbrio. Elas não são exógenas (estimativas <strong>de</strong> esta<strong>dos</strong> <strong>da</strong><br />
natureza) e nem advin<strong>da</strong>s <strong>de</strong> preferências <strong>dos</strong> jogadores.<br />
Elas foram calcula<strong>da</strong>s maximizando payoffs simultaneamente.<br />
Essas probabs. são tais que fazem o outro jogador ficar indiferente<br />
entre jogar as suas diferentes estratégias puras relevantes.<br />
Nem sempre as probabili<strong>da</strong><strong>de</strong>s <strong>de</strong> estratégias mistas são intuitivas<br />
já que não refletem características individuais e sim estratégicas.<br />
A análise gráfica anterior é viável para o caso <strong>de</strong> dois jogadores<br />
com duas estratégias ca<strong>da</strong>. Mas po<strong>de</strong>-se usar méto<strong>dos</strong> analítico ou<br />
numéricos p/ obter os pontos fixos <strong>de</strong> melhor resposta simultânea.<br />
Se há múltiplos EN em estrat. puras ⇒ há EN em estrat. mistas<br />
com a randomização <strong>dos</strong> EN em estratégias puras.<br />
Nesse exemplo tivemos três equilíbrios <strong>de</strong> Nash (EN).<br />
Múltiplos EN: qual <strong>de</strong>les é o mais provável ou recomendável?<br />
Veremos alguns refinamentos <strong>de</strong> EN que reduz o n o <strong>de</strong> equilíbrios.<br />
50
Exercício sobre Estratégias Mistas<br />
Mostre que o jogo do par ou ímpar com disputa <strong>de</strong> 1 R$<br />
(ver início <strong>da</strong> parte 1) tem apenas um único EN em<br />
estratégias mistas que é jogar σ* = (1/2 ; 1/2), on<strong>de</strong> o 1 o<br />
termo é a probabili<strong>da</strong><strong>de</strong> do 1 o jogador jogar um n o par e<br />
o 2 o termo é a probabili<strong>da</strong><strong>de</strong> do 2 o jogador jogar n o par.<br />
Verifique que o EN em estratégias mistas não-<strong>de</strong>genera<strong>da</strong>s tem<br />
a proprie<strong>da</strong><strong>de</strong> <strong>de</strong> fazer o outro jogador ficar indiferente entre<br />
o que jogar.<br />
Dica: siga os passos do jogo Batalha <strong>dos</strong> Sexos. Verificar que só<br />
existe um ponto <strong>de</strong> cruzamento nas correspondências <strong>de</strong> melhor<br />
resposta (cruzamento = simultaneamente melhor resposta).<br />
Mostre que o EN seria exatamente o mesmo (1/2 ; 1/2)<br />
se em vez <strong>de</strong> “disputa por R$ 1” fosse “aposta <strong>de</strong> R$ 1”, i.<br />
é, se nos payoffs on<strong>de</strong> está “zero” fosse “− 1”.<br />
Nesse formato, o jogo do par-ou-ímpar correspon<strong>de</strong> ao jogo <strong>de</strong><br />
soma zero “matching pennies” <strong>dos</strong> livros <strong>da</strong> língua inglesa.<br />
Exemplo <strong>de</strong> Cournot: OPEP x Não-OPEP<br />
Esse exemplo (e outro <strong>da</strong> OPEP a ser visto) é retirado do<br />
livro do Dutta (Strategy and Games), publicado em 1999.<br />
Assim, a análise foi feita no contexto <strong>de</strong> baixos preços do<br />
petróleo na déca<strong>da</strong> <strong>de</strong> 90, quando sobrava petróleo no mercado.<br />
Consi<strong>de</strong>re o jogo <strong>de</strong> quanti<strong>da</strong><strong>de</strong>s no mercado <strong>de</strong> petróleo<br />
em que temos dois jogadores: OPEP e Não-OPEP.<br />
É uma aplicação do resultado <strong>de</strong> Cournot. Assuma a seguinte<br />
curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> linear: P(Q T ) = a – b (Q T ) = a – b (q O + q N )<br />
On<strong>de</strong> q O e q N são as produções <strong>da</strong> OPEP e Não-OPEP, respectivamente.<br />
Note que o parâmetro “a” dá o preço máximo <strong>de</strong>ssa função. No<br />
livro o autor colocou a = 65 ($/bbl) refletindo os baixos preços <strong>da</strong><br />
época (em <strong>de</strong>z/98 o petróleo chegou a ficar abaixo <strong>de</strong> 10 $/bbl).<br />
Ele usou b = 1/3, <strong>de</strong> forma que a <strong>de</strong>man<strong>da</strong> é: P = 65 – 1/3 (q O + q N ).<br />
Assuma que (naquela época) os custos unitários <strong>de</strong> produção <strong>da</strong><br />
OPEP e Não-OPEP são, respectivamente <strong>de</strong> 5 e 10 US$/bbl.<br />
Hoje esses custos seriam bem maiores. Depois iremos colocar<br />
valores mais representativos <strong>da</strong> atuali<strong>da</strong><strong>de</strong> para ver o que ocorre.<br />
51
Exemplo <strong>de</strong> Cournot: OPEP x Não-OPEP<br />
Os lucros <strong>dos</strong> dois jogadores (receita – custos oper.) são:<br />
O lucro <strong>da</strong> OPEP é: π O<br />
= q O<br />
[65 – 1/3 (q O<br />
+ q N<br />
)] – 5 q O<br />
;<br />
O lucro Não-OPEP é: π N<br />
= q N<br />
[65 – 1/3 (q O<br />
+ q N<br />
)] – 10 q N<br />
As curvas <strong>de</strong> reação (melhor resposta) são obti<strong>da</strong>s com a CPO<br />
(∂π O<br />
/∂q O<br />
= 0; e ∂π N<br />
/∂q N<br />
= 0) p/ maximizar esses lucros e são:<br />
* 180 − qN<br />
q<br />
O(q N) =<br />
se qN<br />
≤ 180 (e zero caso contrário)<br />
2<br />
* 165 − qO<br />
q<br />
N(q O) =<br />
se qO<br />
≤ 165 (e zero caso contrário)<br />
2<br />
O cruzamento <strong>de</strong>ssas curvas (retas) – ou substituindo<br />
uma na outra – chega na solução <strong>de</strong> Nash-Cournot.<br />
Com a solução q* O e q* N , é fácil obter o preço e os lucros:<br />
OPEP<br />
Não-OPEP<br />
Quanti<strong>da</strong><strong>de</strong>s<br />
65 (MM bbl/d)<br />
50 (MM bbl/d)<br />
Preço (US$/bbl)<br />
26,67<br />
26,67<br />
Lucro (MM $/d)<br />
1.408,3<br />
833,3<br />
Exemplo <strong>de</strong> Cournot: OPEP x Não-OPEP<br />
A planilha jogos <strong>da</strong> OPEP.xls permite (re)calcular o jogo.<br />
Sabemos hoje que os custos subiram muito em relação à<br />
déca<strong>da</strong> <strong>de</strong> 90 (~ 2 a 3 vezes), principalmente os não-OPEP.<br />
Além disso, a curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> é muito mais alta e por isso<br />
o preço máximo está muito acima <strong>de</strong> 65 (já bateu em 79).<br />
Vamos re-calcular o jogo usando os <strong>da</strong><strong>dos</strong>: a = 130; b = 1; e<br />
custos marginais unitários c O = 12 $/bbl e c N = 30 $/bbl:<br />
Quanti<strong>da</strong><strong>de</strong>s Preço (US$/bbl) Lucro (MM $/d)<br />
OPEP 45,3 (MM bbl/d) 57,33<br />
2.055<br />
Não-OPEP 27,3 (MM bbl/d) 57,33<br />
747<br />
Embora a soma <strong>da</strong>s produções estejam próximas do ano <strong>de</strong><br />
2007 (~ 72,4 MM bbl/d), estão ~ inverti<strong>da</strong>s as produções.<br />
Existem restrições <strong>de</strong> capaci<strong>da</strong><strong>de</strong> não-consi<strong>de</strong>ra<strong>da</strong>s aqui. Além<br />
disso, só a OPEP tem algum comportamento estratégico. Os<br />
países Não-OPEP se comportam como tomadores <strong>de</strong> preços.<br />
O mo<strong>de</strong>lo <strong>de</strong> Cournot não se a<strong>da</strong>pta bem nesse caso.<br />
52
Deman<strong>da</strong> Residual e o Mercado <strong>de</strong> Petróleo<br />
Em muitos casos po<strong>de</strong>mos analisar o conflito <strong>de</strong> dois<br />
competidores usando análise simplifica<strong>da</strong>.<br />
Imagine o mercado <strong>de</strong> petróleo com os produtores<br />
sendo a firma 1, a firma 2 e o resto do mundo.<br />
Assim, a produção <strong>da</strong> indústria é Q T<br />
= q 1<br />
+ q 2<br />
+ q resto<br />
.<br />
Seja uma curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> linear <strong>da</strong><strong>da</strong> por:<br />
p(Q T<br />
) = a – b (Q T<br />
) = a – b (q 1<br />
+ q 2<br />
+ q resto<br />
).<br />
Que po<strong>de</strong> ser re-escrito como uma <strong>de</strong>man<strong>da</strong> residual:<br />
p(Q T<br />
) = (a – b q resto<br />
) – b (q 1<br />
+ q 2<br />
) ⇒<br />
⇒ p(Q T<br />
) = a´ – b (q 1<br />
+ q 2<br />
)<br />
Assim, <strong>de</strong>s<strong>de</strong> que se mantenha a produção do resto do<br />
mundo constante, bastaria ajustar o parâmetro a <strong>da</strong><br />
função <strong>de</strong>man<strong>da</strong>. Mas essa é um abor<strong>da</strong>gem simplifica<strong>da</strong>.<br />
A rigor, se mu<strong>da</strong>r q 1 e/ou q 2 , q resto po<strong>de</strong>ria se ajustar otimamente.<br />
Jogo <strong>de</strong> Cotas <strong>da</strong> OPEP com Dois Países<br />
Seja o seguinte jogo <strong>de</strong> quotas <strong>da</strong> OPEP (planilha<br />
jogos <strong>da</strong> OPEP.xls , aba “quotas”) com <strong>de</strong>man<strong>da</strong> linear<br />
residual <strong>da</strong><strong>da</strong> por p = α − β (q A + q V ), on<strong>de</strong>:<br />
α = 100; β = 5; as produções são q A (Arábia) e q V (Venezuela),<br />
que po<strong>de</strong>m produzir só as cotas ou acima. Sejam os custos<br />
unitários c A = 12 $/bbl (Arábia) e c V = 20 $/bbl (Venezuela).<br />
As cotas estabeleci<strong>da</strong>s são 8 milhões <strong>de</strong> bbl/dia para a Arábia<br />
Saudita e 2 milhões <strong>de</strong> bbl/dia para a Venezuela.<br />
Caso esses países não respeitem as quotas, eles iriam produzir<br />
um montante 25% acima <strong>da</strong>s quotas: 10 MM bbl/d para a<br />
Arábia Saudita e 2,5 MM bbl/d para a Venezuela.<br />
Calcule o EN <strong>de</strong>sse jogo consi<strong>de</strong>rando que a escolha <strong>da</strong><br />
quanti<strong>da</strong><strong>de</strong> produzi<strong>da</strong> pelos países é simultânea.<br />
Calcule também os preços do petróleo em ca<strong>da</strong> possível resultado.<br />
Se o mercado ficar mais aquecido e a <strong>de</strong>man<strong>da</strong> subir<br />
(fazendo α = 120). Qual o novo EN? Por que mudou?<br />
53
Jogo <strong>de</strong> Cotas <strong>da</strong> OPEP com Dois Países<br />
No primeiro caso, a planilha <strong>de</strong>staca o EN e mostra os<br />
resulta<strong>dos</strong> <strong>de</strong> payoffs (em milhões US$/dia), preços:<br />
Analisando o jogo vemos que ambos os países têm uma<br />
estratégia dominante. A estratégia <strong>da</strong> Arábia Saudita é<br />
sempre cooperar (produzir só as cotas) e a <strong>da</strong> Venezuela<br />
é sempre trair a OPEP (produzir acima <strong>da</strong>s cotas).<br />
Aqui a Arábia sempre coopera por puro interesse próprio!<br />
Jogo <strong>de</strong> Cotas <strong>da</strong> OPEP com Dois Países<br />
No exemplo numérico anterior os preços estiveram na<br />
faixa <strong>de</strong> 37,5 a 50 US$/bbl. Veremos agora o que ocorre<br />
se a <strong>de</strong>man<strong>da</strong> estiver mais aqueci<strong>da</strong> (α = 120):<br />
Vemos que ambos os países têm estratégias dominantes,<br />
mas agora para ambos os países essa estratégia é sempre<br />
não-cooperar (produzir acima <strong>da</strong>s cotas).<br />
Note que obtemos um esquema <strong>de</strong> dilema <strong>dos</strong> prisioneiros: o<br />
melhor para ambos (Pareto ótimo) seria obe<strong>de</strong>cer as quotas!<br />
54
Jogo <strong>de</strong> Cotas <strong>da</strong> OPEP com Dois Países<br />
A mu<strong>da</strong>nça <strong>de</strong> EN ocorreu porque agora, com a maior<br />
<strong>de</strong>man<strong>da</strong> (α = 120), a produção extra obtém preços<br />
maiores e a Arábia passa a ter incentivo <strong>de</strong> não-cooperar.<br />
Como é praxe <strong>de</strong> jogos não-cooperativos, a cooperação po<strong>de</strong><br />
emergir como resultado apenas se for equilíbrio.<br />
Em jogos repeti<strong>dos</strong>, a cooperação <strong>da</strong> OPEP po<strong>de</strong> emergir se os<br />
membros usarem estratégias <strong>de</strong> punição (será visto).<br />
Exercício 1: mostre que para uma <strong>de</strong>man<strong>da</strong> intermediária<br />
com α = 114,5 existem dois EN em estratégias puras.<br />
Exercício 2: seja o caso original (com α = 100, etc.), mas<br />
tendo a Venezuela um custo bem maior c V = 38 $/bbl.<br />
Mostre que nesse caso o único EN é {cooperar ; cooperar} e<br />
esse equilíbrio também é em estratégias dominantes p/ ambos.<br />
⇒ O resultado <strong>de</strong>sse jogo <strong>de</strong>pen<strong>de</strong> <strong>da</strong> <strong>de</strong>man<strong>da</strong>, custos, etc.<br />
Discutiremos agora mo<strong>de</strong>los <strong>de</strong> escolha ótima <strong>de</strong> quanti<strong>da</strong><strong>de</strong>s<br />
(Cournot) <strong>de</strong> um range contínuo <strong>de</strong> possíveis quanti<strong>da</strong><strong>de</strong>s.<br />
Duopólio <strong>de</strong> Cournot: Caso com Custo Fixo<br />
Seja a função <strong>de</strong>man<strong>da</strong> linear: p(Q T<br />
) = a − b Q T<br />
Seja o caso mais geral <strong>de</strong> custo operacional C i (q i ).<br />
Por simplici<strong>da</strong><strong>de</strong> assuma que ∂ 2 C i /∂q i2 = 0 (função linear, tem<br />
custo variável e um custo fixo constante) e ∂C i /∂q j = 0 p/ i ≠ j (a<br />
produção <strong>da</strong> firma i não influencia o custo <strong>da</strong> firma j).<br />
A CPO e as resultantes curvas <strong>de</strong> reação são <strong>da</strong><strong>da</strong>s por:<br />
O EN-Cournot é o par {q 1 *(q 2 *); q 2 *(q 1 *)} obtido pela<br />
substituição <strong>de</strong> uma curva <strong>de</strong> reação na outra, que dá:<br />
55
Exercícios sobre EN-Cournot<br />
O que ocorre se uma <strong>da</strong>s firmas investe em P&D para<br />
reduzir seus custos a fim <strong>de</strong> ter maior competitivi<strong>da</strong><strong>de</strong><br />
em quanti<strong>da</strong><strong>de</strong>s (Cournot)?<br />
Diga o que ocorreria na curva <strong>de</strong> reação, no lucro <strong>de</strong> ca<strong>da</strong><br />
firma, nas quanti<strong>da</strong><strong>de</strong>s em equilíbrio e no preço.<br />
Resolva o problema anterior sem custo fixo, mas com<br />
custo variável quadrático: c i (q i ) = q i2 .<br />
Resolva agora com o custo variável linear anterior, mas<br />
com custo fixo f i > 0 e com q i > 0.<br />
Dilema <strong>dos</strong> Prisioneiros e <strong>Jogos</strong> Cooperativos<br />
Todo jogo não-cooperativo po<strong>de</strong> ser transformado<br />
num jogo cooperativo (embora nem sempre seja<br />
prático, legal ou ético), com a função característica.<br />
A conversão <strong>de</strong> qualquer jogo não cooperativo com N-<br />
jogadores para a forma <strong>de</strong> coalizão (função característica),<br />
é <strong>de</strong>vido a von-Newman & Morgenstern (1944).<br />
No caso anterior, as coalizões seriam <strong>de</strong> um ou <strong>de</strong><br />
dois jogadores com a seguinte função característica:<br />
C(1) = C(2) = 4; C(1; 2) = 12.<br />
A coalizão <strong>de</strong> só um jogador teria o resultado do jogo nãocooperativo,<br />
que no caso é o mínimo que ca<strong>da</strong> jogador<br />
po<strong>de</strong> receber. A coalizão <strong>de</strong> dois jogadores tem valor igual<br />
ao máximo payoff conjunto que a coalizão po<strong>de</strong> obter.<br />
Nesse caso o maior valor é 6 + 6 = 12 > 10 + 0 > 4 + 4.<br />
Em jogos repeti<strong>dos</strong> a cooperação po<strong>de</strong> emergir como<br />
equilíbrio <strong>de</strong> um jogo não-cooperativo (a ser visto).<br />
56
Forma <strong>de</strong> Coalizão & <strong>Jogos</strong> Cooperativos<br />
Coalizão é quando um grupo <strong>de</strong> jogadores se coor<strong>de</strong>nam<br />
em torno dum objetivo comum visando ter maior po<strong>de</strong>r.<br />
Quando são firmas que <strong>de</strong>viam competir na economia, é ilegal<br />
ou anti-ético e a coalizão é chama<strong>da</strong> <strong>de</strong> colusão coor<strong>de</strong>na<strong>da</strong>.<br />
Em outros contextos (ex.: parti<strong>dos</strong> políticos numa eleição ou<br />
votando uma lei) não é ilegal e (geralmente) nem anti-ético.<br />
<strong>Jogos</strong> cooperativos em forma <strong>de</strong> coalizão se divi<strong>de</strong>m em:<br />
<strong>Jogos</strong> com utili<strong>da</strong><strong>de</strong> transferível (TU), em que existe uma regra<br />
simples qualquer <strong>de</strong> divisão <strong>da</strong> utili<strong>da</strong><strong>de</strong> em ca<strong>da</strong> coalizão S.<br />
Também são chama<strong>dos</strong> <strong>de</strong> jogos com “si<strong>de</strong> payments” (pagamentos<br />
laterais) e são mais simples e mais analisa<strong>dos</strong> do que os jogos NTUs:<br />
<strong>Jogos</strong> com utili<strong>da</strong><strong>de</strong> não-transferível (NTU), em que não existe<br />
uma regra simples <strong>de</strong> divisão <strong>da</strong> utili<strong>da</strong><strong>de</strong> e sim p/ ca<strong>da</strong> S um<br />
vetor s j -dimensional <strong>de</strong> funções payoff p/ ca<strong>da</strong> S com s j players.<br />
Veremos um exemplo simples <strong>de</strong> jogo TU: votação com N = 3<br />
jogadores (= eleitores), para ilustrar a forma <strong>de</strong> coalizão.<br />
<strong>Jogos</strong> Cooperativos TU. Ex: Votação<br />
Seja um jogo eleitoral (cooperat. TU) em que os eleitores<br />
(jogadores) têm várias possibili<strong>da</strong><strong>de</strong>s (candi<strong>da</strong>tos a votar).<br />
Os eleitores po<strong>de</strong>m se associar, i.é, formar coalizões (em torno<br />
dum candi<strong>da</strong>to). Ganha a eleição a coalizão S que tem mais<br />
eleitores. Seja uma eleição com N = 3 eleitores (jogadores).<br />
Seja a função característica C(S), com a normalização:<br />
“Gran<strong>de</strong> coalizão” C(N) = 1. Para ca<strong>da</strong> jogador i, C({i}) = 0.<br />
Além disso, C(S) = 1 se a coalizão S vencer e C(S) = 0 se S per<strong>de</strong>r.<br />
A forma <strong>de</strong> coalizão no jogo TU especifica {N = 3; C(S)}, on<strong>de</strong>:<br />
C(S)<br />
⎧ 0 se # S < 2<br />
= ⎨<br />
⎩ .1 se # S ≥ 2<br />
Esse tipo <strong>de</strong> jogo tem gran<strong>de</strong> relevância em sociologia,<br />
mas menos importância em economia.<br />
Em termos <strong>de</strong> jogos cooperativos, os mais importantes p/<br />
a economia são os jogos <strong>de</strong> barganha cooperativa.<br />
57
Oligopólio e Colusões: Equilíbrio <strong>de</strong> Coalizões<br />
Uma literatura que vem crescendo é a que combina<br />
jogos cooperativos com jogos não-cooperativos.<br />
Nela se discute competição entre coalizões, saí<strong>da</strong>s <strong>de</strong> membros<br />
<strong>de</strong> uma coalizão para entrar em outra (e o que ocorrerá com a<br />
coalizão rejeita<strong>da</strong>) e equilíbrio entre coalizões.<br />
O seguinte exemplo usando o oligopólio <strong>de</strong> Cournot p/ 3<br />
firmas homogêneas é discutido no livro <strong>de</strong> Ray (A Game-<br />
Theoretic Perspective on Coalition Formation, 2007).<br />
Para facilitar a análise, seja K = (a – c) 2 /b. O lucro <strong>da</strong> firma i é:<br />
2<br />
(a − c)<br />
K<br />
π<br />
i<br />
= ⇒ π<br />
2 i<br />
=<br />
2<br />
(N + 1) b ( N + 1)<br />
Sem acordo (sem colusão) o lucro <strong>de</strong> ca<strong>da</strong> uma é <strong>de</strong> π i = K/16.<br />
Se as três firmas entram em colusão (N = 1), o lucro <strong>da</strong><br />
coalizão é π total = K/4. Nesse caso, qualquer que seja a regra <strong>de</strong><br />
divisão <strong>da</strong> colusão, pelo menos uma firma não ganharia mais<br />
do que π i = K/12. Esse valor é maior que sem colusão (K/16).<br />
Oligopólio e Colusões: Equilíbrio <strong>de</strong> Coalizões<br />
Será que existe incentivo para uma firma <strong>de</strong>sviar <strong>da</strong><br />
colusão? Seja o caso <strong>de</strong> uma firma saindo <strong>da</strong> colusão:<br />
Nesse caso é como se tivesse duas firmas no mercado (N = 2), a<br />
firma que <strong>de</strong>sviou (i = 1) e a coalizão <strong>de</strong> duas firmas (j = 2 + 3).<br />
Nesse caso, π 1 = π 2+3 = K/9. Para a firma 1 isso parece atrativo,<br />
pois K/9 > K/12 e assim parece haver incentivo para <strong>de</strong>sviar.<br />
Mas nesse caso pelo menos uma <strong>da</strong>s firmas <strong>da</strong> coalizão <strong>de</strong> duas<br />
firmas teria um lucro não maior do que D/18. Esse valor é<br />
menor do que ela obteria também saindo <strong>da</strong> coalizão (K/16).<br />
Assim, se uma firma <strong>de</strong>ixar a coalizão <strong>de</strong> três firmas, o ótimo será<br />
a quebra total <strong>da</strong> colusão, ficando as três firmas produzindo <strong>de</strong><br />
forma competitiva (separa<strong>da</strong>s) e lucrando ca<strong>da</strong> uma K/16.<br />
Assim, na análise <strong>de</strong> equilíbrio <strong>da</strong> coalizão <strong>de</strong> 3 firmas, não é<br />
ótimo para a firma 1 <strong>de</strong>sviar, pois ela <strong>de</strong>verá antecipar que a<br />
coalizão restante seria <strong>de</strong>sfeita e assim em vez <strong>de</strong> payoff <strong>de</strong><br />
colusão igual a K/12, ela obteria no final apenas K/16.<br />
Logo, a colusão <strong>de</strong> três firmas é estável (coalitional equilibrium).<br />
58
Equilíbrio <strong>de</strong> Coalizões e Função Partição<br />
No exemplo anterior vimos que a função característica é<br />
insuficiente para <strong>de</strong>screver a competição entre coalizões.<br />
No caso <strong>da</strong> coalizão <strong>de</strong> duas firmas temos <strong>de</strong> dizer não só o<br />
payoff <strong>da</strong> coalizão <strong>de</strong> 2 (função característica) como também o<br />
payoff <strong>da</strong> firma que está fora <strong>da</strong> coalizão.<br />
Essa <strong>de</strong>scrição mais completa é chama<strong>da</strong> <strong>de</strong> função partição.<br />
Exercício (livro do Ray, pgs. 18-19, “Bens Públicos”):<br />
Analizar a estabili<strong>da</strong><strong>de</strong> <strong>da</strong>s coalizões e mostre que uma firma<br />
terá incentivo <strong>de</strong> <strong>de</strong>ixar a gran<strong>de</strong> coalizão (<strong>de</strong> 3 firmas), mas as<br />
outras duas firmas não terão incentivos <strong>de</strong> dissolver a coalizão<br />
<strong>de</strong> duas firmas restantes (ao contrário do caso anterior).<br />
A função partição é (ver a<br />
planilha public_goods.xls):<br />
<strong>Jogos</strong> Estritamente Competitivos & Soma Zero<br />
<strong>Jogos</strong> <strong>de</strong> soma fixa (<strong>de</strong> payoffs) são chama<strong>dos</strong> <strong>de</strong> jogos<br />
estritamente competitivos, pois um jogador só aumenta o<br />
seu payoff se houver uma redução no payoff <strong>de</strong> outro.<br />
O resultado <strong>de</strong>sses jogos são sempre Pareto eficiente, pois só se<br />
po<strong>de</strong> melhorar o payoff dum jogador se piorar o <strong>de</strong> outro.<br />
Uma classe particular é a classe <strong>dos</strong> jogos <strong>de</strong> soma zero. Mas<br />
muitos autores chamam os jogos <strong>de</strong> soma fixa <strong>de</strong> jogos <strong>de</strong> soma<br />
zero. Aqui usaremos os dois termos <strong>de</strong> forma intercambiável.<br />
<strong>Jogos</strong> estritamente competitivos se tem um “vencedor” e<br />
um “per<strong>de</strong>dor”. Exs.: xadrêz, pôquer, futebol, etc.<br />
Esses jogos tem pouca importância em economia, já que a<br />
maioria <strong>dos</strong> jogos na economia são jogos <strong>de</strong> soma variável.<br />
Minimax (ou minmax) é um método <strong>da</strong> teoria <strong>da</strong> <strong>de</strong>cisão<br />
tradicional para minimizar a máxima per<strong>da</strong> possível.<br />
Também po<strong>de</strong> ser visto como a estratégia <strong>de</strong> punir um outro<br />
jogador, minimizando o máximo que o outro po<strong>de</strong> obter.<br />
59
<strong>Jogos</strong> <strong>de</strong> Soma Zero, Maximin e Minimax<br />
Em jogos estritamente competitivos com 2-jogadores,<br />
minimizar o payoff adversário equivale a maximizar o<br />
seu próprio payoff. Assim, a matriz <strong>de</strong> jogos po<strong>de</strong> ter<br />
apenas uma entra<strong>da</strong> <strong>de</strong> payoff (do jogador 1), em que:<br />
O jogador 1 tenta maximizar o seu payoff e o jogador 2 tenta<br />
minimizar esse payoff (⇒ maximizando o seu próprio payoff).<br />
Dado o que o adversário está fazendo, a estratégia <strong>de</strong> segurança<br />
do jogador 1 é maximizar o conjunto <strong>de</strong> seus payoff mínimos<br />
(estratégia maximin), enquanto que para o jogador 2 ela é a <strong>de</strong><br />
minimizar o conjunto <strong>de</strong> máximos <strong>de</strong> 1 (estratégia minimax).<br />
Assim, po<strong>de</strong>mos <strong>de</strong>finir estratégias maximin e minimax:<br />
● O equilíbrio do jogo (s*1; s*2) é<br />
Máx Mín v<br />
1(s 1, s<br />
2)<br />
obtido resolvendo o problema:<br />
s1∈S1<br />
s2 ∈S2<br />
Máximo v (s , s *)<br />
Mín Máx v (s , s )<br />
s<br />
∈S<br />
s ∈S<br />
2 2 1 1<br />
1 1 2<br />
s ∈S<br />
1 1<br />
1 1 2<br />
Mínimo v (s *, s )<br />
s<br />
∈S<br />
2 2<br />
1 1 2<br />
Estratégias MiniMax & Maximin<br />
O teorema minimax <strong>de</strong> John von Neumann (1928) diz:<br />
Admitindo estratégias mistas, a estratégia minimax sempre existe<br />
em jogos <strong>de</strong> soma zero com dois jogadores e é única.<br />
As estratégias minimax e maximin surgiram na análise<br />
<strong>de</strong> jogos <strong>de</strong> soma fixa, mas po<strong>de</strong>m ser usa<strong>da</strong>s em jogos <strong>de</strong><br />
soma variável. Mas o eq. <strong>de</strong> Nash é muito mais aceito.<br />
Nos jogos <strong>de</strong> soma variável, em economia, estrat. minimax só<br />
tem algum interesse como estratégias <strong>de</strong> punição em jogos<br />
repeti<strong>dos</strong>, a fim <strong>de</strong> forçar a cooperação <strong>dos</strong> jogadores.<br />
O payoff minimax m i é o menor payoff que os rivais do jogador i<br />
po<strong>de</strong>m impor ao jogador i. É uma punição mais severa do que o EN.<br />
O jogador i se <strong>de</strong>fen<strong>de</strong> jogando a estratégia maximin.<br />
Como observa Rasmusen no seu livro <strong>de</strong> teoria <strong>dos</strong> jogos:<br />
Nos jogos <strong>de</strong> soma variável, a estratégia minimax é para<br />
sádicos e a estratégia maximin é para paranóicos!<br />
Em jogos <strong>de</strong> soma zero, a estratégia minimax ép/ neuróticos<br />
otimistas e a estratégia maximin p/ neuróticos pessimistas!<br />
60
Simplex <strong>de</strong> Três Jogadores<br />
Em topologia, simplex é um invólucro convexo no R n .<br />
No caso <strong>de</strong> 3 estratégias puras ele é um tetraedro no 3 com 4<br />
pontos: (0, 0, 0); (1, 0, 0); (0, 1, 0) e (0, 0, 1). Ver a figura.<br />
Os valores são normaliza<strong>dos</strong>: os valores do gráfico po<strong>de</strong>m ser<br />
interpreta<strong>dos</strong> como percentagens. Assim é usado para<br />
estratégias mistas (probabili<strong>da</strong><strong>de</strong>s aloca<strong>da</strong>s p/ ca<strong>da</strong> estratégia).<br />
Em muitas aplicações só interessa o plano eficiente que dá o<br />
payoff máximo: plano x 1 + x 2 + x 3 = 1.<br />
Por isso po<strong>de</strong>-se trabalhar no R 2 com esse triângulo eficiente.<br />
x 3<br />
x 1<br />
x 2<br />
Fonte: Wikipedia<br />
Curva <strong>de</strong> Deman<strong>da</strong> Linear e Lucro<br />
O mercado <strong>de</strong> um produto qualquer tem uma curva <strong>de</strong><br />
<strong>de</strong>man<strong>da</strong> p = f(q), on<strong>de</strong> p é o preço e q a quanti<strong>da</strong><strong>de</strong> total<br />
<strong>de</strong>man<strong>da</strong><strong>da</strong>. Suponha uma curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> linear.<br />
a<br />
p<br />
p = a − bq<br />
β<br />
Assuma que a = 16 + c , on<strong>de</strong> c é o custo unitário do produto<br />
(⇒ margem = p − c) e suponha b = 1 (⇒ β = 45 0 )<br />
Função lucro π é a margem vezes as ven<strong>da</strong>s: π = (p − c) q<br />
Logo, π = (a − bq − c) q = (16 - q) q ⇒ π = 16 q − q 2<br />
q<br />
61
Competição Perfeita e Monopólio<br />
Na competição perfeita, as firmas são tomadoras <strong>de</strong> preço e<br />
irão produzir com margem igual a zero, isto é, p = c . Logo, a<br />
quanti<strong>da</strong><strong>de</strong> produzi<strong>da</strong> em competição perfeita será:<br />
c = a − bq ⇒ a − c = bq ⇒ 16 = 1 . q ⇒ q = 16<br />
No caso <strong>de</strong> monopólio, isto é, com apenas uma firma no<br />
mercado, o monopolista irá produzir <strong>de</strong> forma a maximizar<br />
o lucro. Logo a quanti<strong>da</strong><strong>de</strong> produzi<strong>da</strong> em monopólio será tal<br />
que maximiza o lucro π = 16 q − q 2 :<br />
Condições <strong>de</strong> maximização:<br />
∂π = 0 ; e<br />
∂ 2 π<br />
∂q<br />
∂q < 0 2<br />
∂π = 16 − 2q = 0 ⇒ q = 8<br />
Conclusão<br />
∂q<br />
Competição produz 16<br />
∂ 2 π<br />
∂q = − 2 < 0 (logo é um máximo) Monopólio produz 8<br />
2<br />
Cournot com Função Deman<strong>da</strong> Genérica<br />
Para uma curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> inversa genérica p(Q) com<br />
N ≥ 1 firmas <strong>de</strong> mesmo custo variável c e custofixo= 0,<br />
a condição <strong>de</strong> primeira or<strong>de</strong>m (CPO) é <strong>da</strong><strong>da</strong> por:<br />
p’(Q*) (Q*/N) + p(Q*) = c<br />
Para N = 1 temos o caso <strong>de</strong> monopólio.<br />
Quando N → ∞temos o caso <strong>de</strong> competição perfeita com p = c.<br />
Além <strong>da</strong> CPO, <strong>de</strong>pois <strong>de</strong>ve-se verificar a existência ou não <strong>de</strong><br />
solução <strong>de</strong> canto, i. é, com q i = 0.<br />
Cournot permite também ser visto <strong>de</strong> forma dinâmica:<br />
Se um par <strong>de</strong> estratégias iniciais não é EN, então os <strong>de</strong>svios<br />
seqüenciais <strong>de</strong> ca<strong>da</strong> jogador para a sua curva <strong>de</strong> melhor<br />
resposta <strong>da</strong>do o que o outro jogou, converge para o único EN-<br />
Cournot.<br />
62
Competição <strong>de</strong> Curto-Prazo: Quanti<strong>da</strong><strong>de</strong> x Preços<br />
A competição <strong>de</strong> curto-prazo com quanti<strong>da</strong><strong>de</strong>s (Cournot)<br />
supõe que o preço resulta do balanço oferta x <strong>de</strong>man<strong>da</strong>.<br />
É como se existe um leilão do produto. Mas quem é o leiloeiro?<br />
Parece mais natural as firmas escolherem preços no curto-prazo.<br />
A primeira tentativa <strong>de</strong> mo<strong>de</strong>lar a competição por preços<br />
foi <strong>de</strong> Bertrand (1883), na crítica ao livro <strong>de</strong> Cournot.<br />
Ele argumentou que seria mais provável que a competição<br />
entre as firmas fossem em preços e não em quanti<strong>da</strong><strong>de</strong>s.<br />
Mas quando uma firma pensa em reajustar preços, <strong>de</strong>ve levar<br />
em conta que a outra firma também po<strong>de</strong> reajustar o preço.<br />
Ex.: a IBM tem <strong>de</strong> <strong>de</strong>cidir que preço cobrar <strong>de</strong> seus “personal<br />
computers”, levando em conta a reação <strong>da</strong>s rivais Dell e HP.<br />
O que diferencia a competição <strong>de</strong> preços <strong>dos</strong> casos <strong>de</strong> monopólio e<br />
competição perfeita, em que essa interação estratégica não existe.<br />
Veremos o mo<strong>de</strong>lo clássico <strong>de</strong> Bertrand <strong>de</strong> duopólio simétrico.<br />
Esse mo<strong>de</strong>lo <strong>de</strong> duopólio leva a resulta<strong>dos</strong> <strong>de</strong> competição perfeita.<br />
Duopólio <strong>de</strong> Preços <strong>de</strong> Bertrand<br />
Como em Cournot é um jogo simultâneo <strong>de</strong> curto-prazo,<br />
mas as estratégias <strong>de</strong> Bertrand são preços p i ∈ S i = [0, ∞).<br />
Encontraremos um equilíbrio <strong>de</strong> Nash totalmente diferente!<br />
As premissas fun<strong>da</strong>mentais do duopólio <strong>de</strong> Bertrand são:<br />
1) As firmas ven<strong>de</strong>m o mesmo produto (produto homogêneo) e só<br />
têm custos variáveis que são iguais c 1 = c 2 (firmas homogêneas);<br />
2) Se uma firma cobrar um preço menor que a rival, ela obterá<br />
to<strong>da</strong> a <strong>de</strong>man<strong>da</strong> do produto e terá capaci<strong>da</strong><strong>de</strong> <strong>de</strong> atendê-la; e<br />
3) Cobrando preços iguais, ca<strong>da</strong> firma leva a meta<strong>de</strong> <strong>da</strong> <strong>de</strong>man<strong>da</strong>.<br />
A premissa crítica é a segun<strong>da</strong>, pois supõe não haver restrição<br />
<strong>de</strong> capaci<strong>da</strong><strong>de</strong>, po<strong>de</strong>ndo uma só firma aten<strong>de</strong>r todo o mercado.<br />
Para calcular o(s) EN-Bertrand do jogo, note que numa<br />
competição “guerra <strong>de</strong> preços”, o preço tem dois limites:<br />
Limite inferior éo custo c: não é ótimo p < c (teria prejuízo); e<br />
Limite superior éo preço <strong>de</strong> monopólio p M : ótimo p/ 1 firma.<br />
Pois é razoável supor que os lucros são tais que 0 ≤ π 1 + π 2 ≤π M .<br />
63
Duopólio <strong>de</strong> Preços <strong>de</strong> Bertrand<br />
Para <strong>de</strong>terminar o EN temos <strong>de</strong> traçar as curvas <strong>de</strong><br />
reação <strong>da</strong>s duas firmas, pois o preço ótimo <strong>da</strong> firma 1<br />
<strong>de</strong>pen<strong>de</strong> do preço cobrado pela firma 2 (ver gráfico):<br />
Deman<strong>da</strong> <strong>da</strong> firma 1 ⎧ Q(p ) se p < p<br />
(<strong>de</strong>scontínua):<br />
q (p , p ) se p p<br />
⎪ 2<br />
⎪⎩ 0 se p > p<br />
Problema:<br />
Máx π = (p −c) q (p , p )<br />
p1<br />
1 1 2<br />
⎪ Q(p<br />
1<br />
)<br />
1 1 2<br />
= ⎨<br />
1<br />
=<br />
2<br />
1 1 1 1 2<br />
1 2<br />
Se a firma 2 joga p 2 ≤ c, a melhor<br />
resposta<strong>da</strong>firma 1 ép 1 = c.<br />
‣Preços menores <strong>da</strong>riam prejuízo e<br />
preços maiores não ven<strong>de</strong>riam na<strong>da</strong>.<br />
Se a firma 2 jogar p 2 ∈ (c, p M ], o<br />
melhor é jogar p 1 apenas um pouco<br />
menor que p 2 e ter todo o mercado.<br />
‣Preços iguais dividiriam o mercado e<br />
preços maiores não ven<strong>de</strong>riam na<strong>da</strong>.<br />
Se a firma 2 jogar p 2 > p M , o melhor é<br />
jogar p 1 = p M e ter todo mercado.<br />
‣ Preço p 1 tal que p M < p 1 < p 2 teria todo<br />
o mercado tb., mas com menor lucro.<br />
Duopólio <strong>de</strong> Preços <strong>de</strong> Bertrand<br />
Como as firmas são homogêneas, o problema é simétrico<br />
em relação à reta <strong>de</strong> 45 o . Assim, plotando no mesmo<br />
gráfico a curva <strong>de</strong> melhor resposta <strong>da</strong> firma 2, p 2 *(p 1 ):<br />
O único ponto <strong>de</strong> cruzamento,<br />
i. é, melhor resposta simultânea,<br />
é o ponto {p 1 = c; p 2 = c}, que é<br />
o único EN-Bertrand.<br />
Assim, o único equilíbrio <strong>de</strong><br />
Nash é ca<strong>da</strong> firma escolher um<br />
preço igual ao custo marginal.<br />
Logo, no EN-Bertrand o lucro<br />
operacional <strong>de</strong> ca<strong>da</strong> firma é zero.<br />
O resultado equivale ao do obtido<br />
no caso <strong>de</strong> mercado em competição<br />
perfeita, mas com só duas firmas!<br />
64
Duopólio <strong>de</strong> Preços <strong>de</strong> Bertrand<br />
Em resumo, o único EN <strong>de</strong>sse jogo é ambas as firmas<br />
jogarem preço = custo como na competição perfeita<br />
(mas só tem duas firmas no mercado!)<br />
Note que se uma <strong>da</strong>s firmas não jogar p 1 = p 2 = c, existe<br />
incentivo para a outra <strong>de</strong>sviar (não seria EN), pois:<br />
Se p 1 = p 2 > c , a firma 1 ou a firma 2 <strong>de</strong>svia para p i −ε;<br />
Se p 1 > p 2 = c , a firma 2 <strong>de</strong>svia para p 2 + ε;<br />
Se p 1 > c > p 2 , a firma 2 <strong>de</strong>svia para p 1 −ε;<br />
Se c > p 1 > p 2 , a firma 1 ou a firma 2 <strong>de</strong>svia para c;<br />
Se p 1 > p 2 > c , a firma 1 <strong>de</strong>svia para p 2 −ε; e<br />
Se p 2 > p 1 = c , a firma 1 <strong>de</strong>svia para p 1 + ε.<br />
Exercício: Mostre que não há EN em estratégias puras na<br />
competição com preços num produto homogêneo se o custo<br />
marginal (constante) <strong>de</strong> uma firma for maior que a <strong>da</strong> outra.<br />
Os Paradoxos <strong>de</strong> Bertrand<br />
O fato <strong>da</strong> presença <strong>de</strong> apenas mais uma única firma ser<br />
suficiente para passar <strong>de</strong> monopólio para competição<br />
perfeita com firmas tendo lucro zero é difícil <strong>de</strong> acreditar.<br />
Isso é chamado <strong>de</strong> paradoxo (clássico) <strong>de</strong> Bertrand.<br />
Um outro paradoxo é por que uma firma entraria nessa<br />
indústria se o lucro operacional é igual a zero?<br />
Além disso, suponha que existe algum custo fixo <strong>de</strong> entrar no<br />
mercado ou produzir. Então se uma firma entrar (monopólio)<br />
a outra firma não irá entrar (pois não pagaria o custo fixo).<br />
Logo, mesmo um pequeno custo fixo (<strong>de</strong> produção ou <strong>de</strong> entra<strong>da</strong>)<br />
é barreira suficiente para o mercado ser um provável monopólio!<br />
Um paradoxo relacionado ao clássico é que o preço <strong>de</strong><br />
equilíbrio in<strong>de</strong>pen<strong>de</strong> <strong>da</strong> quanti<strong>da</strong><strong>de</strong> <strong>de</strong> firmas no mercado.<br />
No caso <strong>de</strong> N > 2 firmas homogêneas competindo em preços<br />
(Bertrand), mostra-se que o único EN é to<strong>dos</strong> jogarem p i = c.<br />
65
Soluções <strong>dos</strong> Paradoxos <strong>de</strong> Bertrand<br />
A 1 a proposta <strong>de</strong> solução p/ o paradoxo <strong>de</strong> Bertrand foi<br />
<strong>de</strong> colocar restrições <strong>de</strong> capaci<strong>da</strong><strong>de</strong>s (Edgeworth, 1897).<br />
A premissa <strong>de</strong> que reduzindo um pouco o preço se obtém todo<br />
o mercado é muito forte na maioria <strong>dos</strong> casos. Exemplo:<br />
Imagine uma pequena ci<strong>da</strong><strong>de</strong> com dois hotéis. Como o número <strong>de</strong><br />
quartos é fixo por hotel, uma guerra <strong>de</strong> preços não teria lógica<br />
pois um hotel não po<strong>de</strong>ria absorver to<strong>da</strong> a <strong>de</strong>man<strong>da</strong>.<br />
Com restrição <strong>de</strong> capaci<strong>da</strong><strong>de</strong>s, passa a ser ótimo um preço p i > c.<br />
Produtos diferencia<strong>dos</strong>: outra solução é que os produtos<br />
<strong>da</strong>s firmas geralmente não são totalmente homogêneos.<br />
Por ex., a firma que ven<strong>de</strong> um software não tem restrição <strong>de</strong><br />
capaci<strong>da</strong><strong>de</strong>s, mas geralmente tem alguma diferenciação: p i ≠ p j<br />
Dinâmica <strong>da</strong> competição e/ou incerteza na <strong>de</strong>man<strong>da</strong>.<br />
As firmas geralmente não se encontram apenas uma vez no<br />
mercado, como assume o mo<strong>de</strong>lo. Elas jogam jogos repeti<strong>dos</strong> e<br />
existe a ameaça <strong>de</strong> punição que po<strong>de</strong> levar a cooperação p i > c.<br />
Incerteza na <strong>de</strong>man<strong>da</strong> também po<strong>de</strong> levar a p i > c (livro do Shy).<br />
Dois Estágios: Cournot + Bertrand = Cournot<br />
O paper clássico <strong>de</strong> Kreps & Scheinkman (1983) mostra<br />
o caso em dois estágios em que as firmas escolhem<br />
capaci<strong>da</strong><strong>de</strong> (Cournot) no primeiro estágio e então<br />
seguem uma competição <strong>de</strong> preços <strong>de</strong> Bertrand.<br />
O primeiro estágio po<strong>de</strong> tanto ser visto como o <strong>de</strong> investimento<br />
em capaci<strong>da</strong><strong>de</strong>s como o <strong>de</strong> acúmulo <strong>de</strong> estoques.<br />
Em muitos casos é um estágio necessário antes <strong>de</strong> ir ao mercado.<br />
No segundo estágio as quanti<strong>da</strong><strong>de</strong>s não po<strong>de</strong>m altera<strong>da</strong>s (logo,<br />
restrição <strong>de</strong> capaci<strong>da</strong><strong>de</strong>) e as firmas escolhem preços.<br />
Eles mostram que o resultante equilíbrio <strong>de</strong> Nash (perfeito<br />
em subjogos, a ser visto) é os jogadores escolherem as<br />
quanti<strong>da</strong><strong>de</strong>s e os preços iguais ao <strong>de</strong> Cournot em 1 estágio!<br />
Os autores concluem que “Com premissas bran<strong>da</strong>s sobre a<br />
<strong>de</strong>man<strong>da</strong>, o único equilíbrio resultante é o <strong>de</strong> Cournot”.<br />
Mo<strong>de</strong>los <strong>de</strong> Cournot, Bertrand, etc., são mais <strong>de</strong>talha<strong>dos</strong><br />
em bons livros <strong>de</strong> organização industrial (Tirole, Shy, etc.)<br />
66
Bertrand com Restrição <strong>de</strong> Capaci<strong>da</strong><strong>de</strong><br />
Consi<strong>de</strong>re que as firmas têm capaci<strong>da</strong><strong>de</strong> limita<strong>da</strong>, <strong>de</strong><br />
forma que no máximo produzem q 1máx = k 1 e q 2máx = k 2 .<br />
Para a firma 1, se ela jogar os preços para baixo, não irá obter<br />
todo o mercado e sim k 1 . Se ela jogar os preços acima, p 1 > p 2 , ela<br />
não per<strong>de</strong> todo o mercado, pois a firma 2 no máximo produz k 2 .<br />
A figura ilustra essa idéia, on<strong>de</strong> c = custo unitário marginal:<br />
p<br />
p(k 2 )<br />
p = c<br />
<strong>de</strong>man<strong>da</strong> atendi<strong>da</strong><br />
pela firma 2<br />
Digamos que a firma 2 aten<strong>da</strong> as k 2<br />
primeiras uni<strong>da</strong><strong>de</strong>s <strong>de</strong>man<strong>da</strong><strong>da</strong>s.<br />
A firma 1 tem incentivo p/ <strong>de</strong>sviar<br />
<strong>de</strong> p* = c, pois po<strong>de</strong>ria jogar um<br />
preço p 1 > c e obter lucro positivo<br />
(em vez <strong>de</strong> lucro = 0 com p = c)<br />
A firma 2 não po<strong>de</strong> “roubar” o<br />
mercado jogando p = c, pois não<br />
teria capaci<strong>da</strong><strong>de</strong> <strong>de</strong> atendê-lo.<br />
p 1<br />
k 2 ven<strong>da</strong>s <strong>da</strong> firma 1<br />
Q T<br />
Cournot + Bertrand = Cournot<br />
A <strong>de</strong>monstração do mo<strong>de</strong>lo <strong>de</strong> Kreps & Scheinkman não<br />
é simples e envolve conceitos ain<strong>da</strong> a serem vistos.<br />
Entretanto iremos mostrar a idéia com um exemplo simples.<br />
Seja um curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> <strong>da</strong><strong>da</strong> por p = 10 – Q T e c 1 = c 2 = 1.<br />
Usando as equações vistas, a produção em Cournot é q 1 = q 2 = 3.<br />
No primeiro estágio as firmas investem em capaci<strong>da</strong><strong>de</strong>s.<br />
Suponha que por algum motivo tenham escolhi<strong>dos</strong> investir<br />
numa capaci<strong>da</strong><strong>de</strong> <strong>de</strong> produzir a quanti<strong>da</strong><strong>de</strong> <strong>de</strong> Cournot q* = 3.<br />
No segundo estágio do jogo as firmas irão escolher preços, mas<br />
com restrição <strong>de</strong> capaci<strong>da</strong><strong>de</strong>. Vimos que nesse caso as firmas<br />
têm incentivos para <strong>de</strong>sviar <strong>da</strong> escolha clássica <strong>de</strong> p Bertrand = c.<br />
Iremos mostrar que eles escolherão p = p(k 1 + k 2 ) como EN,<br />
on<strong>de</strong> k 1 = k 2 = 3 (= q*), <strong>de</strong>vido à restrição <strong>de</strong> capaci<strong>da</strong><strong>de</strong>.<br />
Se no 2º estágio é ótimo jogar um preço p(k 1 + k 2 ), então temos<br />
<strong>de</strong> verificar qual o ótimo no 1º estágio em que se escolhe a<br />
quanti<strong>da</strong><strong>de</strong>. Mas isso é exatamente o problema <strong>de</strong> Cournot já<br />
visto, i. é, <strong>de</strong> maximização <strong>de</strong> lucros escolhendo quanti<strong>da</strong><strong>de</strong>s!<br />
67
Cournot + Bertrand = Cournot<br />
Provaremos que a escolha ótima <strong>de</strong> preços no 2º estágio<br />
é p 1 = p 2 = p Cournot = $ 4 [pois p Cournot = 10 – (3 + 3)].<br />
Se a firma 1 aten<strong>de</strong> os 1 os três consumidores, então a curva <strong>de</strong><br />
<strong>de</strong>man<strong>da</strong> residual p/ a firma 2 (após a produção <strong>da</strong> firma 1) é:<br />
p = 10 – (q 1 + q 2 ) ⇒ p = 10 – (3 + q 2 ) ⇒ p = 7 – q 2 . Ou q 2 = 7 – p.<br />
Só será ótimo a firma 2 <strong>de</strong>sviar na escolha <strong>de</strong> preço se isso<br />
aumentar o lucro <strong>de</strong>la. Sua função lucro Π 2 (p 2 ) é <strong>da</strong><strong>da</strong> por:<br />
Π 2 (p 2 ) = p 2 q 2 –c 2 q 2 ⇒Π 2 (p 2 ) = p 2 (7 – p 2 ) –1.(7 –p 2 ) ⇒<br />
⇒Π 2 (p 2 ) = 7 p 2 –p 22 – 7 + p 2 ⇒Π 2 (p 2 ) = 8 p 2 –p 22 –7<br />
Usa-se a CPO p/ maximizar o lucro escolhendo p, ∂Π 2 / ∂p 2 = 0:<br />
∂Π 2 / ∂p 2 = 0 ⇒ 8 – 2 p 2 = 0 ⇒ p 2 = 4, que é exatamente o preço<br />
obtido quando se joga a quanti<strong>da</strong><strong>de</strong> <strong>de</strong> Cournot!<br />
Por simetria, o mesmo vale para a firma 1 (não é ótimo <strong>de</strong>sviar).<br />
Intuição: preços menores não aumenta as ven<strong>da</strong>s, só obtém<br />
menos receita p/ o mesmo q. Preços maiores diminui a <strong>de</strong>man<strong>da</strong> e<br />
mesmo com maior margem, o lucro por ven<strong>de</strong>r menos é menor.<br />
Notas sobre Cournot + Bertrand = Cournot<br />
A idéia do exemplo ilustrativo foi mostrar que p(k 1 + k 2 )<br />
para os jogadores é EN por não valer a pena <strong>de</strong>sviar.<br />
Foi coloca<strong>da</strong> a curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> residual para a firma 2<br />
apenas para analisar se tinha vantagem a firma 2 <strong>de</strong>sviar <strong>de</strong><br />
forma unilateral, i. é, mantendo fixa a estratégia <strong>da</strong> firma 1.<br />
Por <strong>de</strong>finição, <strong>de</strong>man<strong>da</strong> residual <strong>da</strong> firma 2 é quando fazemos a<br />
<strong>de</strong>man<strong>da</strong> <strong>da</strong> firma 1 fixa. Por isso po<strong>de</strong>-se ver <strong>de</strong>svio unilateral.<br />
A curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> residual não assume que a firma 1 jogou<br />
primeiro (aten<strong>de</strong>ndo k 1 ) e <strong>de</strong>pois a firma 2 jogou aten<strong>de</strong>ndo a<br />
<strong>de</strong>man<strong>da</strong> restante. O jogo é simultâneo (não é sequencial).<br />
A análise do EN é: as firmas estão jogando um preço tal<br />
que está sendo <strong>de</strong>man<strong>da</strong>do k 1 + k 2 . Esse preço é p(k 1 +<br />
k 2 ). Vale a pena <strong>de</strong> forma unilateral cobrar outro preço?<br />
Preço menor só reduz a receita <strong>da</strong> firma 2 por estar no limite<br />
<strong>da</strong> capaci<strong>da</strong><strong>de</strong> (não consegue ven<strong>de</strong>r mais).<br />
Preço maior <strong>da</strong> firma 2 ven<strong>de</strong> menos que k 2 e usando <strong>de</strong>man<strong>da</strong><br />
residual vimos que ela maximiza o lucro com p preço p(k 1 +k 2 ).<br />
68
Existência <strong>de</strong> Equilíbrio <strong>de</strong> Nash<br />
Existência <strong>de</strong> EN: todo jogo tem pelo menos um EN se:<br />
1) Pu<strong>de</strong>r jogar estratégias mistas e se há um número finito <strong>de</strong><br />
estratégias puras no conjunto <strong>de</strong> estratégias <strong>de</strong> ca<strong>da</strong> jogador<br />
Senão, o jogo do par ou ímpar e outros tais como o leilão que<br />
to<strong>dos</strong> pagam (“all-pay auction” a ser visto) não teriam equilíbrio.<br />
2) Caso o jogo só permita estratégias puras, a existência <strong>de</strong><br />
EN só é garanti<strong>da</strong> em certas condições.<br />
Por ex., com conjuntos S i , ∀i, tendo um contínuo <strong>de</strong> estratégias<br />
(infinitas estratégias, ex.: quanti<strong>da</strong><strong>de</strong>s no mo<strong>de</strong>lo <strong>de</strong> Cournot).<br />
<br />
Mais precisamente, EN em estratégias puras existe se para<br />
to<strong>dos</strong> os jogadores i, o conjunto <strong>de</strong> estratégias S i é nãovazio,<br />
convexo e compacto e a função payoff v i (s 1 , … s I ) é<br />
contínua em (s 1 , … s I ) e quase-concava em s i .<br />
São condições suficientes (garante EN), mas não necessárias.<br />
Ver apêndices matemáticos do livro MWG: M.C.3 (p. 933, função<br />
quase-concava); M.F (p.943, conjunto compacto = conjunto<br />
limitado e fechado); M.G (p.946, conjunto convexo).<br />
Existência <strong>de</strong> Equilíbrio <strong>de</strong> Nash<br />
Para provar isso veremos uma <strong>de</strong>finição alternativa <strong>de</strong> EN<br />
usando o conceito <strong>de</strong> ponto fixo <strong>de</strong> uma correspondência.<br />
Correspondência: conceito generalizado <strong>de</strong> função. Associa a ca<strong>da</strong><br />
ponto x um conjunto <strong>de</strong> pontos e não um único ponto y. MWG: p. 949<br />
Ponto fixo: Da<strong>da</strong> uma função ou correspondência f: A → A<br />
(conjunto A nele mesmo), o vetor x ∈ A é ponto fixo <strong>de</strong> f(.) se:<br />
x = f(x) em caso <strong>de</strong> função e x ∈ f(x) em caso <strong>de</strong> correspondência.<br />
Ver apêndice matemático M.I, do livro MGW, p. 952.<br />
Teorema do ponto fixo <strong>de</strong> Brouwer:<br />
Seja f: S → S uma função contínua <strong>de</strong><br />
um conjunto não-vazio, compacto e<br />
convexo S ⊂ R n nele mesmo. Então<br />
existe um x* ∈ S tal que x* = f(x*), i.<br />
é, existe um ponto fixo x* <strong>da</strong> função f.<br />
Figura: S é o intervalo [0, 1], por ex.,<br />
probabili<strong>da</strong><strong>de</strong>s <strong>de</strong> estratégias mistas.<br />
Tem 3 pontos fixos (corta reta f(x) = x)<br />
Figura: Wikipedia<br />
69
Existência <strong>de</strong> Equilíbrio <strong>de</strong> Nash<br />
No caso mais geral temos correspondências e usa-se o<br />
teorema do ponto fixo <strong>de</strong> Kakutani:<br />
Seja ϕ : S → S uma correspondência superior hemi-contínua <strong>de</strong><br />
um conjunto não-vazio, compacto e convexo S ⊂ R n nele<br />
mesmo tal que para todo x ∈ S, o conjunto ϕ(x) é convexo e<br />
não-vazio. Então existe um x* tal que x* ∈ ϕ(x*), i. é, existe um<br />
ponto fixo x* pertencente à correspondência ϕ(.).<br />
Figura: cepa.newschool.edu<br />
EN como Ponto Fixo <strong>de</strong> Correspondência<br />
EN são matematicamente equivalentes aos chama<strong>dos</strong><br />
pontos fixos <strong>da</strong>s correspondências <strong>de</strong> melhor resposta.<br />
No caso do EN-Cournot, vimos que q 1 * = f(q 2 *) e q 2 * = g(q 1 *).<br />
Logo, temos um ponto fixo no EN: q 1 * = f(g(q 1 *)) = h(q 1 *).<br />
No caso mais geral usa-se correspondência, pois mais <strong>de</strong> uma<br />
estratégia po<strong>de</strong> ser melhor resposta a uma certa estratégia.<br />
Assim, po<strong>de</strong>mos <strong>de</strong>finir o EN também como ponto fixo:<br />
Seja R i (s 1<br />
, s 2<br />
, … s N<br />
) a correspondência <strong>de</strong> melhor resposta do<br />
jogador i contra s −i . O perfil <strong>de</strong> estratégias s = (s 1<br />
, s 2<br />
, … s N<br />
) é<br />
equilíbrio <strong>de</strong> Nash <strong>de</strong> um jogo se, p/ todo jogador i = 1, …, N:<br />
s i<br />
* = R i (s 1<br />
*, s 2<br />
*, … s N<br />
*)<br />
A equação acima <strong>de</strong>ixa claro que um EN é um ponto fixo <strong>de</strong>ssa<br />
correspondência <strong>de</strong> melhor resposta. Uma intuição:<br />
Se iniciarmos com um perfil <strong>de</strong> estratégias que seja um EN e<br />
aplicarmos na correspondência <strong>de</strong> melhor resposta para todo i,<br />
então permaneceremos fixos nesse ponto (obtém o mesmo perfil).<br />
70
EN como Ponto Fixo: Exemplo em Cournot<br />
Dizemos que se iniciarmos com um perfil <strong>de</strong> estratégias<br />
que seja um EN e aplicarmos na correspondência <strong>de</strong><br />
melhor resposta para todo i, então permaneceremos<br />
fixos nesse ponto (obtém o mesmo perfil). Exemplo:<br />
No caso do duopólio <strong>de</strong> Cournot com <strong>de</strong>man<strong>da</strong> linear e sem<br />
custo fixo, vimos que as curvas <strong>de</strong> melhor resposta são:<br />
Funções melhor<br />
a−c 1<br />
− b q2<br />
a−c 2<br />
− b q1<br />
q(q)<br />
1 2<br />
= q(q)<br />
2 1<br />
=<br />
resposta (reação):<br />
2b<br />
2b<br />
Se substituirmos q 2 (q 1 ) em q 1 (q 2 ) iremos obter q 1* = f(q 1* ):<br />
*<br />
⎛a−c 2<br />
− b q ⎞<br />
1<br />
a−c 1<br />
− b ⎜ ⎟<br />
*<br />
*<br />
2b 2a −2c 1− a + c<br />
2<br />
+ b q1<br />
q<br />
1<br />
=<br />
⎝<br />
⎠<br />
=<br />
2b<br />
4b<br />
Assim q 1 é uma função <strong>de</strong> q 1 , i. é, q 1 = f(q 1 ). Se na expressão<br />
acima chutarmos no lado direito um valor <strong>de</strong> q 1* que seja EN,<br />
então o valor <strong>de</strong> q 1 obtido do lado esquerdo é o mesmo q<br />
*<br />
1<br />
chutado. Logo, se chutarmos um EN, temos um ponto fixo.<br />
Exemplo <strong>de</strong> Ponto Fixo <strong>de</strong> Correspondência<br />
No jogo “batalha <strong>dos</strong> sexos” foi contruído um gráfico<br />
para <strong>de</strong>terminar o equilíbrio em estratégias mistas que<br />
ilustra o EN como ponto fixo <strong>de</strong> correspondências <strong>de</strong><br />
melhor resposta.<br />
π 2<br />
1<br />
Correspondência do jogador 2: π 2 *(π 1 )<br />
Correspondência do jogador 1: π 1 *(π 2 )<br />
1/3<br />
EN em estratégias<br />
mistas: um <strong>dos</strong> três<br />
pontos fixos π 1 *(π 2 *)<br />
2/3<br />
π 1<br />
71
Exercício <strong>de</strong> <strong>Jogos</strong> Repeti<strong>dos</strong>: Cournot<br />
Seja o estágio-jogo G uma competição em quanti<strong>da</strong><strong>de</strong>s <strong>de</strong><br />
Cournot, num mercado com <strong>de</strong>man<strong>da</strong> P(Q) = a − b Q e<br />
jogadores com os mesmos custos marginais c.<br />
Mostre que num jogo G repetido infinitamente, existe<br />
algum fator <strong>de</strong> <strong>de</strong>sconto δ ∗ , tal que se δ ≥ δ * então:<br />
Po<strong>de</strong> ser sustentado num ENPS o payoff <strong>de</strong> colusão obtido com<br />
ca<strong>da</strong> firma produzindo a meta<strong>de</strong> <strong>da</strong> quanti<strong>da</strong><strong>de</strong> <strong>de</strong> monopólio<br />
q M e ca<strong>da</strong> firma usando a seguinte estratégia “grim”:<br />
‣ Produzir q M / 2 no primeiro período. No período t continuar<br />
produzindo q M / 2 se ambas as firmas tiverem produzi<strong>dos</strong> q M / 2<br />
nos t − 1 perío<strong>dos</strong> anteriores. Caso contrário produzir a<br />
quanti<strong>da</strong><strong>de</strong> do EN-Cournot q C .<br />
Determine o valor <strong>de</strong> δ * (o que também prova que ele existe)<br />
Dicas: ver ex. do dilema <strong>dos</strong> prisioneiros; calcule o máximo lucro<br />
<strong>de</strong> <strong>de</strong>svio π D em um estágio (<strong>da</strong>do que o outro está jogando q M /2)<br />
que, somado aos lucros <strong>de</strong> Cournot π C nos estágios seguintes, <strong>de</strong>ve<br />
ser comparado com o lucro eterno <strong>de</strong> π M /2se não <strong>de</strong>sviar <strong>de</strong> q M /2<br />
Cotas <strong>da</strong> OPEP com Repetição Infinita<br />
Seja o jogo <strong>de</strong> quotas <strong>da</strong> OPEP, mas com repetição<br />
infinita. Consi<strong>de</strong>re dois países Arábia Saudita e Irã.<br />
Ver planilha <strong>Jogos</strong> <strong>da</strong> OPEP.xls (aba “quotas_repetido_estoc”)<br />
O jogo é apresentado no livro do Dutta (“Strategy and Games”,<br />
MIT Press, 1999), ver trecho do livro na Pasta 72.<br />
Consi<strong>de</strong>re que em qualquer período a <strong>de</strong>man<strong>da</strong> po<strong>de</strong> ser<br />
alta ou baixa. A função <strong>de</strong>man<strong>da</strong> é linear e <strong>da</strong><strong>da</strong> por:<br />
Deman<strong>da</strong> alta: p H = a H –b H (q A + q I ) = 44,5 – 1,5 (q A + q I ).<br />
Deman<strong>da</strong> baixa: p L = a L –b L (q A + q I ) = 22,5 – 0,5 (q A + q I ).<br />
Sejam os custos unitários marginais c A = c I = 5 US$/bbl e<br />
ca<strong>da</strong> país po<strong>de</strong> produzir o valor <strong>da</strong> quota OPEP ou nãocooperar<br />
produzindo dois milhões bbl/dia acima <strong>da</strong> cota.<br />
As quotas são <strong>de</strong> 8 milhões <strong>de</strong> bbl/dia para a Arábia Saudita e<br />
<strong>de</strong> 5 milhões <strong>de</strong> bbl/dia para o Irã. Assim, as produções totais<br />
possíveis são 13 ; 15 e 17 milhões bbl/dia.<br />
72
Cotas <strong>da</strong> OPEP com Repetição Infinita<br />
Consi<strong>de</strong>re que caso algum país não-coopere em um<br />
estágio, a seguir haverá punição com a estratégia “grim”.<br />
Se um <strong>dos</strong> países jogar “não-cooperar” (produção acima <strong>da</strong><br />
cota) num estágio, então será jogado sempre {não-cooperar;<br />
não-cooperar} nos estágios sub-sequentes do superjogo.<br />
Determine, p/ ca<strong>da</strong> país, os fatores <strong>de</strong> <strong>de</strong>sconto mínimos<br />
para sustentar a cooperação (jogar as cotas) nos esta<strong>dos</strong><br />
<strong>de</strong> <strong>de</strong>man<strong>da</strong> alta e fraca.<br />
Depois consi<strong>de</strong>re uma probabili<strong>da</strong><strong>de</strong> p <strong>da</strong> <strong>de</strong>man<strong>da</strong> ser alta<br />
em qualquer estágio (e, logo, 1 – p para a <strong>de</strong>man<strong>da</strong> ser fraca).<br />
Iremos consi<strong>de</strong>rar repetição infinita, como aproximação<br />
razoável. Mas alguns autores consi<strong>de</strong>ram que o jogo <strong>da</strong><br />
OPEP é <strong>de</strong> repetição finita, pois as reservas são finitas.<br />
Para resolver, teremos <strong>de</strong> montar as matrizes <strong>de</strong> payoffs<br />
para os dois casos <strong>de</strong> <strong>de</strong>man<strong>da</strong> (ver próximo sli<strong>de</strong>).<br />
Cotas <strong>da</strong> OPEP com Repetição Infinita<br />
A matrizes <strong>de</strong> payoffs para os dois casos <strong>de</strong> <strong>de</strong>man<strong>da</strong> são<br />
(checar!):<br />
Deman<strong>da</strong> Alta:<br />
Deman<strong>da</strong> Baixa:<br />
73
Cotas <strong>da</strong> OPEP com Repetição Infinita<br />
Observando a matriz no caso <strong>de</strong> <strong>de</strong>man<strong>da</strong> alta, temos<br />
um caso típico <strong>de</strong> dilema <strong>dos</strong> prisioneiros, on<strong>de</strong> existe<br />
ganho para ambos cooperarem.<br />
O mesmo não ocorre para o caso <strong>de</strong> <strong>de</strong>man<strong>da</strong> fraca, on<strong>de</strong><br />
{cooperar ; cooperar} tem um payoff somado (143) menor que<br />
o caso do EN {não-cooperar ; não-cooperar} (payoff = 153).<br />
Isso ocorre <strong>de</strong>vido aos valores adota<strong>dos</strong> (não é regra geral), mas o<br />
livro usa isso p/ explicar a falta <strong>de</strong> cooperação nos anos 60, já que<br />
não-cooperar aten<strong>de</strong> as racionali<strong>da</strong><strong>de</strong>s individuais (EN) e coletiva.<br />
Vejamos o caso <strong>de</strong> interesse (<strong>de</strong>man<strong>da</strong> alta). Se a Arábia<br />
tem um fator <strong>de</strong> <strong>de</strong>sconto δ A e não <strong>de</strong>sviar o payoff será:<br />
Π A (coopera) = 160 + 160 δ A + 160 δ A2 + ... = 160 / (1 − δ A )<br />
Se ela <strong>de</strong>sviar no 1º estágio, terá um ganho <strong>de</strong> curto prazo, mas<br />
será punido com o EN nos <strong>de</strong>mais estágios e o payoff será:<br />
Π A (<strong>de</strong>svia) = 170 + 140 δ A + 140 δ A2 ... = 170 + [140 δ A /(1 − δ A )]<br />
A cooperação ocorre se Π A (coopera) ≥ Π A (<strong>de</strong>svia) ⇒ δ A ≥ 1/3<br />
Cotas <strong>da</strong> OPEP com Repetição Infinita<br />
Assim, para a Arábia Saudita não seria difícil cooperar<br />
com <strong>de</strong>man<strong>da</strong> alta, já que o fator <strong>de</strong> <strong>de</strong>sconto mínimo<br />
(taxa <strong>de</strong> <strong>de</strong>sconto máxima) é bem baixo.<br />
Para o Irã um raciocínio análogo resulta em:<br />
Π I (coopera) = 100 + 100 δ I + 100 δ I2 + ... = 100 / (1 − δ I )<br />
Se ele <strong>de</strong>sviar no 1º estágio e ser punido <strong>de</strong>pois, o payoff será:<br />
Π I (<strong>de</strong>svia) = 119 + 98 δ I + 98 δ I2 ... = 119 + [98 δ I /(1 − δ I )]<br />
A cooperação ocorre se Π I (coopera) ≥ Π I (<strong>de</strong>svia) ⇒ δ I ≥ 19/21<br />
Logo, o fator <strong>de</strong> <strong>de</strong>sconto mínimo do Irã é bem mais alto<br />
que o <strong>da</strong> Arábia. É bem mais difícil para o Irã cooperar.<br />
Note que o Irã ganha mais <strong>de</strong>sviando que a Arábia e a per<strong>da</strong><br />
com a punição grim é menor para o Irã do que para a Arábia.<br />
No caso estocástico ca<strong>da</strong> país tem 4 estratégias diferentes:<br />
Sempre cooperar [q C ; q C ]; cooperar só se a <strong>de</strong>man<strong>da</strong> for alta<br />
[q C ; q N ]; coop. só se for baixa [q N ; q C ]; nunca cooperar [q N ; q N ] .<br />
74
Cotas <strong>da</strong> OPEP com Repetição Infinita<br />
On<strong>de</strong> o 1º termo em [. ; .] é relativo a <strong>de</strong>man<strong>da</strong> alta e o 2º<br />
em relação a <strong>de</strong>man<strong>da</strong> fraca. A matriz <strong>de</strong> payoffs para<br />
uma probabili<strong>da</strong><strong>de</strong> <strong>de</strong> <strong>de</strong>man<strong>da</strong> alta <strong>de</strong> p = 50% é:<br />
Note que a estratégia <strong>de</strong> cooperação <strong>de</strong> interesse, on<strong>de</strong> a soma<br />
<strong>de</strong> payoffs é máxima, é quando ambos jogam baixa produção se<br />
a <strong>de</strong>man<strong>da</strong> é alta e alta produção se a <strong>de</strong>man<strong>da</strong> é baixa.<br />
Mostre que esse resultado vale para qualquer probabili<strong>da</strong><strong>de</strong> p.<br />
Cotas <strong>da</strong> OPEP com Repetição Infinita<br />
Note que o único EN é produção alta para ambos os<br />
países. Esse par <strong>de</strong> estratégias é EN para qualquer p e é<br />
EN único para qualquer p não trivial, i. é, p ≠ 0 e p ≠ 1.<br />
A cooperação basea<strong>da</strong> na estratégia <strong>de</strong> punição grim é:<br />
Cooperar enquanto o ambos cooperam, sendo cooperar é<br />
quando ambos jogam baixa produção se a <strong>de</strong>man<strong>da</strong> é alta e<br />
alta produção se a <strong>de</strong>man<strong>da</strong> é baixa.<br />
Se algum país não cooperar, então será jogado o único EN<br />
(ambos produzindo o máximo) em to<strong>dos</strong> os estágios futuros.<br />
Imagine que a <strong>de</strong>man<strong>da</strong> é alta, <strong>de</strong> forma que existe um<br />
ganho <strong>de</strong> curto prazo <strong>de</strong>sviando <strong>da</strong> cooperação.<br />
Quais os fatores <strong>de</strong> <strong>de</strong>sconto mínimos p/ sustentar a cooperação?<br />
Consi<strong>de</strong>re primeiro o caso <strong>da</strong> Arábia. Se ela nunca trair:<br />
Π A (coop.) = 160 + [160 p + (1 – p) 90] δ A + [160 p + (1 – p) 90] δ A<br />
2<br />
+ ... ⇒ Π A (coop.) = 160 + {[160 p + (1 – p) 90] δ A / (1 − δ A )}<br />
75
Cotas <strong>da</strong> OPEP com Repetição Infinita<br />
Caso a Arábia <strong>de</strong>svie no 1º período, seu payoff ficaria:<br />
Π A (não-coop.) = 170 + [140 p + (1 - p) 90] δ A + [140 p + (1 - p) 90] δ A<br />
2<br />
+ ... ⇒ Π A (não-coop.) = 170 + {[140 p + (1 – p) 90] δ A / (1 − δ A )}<br />
Não haverá incentivo para trair se Π A (não-coop.) ≥ Π A (coop.):<br />
160 + {[160 p + (1 – p) 90] δ A / (1 −δ A )} ≥ 170 + {[140 p + (1 – p) 90] δ A / (1 −δ A )}<br />
⇒ δ A ≥ 1 / (1 + 2 p) para a Arábia cooperar.<br />
Consi<strong>de</strong>re agora o caso do Irã. Se ele nunca trair:<br />
Π I (coop.) = 100 + [100 p + (1 – p) 63] δ I + [100 p + (1 – p) 63] δ I2 +<br />
... ⇒ Π I (coop.) = 100 + {[100 p + (1 – p) 63] δ I / (1 −δ I )}<br />
Caso o Irã <strong>de</strong>svie no 1º período, seu payoff ficaria:<br />
Π I (não-coop.) = 119 + [98 p + (1 - p) 63] δ I + [98 p + (1 - p) 63] δ I2 +<br />
... ⇒ Π I (não-coop.) = 119 + {[98 p + (1 – p) 63] δ I / (1 − δ I )}<br />
Não haverá incentivo para trair se Π I (não-coop.) ≥ Π I (coop.):<br />
100 + {[100 p + (1 – p) 63] δ I / (1 −δ I )} ≥ 119 + {[98 p + (1 – p) 63] δ I / (1 −δ I )}<br />
⇒ δ I ≥ 19 / (19 + 2 p) para o Irã cooperar.<br />
Cotas <strong>da</strong> OPEP com Repetição Infinita<br />
A não ser no caso trivial <strong>de</strong> p = 0, o fator <strong>de</strong> <strong>de</strong>sconto<br />
mínimo requerido para o Irã é maior (ou bem maior)<br />
que o requerido para a Arábia.<br />
Logo, é relativamente fácil para a Arábia cooperar sempre,<br />
mas é geralmente difícil para o Irã cooperar.<br />
Essa é uma conclusão consistente com a reali<strong>da</strong><strong>de</strong> observa<strong>da</strong>,<br />
conforme o autor (Dutta) argumenta.<br />
Note que usamos os mesmo custos unitários, apenas as<br />
capaci<strong>da</strong><strong>de</strong>s <strong>de</strong> produção <strong>de</strong>sses países é que são diferentes.<br />
A tabela abaixo mostra a sensibili<strong>da</strong><strong>de</strong> com a probabili<strong>da</strong><strong>de</strong> p:<br />
76
Ex: Cournot com Informação Incompleta<br />
Seja a competição em quanti<strong>da</strong><strong>de</strong>s (Cournot) mas com<br />
informação incompleta e assimétrica sobre o custo:<br />
Firma 1 é uma firma estabeleci<strong>da</strong> no mercado e por isso tem<br />
custo marginal c conhecido pela firma 2.<br />
Firma 2 é uma firma nova, que está entrando no mercado e<br />
que tem custo conhecido por ela, mas que a firma 1 <strong>de</strong>sconhece.<br />
Assim, a informação incompleta é assimétrica: a firma 2 é a firma<br />
informa<strong>da</strong> e a firma 1 tem informação incompleta sobre a firma 2.<br />
Assuma só dois cenários: a firma 2 po<strong>de</strong> ser <strong>de</strong> alto custo c H , ou<br />
<strong>de</strong> baixo custo c L , por ex. <strong>de</strong>vido a diferenças <strong>de</strong> tecnologia.<br />
No contexto Bayesiano, diz-se que a firma 1 tem um só tipo<br />
(espaço <strong>de</strong> tipos Θ 1 = {c}) e a firma 2 tem dois tipos, Θ 2 = {c L , c H }.<br />
Porém, é conhecimento comum (firmas 1 e 2) a distribuição <strong>de</strong><br />
probabili<strong>da</strong><strong>de</strong>s a priori sobre os tipos <strong>dos</strong> jogadores:<br />
A firma 1 sabe que a firma 2 tem probabili<strong>da</strong><strong>de</strong> p <strong>de</strong> ser do<br />
tipo c H e probabili<strong>da</strong><strong>de</strong> 1 − p <strong>de</strong> ser do tipo c L .<br />
Aqui os tipos são in<strong>de</strong>pen<strong>de</strong>ntes ⇒ prob(θ 2 = c L | c) = prob(θ 2 = c L ).<br />
Cournot com Informação Incompleta<br />
Seja a função <strong>de</strong>man<strong>da</strong> inversa linear P(Q) = a − Q, com<br />
Q = q 1 + q 2 . As firmas maximizam o lucro escolhendo as<br />
quanti<strong>da</strong><strong>de</strong>s, mas agora a curva <strong>de</strong> reação <strong>da</strong> firma 2<br />
<strong>de</strong>pen<strong>de</strong> se ela é do tipo alto custo ou do tipo baixo custo.<br />
Denote q 2* (c L ) e q 2* (c H ) as curvas <strong>de</strong> reação <strong>da</strong> firma 2 a<br />
<strong>de</strong>pen<strong>de</strong>r <strong>de</strong> seu tipo e q 1* a curva <strong>de</strong> reação <strong>da</strong> firma 1.<br />
Se a firma 2 for do tipo baixo custo, ela escolhe q 2* (c L ) que<br />
resolve: max [(a − q − q ) − c ] q<br />
q2<br />
1 2 L 2<br />
Se a firma 2 for do tipo alto custo, ela escolhe q 2* (c H ) que<br />
resolve: max [(a − q<br />
1<br />
− q<br />
2) − c<br />
H] q<br />
2<br />
q2<br />
A firma 1 escolhe q 1* sabendo que existe uma probabili<strong>da</strong><strong>de</strong> p<br />
<strong>da</strong> firma 2 ter a curva <strong>de</strong> reação q 2* (c H ) e 1 − p <strong>de</strong>la ser q 2* (c L ):<br />
max p [(a −q −q (c )) −c ] q + (1 −p) [(a −q −q (c )) −c ] q<br />
q1<br />
1 2 H 1 1 2 L 1<br />
Usando as condições <strong>de</strong> primeira or<strong>de</strong>m para ca<strong>da</strong> um <strong>dos</strong> três<br />
problemas <strong>de</strong> maximização e como as quanti<strong>da</strong><strong>de</strong>s têm <strong>de</strong> ser ≥ 0:<br />
77
Cournot com Informação Incompleta<br />
Usando CPOs (<strong>de</strong>rivando e igualando a zero):<br />
* ⎧ a−q1 −cH<br />
⎫<br />
* ⎧ a−q1 −cL<br />
⎫<br />
q<br />
2(c H) = max ⎨0,<br />
⎬<br />
q<br />
2(c L) = max ⎨0,<br />
⎬<br />
⎩ 2 ⎭<br />
⎩ 2 ⎭<br />
* ⎧ p [a −q 2(c H) −c ] + (1 −p) [a −q 2(c L) −c ] ⎫<br />
q<br />
1<br />
= max⎨0,<br />
⎬<br />
⎩<br />
2<br />
⎭<br />
Substituindo a curva <strong>de</strong> reação duma firma na curva <strong>de</strong> reação <strong>da</strong><br />
outra firma se obtém os valores <strong>de</strong> quanti<strong>da</strong><strong>de</strong>s em equilíbrio:<br />
* ⎧ a 2 c<br />
H<br />
+ c (1 p) (cH c<br />
L)<br />
q<br />
2(c H) = max 0,<br />
− − − ⎫<br />
⎨<br />
+<br />
⎬<br />
⎩ 3 6 ⎭<br />
* ⎧ a−2 c<br />
L<br />
+ c p (cH −c L)<br />
⎫<br />
q<br />
2(c L) = max ⎨0,<br />
− ⎬<br />
⎩ 3 6 ⎭<br />
* ⎧ a − 2 c + p c<br />
H<br />
+ (1 −p) cL<br />
⎫<br />
No caso + geral ocorre<br />
q<br />
1<br />
= max ⎨0,<br />
⎬<br />
E[q<br />
2(c)]<br />
≠ q<br />
2(E[c])<br />
<br />
⎩<br />
3<br />
⎭<br />
Compare com o caso com informação completa, em que tínhamos<br />
q i* = (a − 2 c i + c j ) / 3 (se não-negativo). Firma 1: lineari<strong>da</strong><strong>de</strong> <strong>de</strong> π 1<br />
com q 2 e o custo a fez usar o valor esperado do custo <strong>da</strong> rival no q<br />
*<br />
1 .<br />
Firma 2: se ela for <strong>de</strong> alto custo ela produziria mais do que com<br />
inform. completa. Mas se for <strong>de</strong> baixo custo, ela produziria menos.<br />
Cournot com Informação Incompleta<br />
Assim, uma firma <strong>de</strong> alto custo irá querer escon<strong>de</strong>r o<br />
seu custo <strong>da</strong> outra firma, p/ produzir mais e lucrar mais.<br />
Já uma firma <strong>de</strong> baixo custo po<strong>de</strong>rá querer sinalizar que ela é<br />
<strong>de</strong> baixo custo, i. é, divulgar <strong>de</strong> forma crível o seu custo baixo.<br />
q 1 Curva <strong>de</strong> reação <strong>da</strong> firma 2<br />
se ela for <strong>de</strong> baixo custo: q 2 *(c L )<br />
q 2<br />
Curva <strong>de</strong> reação <strong>da</strong> firma 2<br />
se ela for <strong>de</strong> alto custo: q 2 *(c H )<br />
q 1<br />
*<br />
Curva <strong>de</strong> reação espera<strong>da</strong> <strong>da</strong> firma 2: E[q 2 ]. Coincidência: a firma 1<br />
maximiza E[π 1 (q 2 )], mas aqui π 1 é linear com q 2 ⇒ po<strong>de</strong> usar E[q 2 ].<br />
Com informação completa as quanti<strong>da</strong><strong>de</strong>s seriam<br />
diferentes: equilíbrio caso a firma 2 for <strong>de</strong> baixo custo<br />
Curva <strong>de</strong> Reação<br />
<strong>da</strong> firma 1: q 1 *(q 2 )<br />
q 2*<br />
(c H<br />
) q 2*<br />
(c L<br />
)<br />
ver também a planilha<br />
cournot_assimetrico.xls<br />
78
<strong>Teoria</strong> <strong>da</strong> Informação Assimétrica<br />
A teoria <strong>de</strong> merca<strong>dos</strong> sob informação assimétrica foi<br />
agracia<strong>da</strong> com três Prêmios Nobel em Economia (2001):<br />
Seleção Adversa: George Akerlof (“mercado <strong>de</strong> limões”).<br />
Sinalização: Michael Spence (mercado <strong>de</strong> trabalho).<br />
Screening: Joseph Stiglitz (mercado <strong>de</strong> seguros).<br />
A teoria <strong>de</strong> incentivos sob informação assimétrica obteve<br />
mais dois Prêmios Nobel (1996) [ver paper na Pasta 72]:<br />
James Mirrless (<strong>de</strong>senho <strong>da</strong> taxação ótima <strong>de</strong> ren<strong>da</strong>).<br />
William Vickrey (<strong>de</strong>senho <strong>de</strong> leilões).<br />
<strong>Teoria</strong> <strong>de</strong> Agência vs. Assimetria <strong>de</strong> Informação<br />
<strong>Teoria</strong> <strong>de</strong> Agência: analisa problemas <strong>de</strong>vido a conflitos <strong>de</strong><br />
agente e principal, com informação assimétrica ou não.<br />
“Common Agency”: vários principais. Ex.: firma é um agente<br />
informado com vários principais: fisco, agência reguladora, etc.<br />
Assimetria <strong>de</strong> Informação: o agente é a parte mais informa<strong>da</strong> e<br />
o principal é a parte menos informa<strong>da</strong>.<br />
Leilões na Internet<br />
Leilões online surgiram na web em 1995. O site virou<br />
uma empresa (AuctionWeb) que virou eBay em 1997.<br />
Ver http://en.wikipedia.org/wiki/Ebay<br />
Existem to<strong>dos</strong> os tipos <strong>de</strong> leilões na internet.<br />
O mais usado é o leilão inglês e suas variações (em ~ 85% <strong>dos</strong><br />
casos segundo Kambil & van Heck, “Making Markets”, 2002).<br />
O leilão inglês é o mais antigo <strong>de</strong> to<strong>dos</strong> (<strong>de</strong>s<strong>de</strong> ~500 A.C.) e<br />
muito usado para objetos <strong>de</strong> arte.<br />
O leilão <strong>de</strong> 2º lance é um <strong>dos</strong> formatos usa<strong>dos</strong> pelo eBay (proxy<br />
bidding system), mas com uma pequena variação: o vencedor<br />
paga o segundo maior bid mais um incremento <strong>de</strong> valor fixo.<br />
O leilão holandês <strong>da</strong>ta <strong>de</strong> ~1870, usado em mercado <strong>de</strong> flores e<br />
tem sido usado na internet com aju<strong>da</strong> <strong>de</strong> um “auction clock”.<br />
O “relógio” vai marcando preços <strong>de</strong>crescentes ao longo do tempo<br />
até que alguém para o relógio. No caso tradicional, oral, o<br />
leiloeiro vai reduzindo o preço até alguém dizer “é meu!”.<br />
79
Leilão <strong>de</strong> Telecomunicações (FCC)<br />
Um caso famoso foi o leilão <strong>de</strong> um espectro <strong>de</strong> telecom.<br />
<strong>da</strong> FCC (US Fe<strong>de</strong>ral Communication Commision) em<br />
1994/1995 que gerou uma receita <strong>de</strong> 7,7 bilhões <strong>de</strong> US$.<br />
Licenças para oferecer uma gama <strong>de</strong> serviços wireless tais<br />
como serviços p/ celulares, pagers, transmissão <strong>de</strong> <strong>da</strong><strong>dos</strong>, etc.<br />
O leilão foi <strong>de</strong>senhado por três especialistas em teoria<br />
<strong>dos</strong> jogos (Milgrom, Wilson e McAfee) para ven<strong>da</strong><br />
simultânea <strong>de</strong> várias licenças em várias áreas <strong>dos</strong> EUA.<br />
O formato foi <strong>de</strong> preços abertos ascen<strong>de</strong>ntes, mas p/ múltiplas<br />
licenças. Ca<strong>da</strong> participante podia <strong>da</strong>r lances nas áreas que<br />
quisessem, a ca<strong>da</strong> ro<strong>da</strong><strong>da</strong>. O leilão só terminava quando em<br />
uma ro<strong>da</strong><strong>da</strong> nenhuma área recebesse novos bids.<br />
Houveram 112 ro<strong>da</strong><strong>da</strong>s que levaram 4 meses. Resultado foi<br />
consi<strong>de</strong>rado um sucesso pelo governo.<br />
Esse formato previne o “winner´s curse” (que ocorreria se<br />
fosse leilão selado), que po<strong>de</strong>ria levar as firmas a <strong>da</strong>r lances<br />
muito conservadores, e <strong>da</strong>va flexibili<strong>da</strong><strong>de</strong> às firmas que<br />
queriam uma combinação <strong>de</strong> licenças p/ serem mais agressivas.<br />
Estratégias do Comprador: Winner’s Curse<br />
Maldição do vencedor (“winners’ curse”): firmas pagam<br />
mais do que vale o bem. Uma firma só ganha o leilão se<br />
sua avaliação for a mais alta <strong>de</strong>ntre to<strong>da</strong>s as jogadoras.<br />
Assim, mesmo que em média as suas avaliações (e seus lances)<br />
não superestimem os valores <strong>dos</strong> ativos, as firmas só ganham<br />
quando as suas avaliações são as mais otimistas do leilão.<br />
Condicional a ser o vencedor, paga-se mais que a avaliação<br />
média (ou melhor, do bid médio) <strong>dos</strong> participantes do leilão.<br />
Capen & Clapp & Campbell, 1971: isso ocorreu em leilões <strong>de</strong><br />
áreas exploratórias no Golfo do México americano nos anos 60.<br />
Com o tempo, as firmas apren<strong>de</strong>m a se comportar <strong>de</strong> forma<br />
estratégica, antecipando o “winner’s curse” e <strong>da</strong>ndo lances<br />
mais conservadores. Em equilíbrio esse problema é <strong>de</strong>scartado.<br />
De novo, a firma no leilão <strong>de</strong> 1º lance tem <strong>de</strong> raciocinar qual o<br />
lance ótimo, <strong>da</strong>do que ela tem a maior valoração do leilão.<br />
“Dinheiro <strong>de</strong>ixado sobre a mesa” no leilão <strong>de</strong> 1º lance:<br />
diferença entre o lance vencedor e o lance do 2º colocado.<br />
80
Leilão Ótimo para o Leiloeiro<br />
Com um número reduzido <strong>de</strong> preten<strong>de</strong>ntes ao bem em leilão, o<br />
leiloeiro po<strong>de</strong>ria obter um valor muito abaixo <strong>de</strong> V θ .<br />
Elepo<strong>de</strong>atéterum preço <strong>de</strong> reserva abaixo do qual ele não<br />
ven<strong>de</strong> o bem, pois teria utili<strong>da</strong><strong>de</strong> negativa.<br />
Qual o leilão ótimo, o <strong>de</strong> segundo lance ou o <strong>de</strong> primeiro lance?<br />
Surpresa: em geral ambos dão a mesma receita espera<strong>da</strong> ao leiloeiro!<br />
Isso é referido como sendo a equivalência <strong>de</strong> receita entre os dois leilões.<br />
Demonstração usa o princípio <strong>da</strong> revelação para restringir a busca.<br />
Ex.: Dutta (1999, cap.23) caso extremo com dois compradores.<br />
No leilão <strong>de</strong> primeiro lance ele obtém o seguinte ENB:<br />
O tipo <strong>de</strong> menor valoração µ oferta o seu próprio valor e o tipo <strong>de</strong><br />
maior valor θ joga uma estratégia mista atribuindo uma distribuição <strong>de</strong><br />
probabili<strong>da</strong><strong>de</strong>s a to<strong>dos</strong> os lances entre µ e (θ + µ)/2 (equilíbrio único).<br />
No caso analisado, ca<strong>da</strong> jogador tem 50% <strong>de</strong> chance <strong>de</strong> ser <strong>de</strong> ca<strong>da</strong> tipo,<br />
e logo po<strong>de</strong> ocorrer que ambos os dois jogadores sejam do tipo θ (ou µ).<br />
Ele chega a conclusão que ambos os leilões dão a mesma receita espera<strong>da</strong><br />
Definição: Estratégias simétricas <strong>de</strong> equilíbrio são quando to<strong>dos</strong><br />
os jogadores jogam a mesma função, b i (θ) = b j (θ) = b(θ), embora<br />
ca<strong>da</strong> um possa ter um tipo diferente (e <strong>da</strong>r lances diferentes).<br />
Receita e Número <strong>de</strong> Competidores: Exemplo<br />
O resultado clássico <strong>de</strong> que a receita espera<strong>da</strong> do leiloeiro<br />
aumenta com o n o <strong>de</strong> compradores nos 4 formatos vistos é<br />
ilustrado com o seguinte exemplo p/ leilão <strong>de</strong> 2º lance:<br />
Seja um leilão <strong>de</strong> 2º lance com só dois competidores, sendo que<br />
ca<strong>da</strong> um tem uma valoração priva<strong>da</strong> <strong>de</strong> que o bem vale $ 10 ou<br />
$ 20 com 50% <strong>de</strong> chances ca<strong>da</strong> um. Qual a receita espera<strong>da</strong>?<br />
Note que existem 4 possibili<strong>da</strong><strong>de</strong>s, ca<strong>da</strong> uma com 25% <strong>de</strong><br />
chances: [10; 10]; [10; 20]; [20; 10]; [20; 20].<br />
Como é ótimo para ca<strong>da</strong> um <strong>da</strong>r um lance igual a seu valor, a<br />
receita do leiloeiro é: R n = 2 = ¾ . 10 + ¼ . 20 = $ 12,5.<br />
Consi<strong>de</strong>re agora o caso <strong>de</strong> três competidores. Teremos 2 3 = 8<br />
possibili<strong>da</strong><strong>de</strong>s com probabili<strong>da</strong><strong>de</strong> 1/8 ca<strong>da</strong> uma: [10; 10; 10];<br />
[10; 10; 20]; [10; 20; 10]; [10; 20; 20]; [20; 10; 10]; [20; 10; 20];<br />
[20; 20; 10]; [20; 20; 20]. A receita do leiloeiro será nesse caso:<br />
R n = 3 = ½ . 10 + ½ . 20 = $ 15. Como R n = 3 > R n = 2 ⇒ a receita<br />
aumentou com o número <strong>de</strong> competidores. Note que o 3º<br />
competidor não tinha valoração maior que os dois anteriores.<br />
81
Equivalência <strong>de</strong> Receita<br />
Um resultado clássico <strong>da</strong> teoria <strong>de</strong> leilões é a equivalência<br />
<strong>de</strong> receita (revenue equivalence) entre diversos formatos<br />
se ca<strong>da</strong> “bid<strong>de</strong>r” segue a estratégia equilíbrio <strong>de</strong> Nash.<br />
Se os jogadores têm valores in<strong>de</strong>pen<strong>de</strong>ntes, são neutros ao<br />
risco, sem restrição orçamentária e usam estratég. simétricas,<br />
então to<strong>dos</strong> os formatos <strong>de</strong> leilão razoáveis (1 o lance, 2 o lance,<br />
inglês, holandês) levam a mesma receita espera<strong>da</strong> p/ o leiloeiro!<br />
Não significa que exista só um equilíbrio <strong>de</strong> Nash. No leilão<br />
selado <strong>de</strong> 1º lance, por ex., existem múltiplos equilíbrios, mas eles<br />
levam ao mesmo resultado esperado para o leiloeiro.<br />
No leilão <strong>de</strong> 1º lance o vencedor paga um preço menor do que sua<br />
avaliação, mas ganha o leilão quem atribui o maior valor ao bem.<br />
Esses resulta<strong>dos</strong> clássicos não valem em situações tais como o<br />
leilão <strong>de</strong> bem <strong>de</strong> valor comum; com jogadores avessos ao risco;<br />
em merca<strong>dos</strong> <strong>de</strong> múltiplos itens (exceto ven<strong>da</strong>s individuais), etc.<br />
Corolário: A receita espera<strong>da</strong> do ven<strong>de</strong>dor aumenta com o n o<br />
<strong>de</strong> compradores nos 4 formatos menciona<strong>dos</strong>.<br />
Equivalência <strong>de</strong> Receita: Exemplo<br />
Para ilustrar o conceito <strong>de</strong> equivalência <strong>de</strong> receita,<br />
seja um leilão <strong>de</strong> valor privado com apenas dois<br />
interessa<strong>dos</strong>, cujos valores priva<strong>dos</strong> são v 1<br />
e v 2<br />
.<br />
Os valores priva<strong>dos</strong> são conhecimento apenas <strong>de</strong> ca<strong>da</strong> um,<br />
mas é conhecimento comum que os valores priva<strong>dos</strong> têm<br />
distribuição <strong>de</strong> prob. uniforme entre os valores 0 e 1000.<br />
O objeto po<strong>de</strong> ser leiloado em leilão selado <strong>de</strong> 1º ou <strong>de</strong> 2º<br />
lance. Mostre que em equilíbrio (EBN), a receita espera<strong>da</strong><br />
do leiloeiro em ambos os leilões é <strong>de</strong> 1000/3.<br />
OBS: no caso do leilão <strong>de</strong> 1º lance consi<strong>de</strong>re apenas o EBN<br />
simétrico simples, i. é, bids com a mesma proporção do seu<br />
valor: b 1 = k v 1 e b 2 = k v 2 , on<strong>de</strong> a proporção k é a mesma.<br />
No leilão <strong>de</strong> 1º lance, o vencedor também é que <strong>de</strong>u o maior<br />
lance b i , mas paga o seu próprio lance (e não o 2º maior bid).<br />
Note que, para a distrib. uniforme entre 0 e 1000, a <strong>de</strong>nsi<strong>da</strong><strong>de</strong><br />
<strong>de</strong> probabili<strong>da</strong><strong>de</strong> é 1/1000 e a acumula<strong>da</strong> Prob[v < x] = x/1000.<br />
82
Equivalência <strong>de</strong> Receita: Leilão 2º Lance<br />
No caso do leilão <strong>de</strong> 2º lance, vimos que b i = v i éEBN.<br />
Nesse caso, a receita espera<strong>da</strong> do leiloeiro é o valor esperado<br />
do 2º maior lance. Provaremos que b i = v i é igual a 1000/3.<br />
Note que o valor esperado <strong>da</strong> segun<strong>da</strong> maior valoração,<br />
condicional a conhecer o valor v 1 é:<br />
Prob[v 2<br />
≥ v 1<br />
] v 1<br />
+ Prob[v 2<br />
Equivalência <strong>de</strong> Receita: Leilão 1º Lance<br />
Para calcular a receita do leiloeiro, proce<strong>de</strong>-se <strong>de</strong> forma<br />
similar a anterior. Temos duas distribuições (p/ v 1 e v 2 ):<br />
Primeiro se condiciona em relação a uma <strong>de</strong>las e <strong>de</strong>pois se<br />
consi<strong>de</strong>ra a outra. Antes iniciamos com valor esperado do bid,<br />
condicional a conhecer o valor v 1 (ficava uma função <strong>de</strong> v 1 ) e<br />
<strong>de</strong>pois integrava em relação aos possíveis valores <strong>de</strong> v 1 . Po<strong>de</strong>-se<br />
fazer <strong>da</strong> mesma forma ou invertendo a or<strong>de</strong>m. Vamos inverter<br />
essa or<strong>de</strong>m e iniciar por v 2 e <strong>de</strong>pois integrar em relação a v 2 :<br />
1000⎛<br />
v2<br />
⎞ 1<br />
∫0<br />
⎜Prob[v1 ≤ v<br />
2] + Prob[v1 > v<br />
2] E[b<br />
1<br />
| v1 > v<br />
2] dv<br />
2<br />
2<br />
⎟<br />
⎝<br />
⎠1000<br />
1000⎛<br />
v2 v2 ⎛ v2 ⎞⎛ v2<br />
+ 1000 ⎞⎞<br />
1 1000<br />
= ∫ ⎜ + 1 dv<br />
0<br />
2<br />
=<br />
1000 2<br />
⎜ −<br />
1000<br />
⎟⎜ ⎟<br />
2×<br />
2<br />
⎟<br />
<br />
⎝ ⎝ ⎠⎝ ⎠⎠1000 3<br />
A explicação é similar ao caso anterior (leilão <strong>de</strong> 2º lance), mas<br />
usando o fato <strong>de</strong> que já foi mostrado que o ENB é jogar a meta<strong>de</strong> <strong>da</strong><br />
sua valoração (por isso apareceu v 2 /2 quando o jog. 2 ganha). Note<br />
que se v 1 > v 2 , então v 1 é um número equiprovável entre v 2 e 1000,<br />
cuja média é (v 2 +1000)/2. Como o EBN é v 1 /2, então fica (v 2 +1000)/4.<br />
Leilão Selado <strong>de</strong> Primeiro Lance<br />
No leilão selado <strong>de</strong> primeiro lance, o maior bid b 1 éo<br />
vencedor do leilão, recebe o bem e paga seu bid b 1 .<br />
Para o jogador i, com valor privado x, seu payoff π i é:<br />
π i = x − b i se b i > max j ≠ i b j ; ou π i = 0 se b i < max j ≠ i b j<br />
As estratégias <strong>dos</strong> jogadores são os valores <strong>de</strong> bid que<br />
são funções <strong>dos</strong> tipos, b i (θ). Consi<strong>de</strong>re apenas estratégias<br />
simétricas <strong>de</strong> equilíbrio, i. é, to<strong>dos</strong> os jogadores jogam a<br />
mesma função <strong>de</strong> seu tipo, b i (θ) = b j (θ) = b(θ).<br />
Proposição: O único equilíbrio em estratégias simétricas<br />
(EBN) num leilão <strong>de</strong> primeiro lance é (p/ to<strong>dos</strong> jogad.):<br />
b(v) = E[v 2 | v 2 < v] = E[segundo maior tipo | maior tipo = v]<br />
On<strong>de</strong> v 2 é o maior valor <strong>dos</strong> outros N − 1 valores in<strong>de</strong>pen<strong>de</strong>ntes.<br />
Ex.: Valores v com distribuição uniforme [0, 1] tem a solução para o<br />
bid do EBN: b(v) = [(N − 1)/N] v. Demonstração a seguir.<br />
84
Leilão Selado <strong>de</strong> 1º Lance: Exemplo<br />
Para ver o último resultado, seguirei McMillan (1992).<br />
Seja o valor privado do jogador 1, v 1 . Então:<br />
b 1 = k v 1 e b j = k v j para j = 2, 3, ... N.<br />
O jogador 1 ganha o leilão se v j ≤ b 1 /k, para todo j = 2, 3, ... N.<br />
Como as valorações são in<strong>de</strong>pen<strong>de</strong>ntes, a probab. <strong>de</strong> vitória é:<br />
Pr[v 2 ≤ b 1 /k, v 3 ≤ b 1 /k, ..., v N ≤ b 1 /k] = Pr[v 2 ≤ b 1 /k] x Pr[v 3 ≤<br />
b 1 /k] ... x Pr[v N ≤ b 1 /k].<br />
Como as distribuições são uniformes [0, 1], Pr[v j ≤ b 1 /k] = b 1 /k.<br />
Assim, a expressão anterior fica:<br />
Pr[v 2 ≤ b 1 /k, v 3 ≤ b 1 /k, ..., v N ≤ b 1 /k] = (b 1 /k) N – 1 . O payoff<br />
esperado do jogador 1 é: (v 1 –b 1 )(b 1 /k) N – 1 .<br />
O jogador 1 quer maximizar o payoff esperado escolhendo b 1 .<br />
Logo, usaremos a CPO (<strong>de</strong>riva o payoff esperado e iguala a 0):<br />
0 = [v 1 (N – 1) (b 1 ) N – 2 /k N – 1 ] – [N (b 1 /k) N – 1 ] ⇒ b 1 = v 1 (N – 1)/N □<br />
Ou seja, o k ótimo para o equilíbrio simétrico é (N – 1)/N.<br />
Note que se N → ∞ ⇒ b 1 (v) → v. Maior competição, maior receita.<br />
85