Teoria dos Jogos - IAG - A Escola de NegÃ³cios da PUC-Rio

Teoria dos Jogos - IAG - A Escola de NegÃ³cios da PUC-Rio Teoria dos Jogos - IAG - A Escola de NegÃ³cios da PUC-Rio

from iag.puc.rio.br More from this publisher

14.11.2014 Views

Opções Reais: Teoria e Prática de Análise de Investimentos sob Incertezas Análise Estratégica de Investimentos com Teoria dos Jogos Marco Antonio Guimarães Dias, Professor Adjunto, tempo parcial Rio de Janeiro, Outubro de 2009 . Bibliografia Livros-texto (cobrem apenas parte da matéria): Parte de teoria dos jogos: MWG = Mas-Colell, A. & M.D. Whinston & J.R. Green (1995): “Microeconomic Theory” (espec. caps. 7 a 9); OR e Jogos de OR: DP = Dixit & Pindyck (1994): “Investment under Uncertainty” (dinâmica da indústria e jogos de OR: caps. 8 e 9). Bibliografia complementar que mais uso em teoria dos jogos: Dutta, P.K. (1999): “Strategies and Games”. MIT Press. Gibbons, R. (1992): "Game Theory for Applied Economists". Osborne, M.J. (2004): “An Introduction to Game Theory”. Fudenberg, D. & J. Tirole (1991): “Game Theory”. MIT Press Shy, O. (1995): “Industrial Organization – Theory and Applications”. Menezes, F.M. & P. K. Monteiro (2005): "An Introduction to Auction Theory". Bibliografia complementar que mais uso em jogos de OR: Huisman, K.J.M. (2001): “Technology Investment: A Game Theoretic Real Options Approach”. Smit, H.T.J. & L. Trigeorgis (2004): “Strategic Investment – Real Options and Games”. 1

Opções Reais: Teoria e Prática de Análise de

Investimentos sob Incertezas

Análise Estratégica de

Investimentos com Teoria dos Jogos

Marco Antonio Guimarães Dias,

Professor Adjunto, tempo parcial

Rio de Janeiro, Outubro de 2009 .

Bibliografia

Livros-texto (cobrem apenas parte da matéria):

Parte de teoria dos jogos: MWG = Mas-Colell, A. & M.D. Whinston

& J.R. Green (1995): “Microeconomic Theory” (espec. caps. 7 a 9);

OR e Jogos de OR: DP = Dixit & Pindyck (1994): “Investment under

Uncertainty” (dinâmica da indústria e jogos de OR: caps. 8 e 9).

Bibliografia complementar que mais uso em teoria dos jogos:

Dutta, P.K. (1999): “Strategies and Games”. MIT Press.

Gibbons, R. (1992): "Game Theory for Applied Economists".

Osborne, M.J. (2004): “An Introduction to Game Theory”.

Fudenberg, D. & J. Tirole (1991): “Game Theory”. MIT Press

Shy, O. (1995): “Industrial Organization – Theory and Applications”.

Menezes, F.M. & P. K. Monteiro (2005): "An Introduction to Auction Theory".

Bibliografia complementar que mais uso em jogos de OR:

Huisman, K.J.M. (2001): “Technology Investment: A Game

Theoretic Real Options Approach”.

Smit, H.T.J. & L. Trigeorgis (2004): “Strategic Investment – Real

Options and Games”.

O Que É a Teoria dos Jogos?

A teoria dos jogos modela decisões interdependentes

entre agentes que se interagem (conflito ou cooperação).

Os agentes podem ser firmas, instituições, coalizões de

firmas ou pessoas, países, pessoas, animais irracionais, etc.

O escopo de teoria dos jogos é bem amplo, sendo usado

em vários ramos das ciências sociais, como economia,

mas também ciências biológicas (conflito de animais).

Tem livros só com foco em biologia, em direito, finanças, etc.

Sendo nosso foco em economia/finanças, vamos discutir

a interação estratégica racional entre firmas ou pessoas.

Não basta pensar qual a melhor decisão para você, é necessário

considerar o que os outros agentes podem fazer e também que

eles estão antecipando o que você pode fazer otimamente.

É necessário “calçar os sapatos do outro jogador”, i. é, se colocar no

lugar do outro, ver suas alternativas e ver o que ele sabe sobre você.

Nossa ênfase será mais normativa, i. é, como o jogo deve ser jogado.

Mercado em Competição Perfeita

Num mercado em competição perfeita todas as firmas

são (ou se comportam como) tomadoras de preço e

produzem um mesmo bem homogêneo (commodity).

As firmas não “exergam” uma curva de demanda para

maximizar o lucro ajustando quantidades. Podem produzir

qualquer quantidade que o preço será o mesmo.

Para a firma a curva de demanda (q x P) é uma reta horizontal e a

elasticidade da demanda (η) é infinito. O mercado tudo absorve.

As firmas não podem ajustar preços para maximizar o lucro, pois

a firma nada venderia com um preço maior e um preço menor

seria sub-ótimo, já que reduziria seu lucro (ou geraria prejuízo).

Já a indústria “enxerga” uma curva da

demanda Q(P) ou gráfico Q x P.

É + usada a função demanda inversa P(Q).

O preço de equilíbrio num certo instante t

é dado pela interseção das curvas de

demanda x suprimento da indústria:

P

P E

Equilíbrio S

E

D

Q E

Q

Mercado em Competição Perfeita

Além disso, não é permitido as firmas entrar em colusão

p/ maximizar o lucro ajustando o nível de produção Q.

O conceito de indústria em competição perfeita independe

do número de firmas, pode ocorrer até com só 1 firma.

O resultado do duopólio de Bertrand equivale a comp. perfeita.

Mas dinamicamente uma indústria converge da competição

imperfeita para a perfeita, na maioria dos casos, apenas quando

o número de firmas cresce p/ uma grande quantidade de firmas.

O resultado clássico (Marshall) mais importante p/ nós é:

Em competição perfeita, com livre entrada de firmas, o preço

em equilíbrio é tal que o VPL da firma entrante é zero.

O mercado em equilíbrio com preço P, é condicional ao

estado da demanda e da oferta da indústria no tempo t.

Depois, essa teoria microeconômica clássica será estendida p/

um modelo dinâmico de competição perfeita. As curvas de

oferta e demanda oscilam e logo o preço será estocástico.

Estruturas de Competição num Mercado

VPL entrar = 0 Tipo de Competição

VPL entrar ≥ 0

Perfeita

‣ Firma tomadora de preço;

‣ Decisão: quantidade a produzir.

Oligopólio

‣ Idem duopólio.

Duopólio

‣ Firma tem demanda residual;

‣ Decisão: quantidade ou preço.

Imperfeita

Monopólio

‣ Firma vê curva de demanda;

‣ Decisão: quantidade ou preço.

Não-Cooperativo

Cooperativo

Estático

‣ Colusão: tácita ou coordenada.

Dinâmico

Seqüencial

‣ Modelos de líder-seguidor;

‣ Decisão: quantidade ou preço.

Adaptado de “Industrial

Organization”, O. Shy (1995)

Simultâneo

Bertrand

‣Decisão: preço

Jogos Repetidos

Cournot

‣Decisão: quantidade

T. Schelling e o Pensamento Estratégico

O raciocínio estratégico da T.J. é bem ilustrado a seguir:

Prêmio Nobel de 2005, T. Schelling se diz só um usuário

da teoria dos jogos, mas ele deu várias contribuições:

A obra clássica de Thomas Schelling, “Estratégia do Conflito”

(1960) deu muita intuição sobre conflitos tais como a guerra

fria, assim como em outras situações de conflito e cooperação.

O conceito de “commitment” crível: atitudes aparentemente

irracionais de eliminar opções para deixar claro o compromisso

de que ele irá seguir um caminho, criando uma ameaça crível.

Ex.: caso do conquistador espanhol Cortés, que queimava os

próprios navios para deixar claro ao seu pessoal e ao inimigo que

a opção de recuar seria impossível. Outro ex.: queimar pontes.

Coordenação tácita com o conceito de ponto focal.

Ex.: um casal marca encontro em New York ao meio-dia, mas

não especifica o local. Pontos focais: Empire State e Penn Station.

Deu contribuições à teoria de barganha (1956), especialmente a

discussão de ameaças críveis e não-críveis (citei na minha tese).

OR e Jogos: Teorias Complementares

Em jogos de opções reais, o problema de maximização de

valor da firma que analisa um investimento, deve

considerar a presença de outras firmas como jogadores:

Os “players” reagem otimamente aos processos estocásticos

relevantes (exógeno) e às ações das outras firmas (endógeno).

Onde “endógeno” significa que depende do nosso controle ótimo

e “exógeno” não depende (entra como restrição na otimização).

A teoria dos jogos é necessária e entra nas condições de contorno

(principalmente), com considerações sobre o equilíbrio do jogo.

As teorias dos jogos e de OR são teorias complementares:

A teoria dos jogos tradicional sozinha ignora os avanços da

teoria de finanças sobre risco-retorno e sobre o valor da

flexibilidade gerencial sob incerteza (ignora as opções reais).

A teoria das opções reais (OR) tradicional sozinha ignora o

fato que o exercício de opções pelas outras firmas pode alterar

o valor da sua opção real (ignora a interação estratégica).

Conceitos de equilíbrio sob incerteza com opções são requeridos.

Conceitos Básicos de Teoria dos Jogos

Um jogo pode ser cooperativo ou não-cooperativo:

Num jogo cooperativo é permitido aos jogadores fazerem

acordos entre si (um contrato, “acordo de cavalheiros”, etc.)

Nos jogos não-cooperativos não são permitidos acordos.

Jogos não-cooperativos são mais adequados para modelar a

competição e a evolução do mercado (microeconomia).

Jogos cooperativos são mais adequados p/ modelar barganha,

contratos, a firma, acordos sociais, acordos internacionais...

Jogos cooperativos são usados para modelar a firma, por ex.

Jogos não-cooperativos usam conceitos de equilíbrio para

prever o resultado de um jogo (em geral não são Pareto ótimo).

Jogos cooperativos geralmente usam axiomas para estabelecer

regras de como se deve jogar. Busca-se o Pareto ótimo.

Enfocaremos quase que só os jogos não-cooperativos por

serem muito mais usados em economia e finanças (em

especial a competição) do que os jogos cooperativos.

Conceitos Básicos de Teoria dos Jogos

Os jogos podem ser classificados como jogos de somafixa

e jogos de soma variável (esses são mais relevantes).

Regras do jogo (não-cooperativo, se não especificado):

Os lances dos jogadores são simultâneos ou alternados?

Quem joga e quando?

O que cada jogador sabe (conjunto de informação) na sua vez

de jogar? O que os outros jogadores sabem nesse instante?

Quais as ações e planos (estratégias) possíveis?

Resultados e payoffs: para cada conjunto de estratégias,

qual é o resultado do jogo? Quanto vale esse resultado?

Na teoria dos jogos tradicional, que em muitos casos analisa as

decisões de indivíduos, usa-se a função utilidade esperada.

Para firmas, a moderna teoria de finanças recomenda usar

valores de mercado ou valores de opções reais (ativos reais).

Nos jogos de opções reais os payoffs são valores de opções reais.

Teoria dos Jogos: Origens e Conceitos

A moderna teoria dos jogos começa com Nash em 1950’s

O chamado equilíbrio de Nash é o conceito mais importante e

mais aceito da teoria dos jogos não-cooperativos.

É a base de outros equilíbrios (perfeito, Bayesiano, etc.)

Nash também formulou a mais importante solução em jogos

cooperativos: a solução de Nash para jogos de barganha.

Conceitos antigos como o minimax e maximin (ver anexo), vem

perdendo o interesse na literatura econômica.

Algumas definições básicas de teoria dos jogos.

Defini-se estratégia s i do jogador i como uma regra de decisão

ou plano contingente completo que descreve as ações a serem

tomadas em cada possível evolução do jogo onde o jogador i é

chamado a jogar. Se a estratégia for determinística, é chamada

de estratégia pura, se probabilística é chamada estratégia mista.

As estratégias dos outros jogadores são denotadas por s − i .

Um jogo é descrito especificando os jogadores, as regras, os

possíveis resultados e os valores (“payoffs”) desses resultados.

Representação Formal dos Jogos

Os jogos não-cooperativos podem ser formalizados e

apresentados em dois formatos (a serem detalhados):

Na forma normal (ou estratégica), denotada por Γ N , com uma

representação por matrizes para os payoffs dos jogadores;

Na forma extensiva, denotada por Γ E , com uma árvore de jogos.

Árvore de jogos éuma árvore de decisão generalizada para

múltiplos decisores (os jogadores).

Os jogos cooperativos precisam de um terceiro formato:

É preciso considerar a possibilidade de coalizões, isto é, subconjuntos

dos N jogadores. Existem 2 N − 1 coalizões possíveis.

As coalizões S ⊆ N jogam entre si diferentes tipos de jogos e

internamente possuem uma regra de divisão do payoff ganho.

A forma coalizão, denotada por Γ C , através da definição do par

{N; C} no jogo de N jogadores e com função característica C(S).

A função característica C(S) representa as possibilidades de

cooperação para a coalizão S. É a utilidade total da coalização S

(ou riqueza ou poder de S) a ser transferida aos seus membros.

ExemplonaForma Normal ouEstratégica

Exemplo: jogo do par ou ímpar com disputa de 1 R$

Estratégias puras

para o jog. 1

Jogador 2

(ímpar)

par ímpar

Estratégias puras

para o jog. 2

par

Jogador 1

(par)

ímpar

1; 0 0; 1

0; 1 1; 0

Payoff do jog. 1 Payoff do jog. 2

Veremos que o único equilíbrio do jogo do par ou ímpar é o

equilíbrio probabilístico ou em estratégias mistas: cada jogador

joga “par” com 50% de chance e “ímpar”com 50% chances.

Dado um conjunto de estratégias puras S i

, uma estratégia mista para

um jogador i é uma função σ i

: S i

→ [0, 1], que assinala a cada estratégia

pura s i

∈ S i

, uma probabilidade σ i

(s i

) ≥ 0. A soma dos σ p/ todos s i é= 1.

Jogo do Par ou Ímpar na Forma Extensiva

A forma extensiva é mais usada para jogos dinâmicos e com

lances seqüenciais. Mas pode ser usada também p/ jogos

com lances simultâneos, como no jogo do par ou ímpar:

par

Jogador 1

ímpar

Jogador 2

par ímpar par ímpar

Elipse significa que o

jog. 2 não sabe em qual

dos dois nós ele está.

(usa-se tb. reta tracejada)

Convenção payoff:

jog. 1 pediu par

jog. 2 pediu ímpar

(1; 0) (0; 1) (0; 1) (1; 0)

Nos jogos simultâneos ou de informação imperfeita, usa-se uma

elipse circundando os nós do mesmo conjunto de informação.

Se o jogo fosse de lances alternados, o jogador 2 saberia em

que nó ele estaria e poderia ganhar $1 com a melhor resposta.

Jogos Dinâmicos de Opção

Jogos dinâmicos envolvem seqüências de ações.

Constitui a maioria dos jogos de opções reais.

Ex.: jogo de opção real com duas firmas. Elas decidem

de forma seqüencial se exercem (E) ou não exercem (NE)

uma opção de entrar. Os payoffs são valores de opções.

D i = valor em duopólio da firma i e M i = valor em monopólio de i.

E

(D 1 ; D 2 ) (M 1 ; 0)

Firma 1

Firma 2

NE E

NE

(0; M 2 )

NE

Note que na forma normal

não se poderia capturar a

dinâmica do jogo. Por isso é

necessária a forma extensiva.

Aqui o jogo é de informação

perfeita, pois a firma 2 decide

sabendo o lance jogado pela

firma 1.

(0; 0)

Conceitos Básicos de Teoria dos Jogos

Um jogo é dito de informação perfeita se cada conjunto

de informação só contém um nó de decisão da árvore.

Caso contrário é dito de informação imperfeita. Ex.: pôquer.

Já o jogo de xadrêz é exemplo de jogo de informação perfeita.

Algumas premissas usuais em teoria dos jogos:

O jogo é assumido ser de memória perfeita (“perfect recall”), i.

é, uma jogadora nunca esquece a informação que sabia antes

de chegar até aquele estágio do jogo.

Também se assume conhecimento comum (“common

knowledge”), i. é, cada jogador conhece a estrutura do jogo

(inclusive os valores) e sabem que os outros também conhecem,

que sabem que os outros sabem que eles conhecem, etc.

Um perfil de estratégias puras de um jogo com J jogadores

é um vetor s = (s 1

, s 2

, … s J

) em que s i

é escolhida pelo

jogador i. Pode ser escrito como (s i

, s − i

) para ressaltar o

ponto de vista de i em relação aos outros J – 1 jogadores.

Estratégia Dominante e o Dilema dos Prisioneiros

Estratégia dominante é uma estratégia que é ótima para

um jogador independentemente da(s) estratégia(s)

escolhida(s) pelo(s) outro(s) jogador(es) (s − i ).

Equilíbrio com estratégias dominantes é quando cada jogador

possui e joga a sua estratégia dominante. Ex. clássico a seguir.

O dilema dos prisioneiros é um jogo clássico que ilustra a

não-cooperação como equilíbrio com estratégia dominante.

Dois ladrões são presos e colocados em salas separadas. Para cada

ladrão, o detetive propõe que ele confesse o crime e sirva de

testemunha contra o outro. Se um dos ladrões confessar o crime e o

outro não, aquele que confessou será posto em liberdade e o outro

cumprirá pena de 10 anos. Se os dois confessarem, ambos ficarão

presos por 3 anos. Se nenhum dos dois confessarem, a penalidade

será de apenas um ano. Qual o resultado mais provável do jogo?

Note que se eles pudessem se comunicar e fazer acordos críveis de

serem cumpridos, a estratégia cooperativa (não-confessar) seria a

melhor para ambos. Sem acordo, só há o incentivo de trair o outro.

O Jogo Dilema dos Prisioneiros

Os payoffs são “anos de cadeia” com sinal negativo.

Assim, valores mais próximos de zero são os preferíveis.

confessa

(não-coopera)

Prisioneiro 2

não confessa

(coopera)

Prisioneiro 1

confessa

(não-coopera)

não confessa

(coopera)

−3; −3 0; −10

−10; 0 −1; −1

O equilíbrio é em estratégias dominantes (um caso

particular de equilíbrio de Nash) e é muito comum em

várias situações sociais (ex.: a tragédia dos comuns).

Dilema dos Prisioneiros: O Jogo da Propaganda

Um exemplo de dilema dos prisioneiros na área de

decisão de investimentos é o jogo da propaganda.

Cenário: Duas firmas concorrentes, Firma 1 e Firma 2,

têm de decidir quanto gastar em propaganda.

Estratégias: muita propaganda, pouca propaganda.

Os resultados são mostradas abaixo:

Jogador 2

muita pouca

Jogador 1

muita

pouca

4; 4

10; 1

1; 10 6; 6

Equilíbrio em estratégias dominantes: Nesse jogo, ambas as firmas têm a

mesma estratégia dominante. Dessa forma, o resultado do jogo é (4; 4).

Dilema dos prisioneiros: o equilíbrio não é Pareto ótimo, não éo resultado

que os jogadores escolheriam se eles pudessem cooperar de forma crível.

Dilema dos Prisioneiros: História e Relevância

O dilema dos prisioneiros é talvez o jogo mais conhecido

porque é uma situação que se repete muito em

economia, política e em outros ramos de conhecimento.

Apesar de existir ganhos de cooperação, cada jogador tem um

incentivo de não-cooperar para qualquer estratégia do outro.

Um ex. em política é a corrida nuclear: apesar de construir

bombas ser caro, muitos países querem evitar a pior situação

(menor payoff) que seria o outro país ter a bomba e ele não ter.

Outro exemplo é a chamada “Tragédia dos Comuns”, um caso

clássico de sociologia, em que apesar da cooperação gerar

benefícios, frequentemente ela não ocorre. Ver slides do anexo.

O esquema dilema dos prisioneiros surgiu em jan/1950

quando os profs. M. Dresher e M. Flood usaram ele para

criticar o então novo conceito de equilíbrio de Nash (EN).

Veremos que o resultado desse jogo é um caso particular de EN

A estória original é de A. Tucker (1950), orientador de Nash.

O Jogo do Aquecimento Global

Outra aplicação do dilema dos prisioneiros é o drama do

aquecimento global. A cooperação (redução de emissões) é

melhor para todos, mas os países não reduzem as emissões.

No discurso, todos dizem que é “urgente” impedir o aquecimento

global, mas poucos realmente se comprometem com isso.

Na prática o que eles dizem é que é urgente que todos os países,

exceto o deles, reduzam as emissões.

Ou seja, querem ter o benefício da redução de emissões, sem ter o

custo de reduzir o crescimento econômico do seu país.

Com a maioria dos países se comportando segundo os seus próprios

interesses, o resultado deve ser o desastre ambiental, embora seja

Pareto ótimo a cooperação. É o dilema dos prisioneiros.

Ver no material o artigo traduzido do The Economist: “Quem

perde e quem ganha no jogo do clima?”

Esse problema gerado pelo dilema dos prisioneiros pode

ser solucionado com jogos repetidos (a ser visto) e com a

introdução de estratégias de punição e recompensa.

Estratégia de Melhor Resposta

Seja V i

(σ i

, σ − i

) o valor da estratégia mista σ i

para o

jogador i quando os demais jogam as estratégias mistas

σ − i

. A estratégia σ i

éa melhor resposta de i para o perfil

σ − i

de J – 1 estratégias mistas dos outros jogadores se:

V i

(σ i

, σ − i

) ≥ V i

(σ i

’, σ − i

) , para qualquer σ i

’ ∈ ∆(S i

)

∆(S i

) é o conjunto simplex do conjunto das estratégias

puras S i

. O simplex é uma extensão do conjunto de

estratégias puras S i

que assinala probabilidades a todas

as M estratégias puras disponíveis para o jogador i.

A definição de estratégia pura de melhor resposta é similar.

A estratégia pura pode ser vista como uma estratégia mista

degenerada (prob. = 1 p/ uma estratégia e zero para as demais)

O conceito de melhor resposta é importante, pois será

visto que o equilíbrio de Nash pode ser visto como um

ponto fixo de estratégias de melhor resposta simultânea.

Equilíbrio de Nash (1950)

O perfil de estratégias s = (s 1

, s 2

, … s J

) é um equilíbrio de

Nash (EN) em estratégias puras de um jogo se, para todo

jogador i = 1, 2, …, J, vale a desigualdade:

V i

(s i

, s − i

) ≥ V i

(s i

’, s − i

) , para qualquer s i

’ ∈ S i

O EN implica que as estratégias que fazem parte desse

equilíbrio são simultaneamente as melhores respostas para

todos os jogadores. Esse é um resultado fundamental.

Dessa forma, não há incentivo para nenhum jogador desviar

desse equilíbrio, unilateralmente. Ex.: dilema dos prisioneiros.

Para saber se é equilíbrio de Nash, basta fazer a seguinte

pergunta a cada jogador separadamente: mudando a sua

estratégia você ficaria melhor (aumentaria V i

)? Se as respostas

de todos os jogadores forem negativas, então é um EN.

A definição de EN para estratégias mistas é similar à apresentada.

Para se testar se o perfil σ é EN, basta testar desvios de σ para as

estratégias puras s. Se não houver incentivo para desviar, σ éEN.

Eq. de Nash: Competição Internacional

Embraer x Bombadier no mercado de jatos executivos

Suponha que sem subsídios para a Bombadier, a matriz

de payoffs para a fabricação de um novo modelo de jato é:

Desenvolve

Bombadier

Não Desenvolve

Embraer

Desenvolve

−10; −10 100; 0

Não Desenvolve

0 ; 100 0; 0

Ou seja, dois EN em estratégias puras (e um EN em

estratégias mistas). Na prática, existem os riscos de ambos

desenvolverem o jato e terem prejuízo, ou não investirem.

Mercado de Jatos Executivos com Subsídios

Agora suponha que o governo do Canadá dá $ 20 de

subsídio para a Bombadier para desenvolver jatos

executivos (ex.: taxas de juros abaixo do mercado).

A nova matriz de payoffs mostra a mudança do EN:

Desenvolve

Bombadier

Não Desenvolve

Embraer

Desenvolve

−10; +10 100; 0

Não Desenvolve

0; 120 0; 0

Ou seja, o subsídio fez com que a estratégia investir (desenvolver

o projeto de jato executivo) se tornasse estratégia dominante para

a Bombadier. O único EN é a Bombadier sozinha no mercado.

Jogos Repetidos: Cooperação é Possível

No dilema dos prisioneiros vimos que não é equilíbrio

{cooperar; cooperar}, mesmo sendo Pareto dominante.

No entanto, foi assumido que o jogo é jogado apenas uma vez.

Existem casos em que o jogo pode ser repetido pelas

firmas e o resultado {cooperar; cooperar} pode ser EN.

Com a repetição, cada firma pode criar reputação sobre o seu

comportamento e aprender sobre o comportamento dos rivais.

Ocorre no caso de poucas firmas, com demanda e custos estáveis.

Estudos experimentais tais como “torneios de repetidos

dilema de prisioneiros”, mostra que a estratégia “tit-fortat”

(retribuição/retaliação) pode sustentar a cooperação

Tit-for tat: estratégia é cooperar no instante inicial e continuar

cooperando enquanto o outro coopera. Retaliar (não cooperar)

se o outro não-coopera. Voltar a cooperar se o outro o fizer.

Teoremas populares (“folk theorems”) para jogos repetidos

infinitamente, mostram que a cooperação pode ser EN.

Equilíbrio de Nash (EN): Notas

O conceito de equilíbrio de Nash (EN) pode ser

intepretado e usado de várias maneiras:

Normativo: aconselhar todos os jogadores. O conselho tem de

ser equilíbrio no sentido de ter relativa estabilidade, não sendo

ótimo para um jogador ganhar mais ao não seguir o conselho.

EN é melhor resposta simultânea e não há incentivo em desviar.

Predição: Num processo dinâmico de ajustes, o EN pode ser

interpretado como um ponto estável. Muito usado em biologia.

Sustentabilidade: é um acordo “self-enforcing” (de autocumprimento),

pois não precisa de ajuda externa para manter

ao ser do próprio interesse de cada jogador seguir o EN.

O conceito de EN ajudou a deixar claro a distinção entre

jogos não-cooperativos e jogos cooperativos:

Em jogos cooperativos há acordos que podem ser forçados (em

tribunais, contratos, etc.) Em jogos não-cooperativos nãohátais

mecanismos ⇒ só resultados de equilíbrios são sustentáveis.

Eq. de Nash: Exercício & Experimento

Esse exercício é interessante como um experimento que

pode ser feito em sala de aula, mas que você pode fazer

numa roda de amigos(as) e/ou familiares.

Ilustra a necessidade do pensamento estratégico para tomada de

decisão. Ou seja, tem de pensar no que os outros farão, etc.

Peça para cada participante escrever o seu nome e um

número entre zero e 100 numa folha de papel.

Informe antes que o ganhador do jogo será aquele que

escrever o número mais próximo da metade da média

dos números escritos.

Após a primeira rodada, conhecido o vencedor e o valor

médio, peça a todos que joguem novamente o jogo.

O que ocorreu com a média e o lance vencedor, dado a “lição”

obtida com o resultado da primeira vez que foi jogado?

Determine o equilíbrio de Nash (EN) desse jogo.

Jogo “Assurance” ou “Stag-Hunt”

O jogo Stag-Hunt e suas variantes, também conhecidas

como “assurance game” (jogo da garantia) ou jogo de

coordenação ou dilema da confiança, tem sido usado

para modelar conflitos sociais (ex.: livro de Brian, 2004,

“Stag Hunt and Evolution of Social Structure”).

Mostra o dilema entre a segurança x cooperação social.

Estória (Rousseau): dois caçadores podem caçar uma lebre

(hare) ou um cervo adulto (stag). A lebre pode ser caçada por

uma só pessoa, mas o cervo necessita dos dois (cooperação).

Jogo tem dois EN em estratégias puras (e um em est. mistas),

sendo um risco dominante e outro payoff dominante. Ex.:

Caçador 2

Cervo Lebre

Cervo 4 ; 4 0 ; 3

Caçador 1

Lebre 3 ; 0 3 ; 3

Software Para Jogos na Forma Normal

Um dos programas disponíveis na internet para resolver

jogos na forma normal é um applet Java que fica em:

http://www.gametheory.net/Mike/applets/NormalForm/NormalForm.html

Existe também uma versão em português (link na pág. acima).

O applet acha os equilíbrios para jogos de 2 jogadoras com até

4 estratégias puras (matrizes até 4 x 4) e estratégias mistas só

para o caso de matriz 2 x 2. Ver abaixo o ex. batalha dos sexos.

Ele permite carregar alguns exemplos clássicos já prontos:

Software Mais Geral de Teoria dos Jogos

O software Gambit é um software mais geral que

resolve jogos na forma normal e na forma extensiva.

Mesmo na forma normal, permite mais de dois jogadores

e é menos limitado que o anterior. Escrito em C++, tem

interface amigável para Windows. Última versão jan/2007.

Webpage do Gambit: http://gambit.sourceforge.net/

Inclui links para download e documentação (com arquivos

de exemplos). Exs. de janelas (formas normal e extensiva):

Preços e Curva de Demanda Inversa

A curva de demanda de um produto relaciona preços com a demanda.

Preço mais baixo tem maior demanda e preço alto tem menor demanda.

No duopólio, as firmas têm como dado uma função demanda

inversa p = f(Q T ): o preço do produto é função da produção da

indústria Q T = q 1 + q 2 . As estratégias das firmas são q 1 e q 2 .

Ver os gráficos das curvas de demanda exponencial e linear (planilha).

Nas figuras aparecem duas curvas de demanda, uma delas elevada

refletindo uma economia aquecida (vermelha) e a outra mais baixa,

refletindo um desaquecimento do consumo (curva azul).

Competição por Quantidades em Duopólio

Duas firmas dividem um mercado geográfico de um produto.

Equilíbrio de Cournot (1838): simultaneamente e de forma

independente os jogadores escolhem as quantidades, e o

preço é tal que o total ofertado é igual a demanda.

Veremos que o resultado de Cournot é um EN único para esse jogo

em que as estratégias são quantidades escolhidas simultaneamente.

Curva de reação de Cournot: especifica a produção ótima de uma

firma em função das possíveis produções da outra firma.

Equilíbrio de Stackelberg: sequencialmente, em dois estágios,

uma firma (líder) estabelece sua produção e depois a outra firma

(seguidor), observando o líder, estabelece a sua própria produção.

A produção e o lucro no modelo de Stackelberg são maiores para o

líder e menores para o seguidor (vantagem de jogar primeiro). O

líder maximiza o lucro dado a curva de reação do seguidor.

Iremos ver depois que esse resultado é um EN perfeito em subjogos

para o jogo seqüencial em que as estratégias são quantidades. Mas

ele tem problemas de inconsistência temporal: não é EN se o jogo

continuar após a entrada do seguidor (há incentivo p/ desviar).

Monopólio com Demanda Linear

Dada a relação 1-1 entre preço e quantidade estabelecida

na curva de demanda, um monopolista pode escolher ou

preço ou quantidade a produzir, mas não ambas.

O monopolista irá maximizar o lucro seja usando o preço

ou usando a quantidade como variável de controle.

Seja uma curva de demanda linear (a mais usada) dada

por p = a – b Q. Assuma que o custo fixo do monopolista

é zero e o custo variável é c. O lucro do monopolista é:

π M = p Q – c Q ⇒ π M = (a – b Q) Q – c Q = (a –c) Q –b Q 2 .

Para maximizar o lucro usa-se a condição de 1ª ordem

(CPO): ∂π M /∂Q = 0 (checar a de 2ª ordem: ∂ 2 π M /∂Q 2 < 0).

Os valores obtidos (quantidade, preço e lucro, respectiv.) são:

q

M

a−

c

2b

= pM

a+

c

=

2

π

M

(a − c)

=

4b

2

Duopólio em Quantidades de Cournot

No problema da escolha ótima de quantidade q i , a(s)

firma(s) resolvem problemas de maximização de lucro π i .

Para maximizar o lucro usa-se a condição de 1ª ordem

(CPO): ∂π i /∂q i = 0 (checar a de 2ª ordem: ∂ 2 π i /∂q i2 < 0).

No caso do duopólio, o equilíbrio de Nash-Cournot é

obtido com ambas as firmas escolhendo as quantidades

que maximizam o lucro, considerando no problema de

otimização que a firma rival estará fazendo o mesmo.

Pois o EN é a melhor resposta simultânea (não há incentivo

para nenhum jogador desviar se estiver sendo jogado o EN) e é

assumido conhecimento comum (a firma sabe que a outra ...).

Melhor resposta simultânea: curvas de melhor resposta se cruzam.

Se o custo operacional (fixo + variável) de cada firma é

C i (q i ) e a função demanda é p(Q T ), as funções lucros são:

π 1 = q 1 p(Q T ) − C 1 (q 1 ) e π 2 = q 2 p(Q T ) − C 2 (q 2 )

Duopólio em Equilíbrio de Nash-Cournot

Seja uma curva inversa de demanda linear (por ser mais

simples, é a mais usada), onde os preços são dados por:

p(Q T

) = a − b Q T

⇒ p(Q T

) = a − b (q 1

+ q 2

) ,

com q 1 ≥ 0 ; q 2 ≥ 0 ; e a e b tal que p > 0

Se o custo fixo é zero, a função lucro da firma i (1 ou 2) é:

π i = q i a − q i b (q 1 + q 2 ) − c i q i = q i (a − c i ) − q i b (q 1 + q 2 )

Onde c i é chamado de custo operacional variável da firma i.

A curva de reação ou curva de melhor resposta da firma i

(i = 1; 2) em relação a produção da firma j (j ≠ i), q i *(q j ),

é obtida com a condição de 1ª ordem (CPO).

A interseção das duas curvas de reação, q 1

*(q 2

) e q 2

*(q 1

),

é o ponto de melhor resposta simultânea ⇒ éEN!

Para tal, basta substituir a curva de melhor resposta de

uma na da outra, isto é, obter q 1

*(q 2

*) e q 2

*(q 1

*). O par

{q 1

*(q 2

*); q 2

*(q 1

*)} é EN (próx. slide):

Competição de Cournot em Duopólios

Nesse caso com custo fixo igual a zero e demanda linear,

as curvas de reação q i *(q j ), os lucros π i , o preço e as

quantidades em EN-Cournot {q 1 *(q 2 *); q 2 *(q 1 *)} são:

Funções melhor

resposta (reação):

Funções Lucro

em EN-Cournot:

Preço em EN-Cournot:

Quantidades em EN

(estratégias em EN):

q(q)

1 2

a−c − b q

2b

a−c − b q

2b

1 2

2 1

= q(q)

2 1

=

p

EN-C

= a − b Q

q(q)

=

EN-C

T

a− 2 c + c

3b

* * 1 2

1 2

=

a+ c + c

3

q(q)

1 2

=

a− 2 c + c

3b

* * 2 1

2 1

Assim, quanto menor o seu próprio custo e maior o custo do oponente,

maior o seu lucro e a sua produção no EN-Cournot (como esperado).

Como a > c i , o preço em EN é maior que o custo médio das firmas.

Os gráficos a seguir ilustram o cruzamento das curvas de reação (EN).

Curvas de Reação em Cournot

A curva de reação da firma (jogador) 1 dá a melhor

resposta q 1 a cada possível estratégia q 2 da firma 2.

Solução de Monopólio (só firma 1 produz)

a−

c 1

2b

q 1

Curva de Reação q 1 *(q 2 )

q 2

Produção q 2 equivale a

Competição Perfeita

(firma 1 não produz)

a−

c 1

b

A curva de reação da firma 2 é similar (troca os eixos dos X com

os dos Y). Girando um dos gráficos (para que os eixos coincidam)

poderemos ver o cruzamentos das curvas (= EN), ver slides:

Curvas de Reação em Cournot

A curva de reação da firma (jogador) 2 dá a melhor

resposta q 2 a cada possível estratégia q 1 da firma 1.

q 2

Girando ⇒

a−

c 2

Curva de Reação q 2 *(q 1 )

2b

a−

c 2

b

q 1

q 2

Curva de Reação q 2 *(q 1 )

q 1

a−

c 2

b

Curva de Reação q 2 *(q 1 )

a −

c 2

2

2b

q 2

a−

c 2

b

Curvas de Reação e EN em Cournot

O cruzamento das curvas de reação é o ponto em que

temos melhor resposta simultânea ⇒ EN.

q 1

q 2

a−

c 2

b

a−

c 1

2b

Curva de Reação q 2 *(q 1 )

EN-Cournot

Curva de Reação q 1 *(q 2 )

a−

c 2

2b

a−

c 1

b

Exemplo Numérico: Competição por Quantidades

Considere uma curva de demanda inversa linear, dada pela

equação: p = 30 − Q T

(ver planilha duopolio_sob_certeza.xls)

Por simplicidade, seja o custo variável igual a zero, ou, de

forma alternativa, considere p a margem de lucro operacional.

A função lucro π i

da firma i é a margem vezes as vendas:

π i = p q i = (30 − Q T ) q i

Na competição perfeita, as firmas irão produzir até a margem p

cair a zero (logo, produzirão q 1 = q 2 = 15 ⇒ Q T = 30 ⇒ p = 0);

No monopólio, a única firma escolhe Q T p/ maximizar o lucro

(derivada do lucro π em relação à produção = 0 ⇒ Q T = 15); e

Colusão é quando as firmas se juntam e agem como monopólio

Vimos que no duopólio onde as estratégias simultâneas

são quantidades, o equilíbrio de Cournot é o EN do jogo.

A curva de reação da firma i é obtida pela maximização ∂π i / ∂q i =

0, que dá as curvas de melhor resposta q i = f(q j ) p/ cada jogador.

O cruzamento dessas curvas é o EN de Cournot (ponto fixo).

Duopólio: Vários Possíveis Resultados

Para entender os possíveis equilíbrios, serão plotadas as curvas

de reação das duas firmas, i. é, as funções melhor resposta dos

dois jogadores dada as estratégias das outras firmas.

Curva de Reação da Firma 2

(vale para Cournot e Stackelberg)

Equilíbrio de Stackelberg

Equilíbrio Competitivo

(*) Margem depois da entrada do seguidor.

Antes da entrada do seguidor a margem do

líder é p = 30 – 15 = 15 = margem da colusão.

Lucro = π i

= (30 − Q T ) q i

Uma solução

de Colusão

Curva de

Contrato

Equilíbrio de Cournot

Curva de Reação em

Cournot, Firma 1

Margem = p = 30 − Q T

Cournot em Oligopólios: N Firmas

Seja o caso de oligopólio com N firmas (N > 1) com

decisão simultânea competindo em quantidades

(Cournot). Considere as N firmas homogêneas (mesmo

custo unitário c) e demanda linear (custo fixo = 0).

A produção de cada firma e a produção total da indústria em

EN-Cournot é (basta resolver para 1 firma homogênea):

q

i

= q =

a − c

(N + 1) b

⇒ Q = q = N q =

T

∑

i

N (a − c)

(N + 1) b

O preço de equilíbrio no mercado (“market clearing price”) é:

2

a + N c

(a − c)

2

p =

Já o lucro de cada firma é: π

i

= = b q

2

i

N + 1

(N + 1) b

Agora podemos ver o que ocorre no mercado quando N →∞:

a − c

lim Q

T

=

lim p = c

N →∞

b

Que são os resultados do caso de competição perfeita sem custo

de entrada para produção e preço (= custo marginal; lucro = 0).

Comparação dos Modelos

A produção da indústria é maior em competição perfeita (cp)

do que em Cournot (C) que é maior que a do monopólio (m):

(a −c) N (a −c) (a −c)

Q

cp

= > Q

C

= > Q

m

=

b (N+

1) b 2 b

Além disso, em Cournot a produção da indústria Q aumenta

com a competição (n o de firmas N) e no limite tende a c.p.:

∂Q C

(a − c)

= > 0

(a − c)

2

lim Q

C

= = Qcp

∂ N (N+ 1) b

N→∞

b

Já o preço é o contrário: o maior é em monopólio, seguido de

Cournot, e o menor preço é competição perfeita (= custo c):

a + c a + N c

p

m

= > p

C

= > p

cp

= c

2 N + 1

A competição (N grande) reduz o preço:

∂p C

− (a − c)

=

2

∂ N (N + 1)

< 0

(pois a > c)

Exercício: mostre que o lucro da indústria tem a mesma

ordenação acima para o preço e que diminui com N.

Oligopólio de Cournot em Fusões & Aquisições

Para ilustrar o caso de N firmas em Cournot, imagine

um mercado petroquímico com 4 firmas homogêneas.

Uma onda de fusões e aquisições fez com que o mercado

fosse reduzido de 4 para 2 firmas, também homogêneas.

Assuma que existam barreiras de entrada de produtos de

firmas estrangeiras devido a custos de transporte e tarifas

alfandegárias, de forma que só essas firmas competem.

Isso é realista no Brasil apenas dentro de certos limites de preços.

Assuma que a curva de demanda do mix de produtos é

linear e dada por p = 180 – 8 Q T , onde p = preço do mix

de produtos e o custo médio unitário é c = 70 $/unidade.

Determine os preços, quantidades e lucros em equil. de Nash-

Cournot antes e depois das fusões. Quem ganha e quem perde?

Agora considere que as fusões permitiram uma redução de

custo unitário para c´ = 60 $/unidade. Quais são os novos

preços, quantidades e lucros? Use a planilha oligopolio.xls.

Oligopólio de Cournot em Fusões & Aquisições

Os resultados do caso de fusões sem reduzir custos são:

Assim, as firmas ganharam com as fusões, mas em

detrimento da renda dos consumidores (maiores preços).

Os resultados do caso de fusões com redução de custos são:

Ainda assim os preços subiram, embora menos que o caso anterior.

Qual seria a redução de custo necessária para que os

preços ao consumidor não aumentem? R: c´ = 48 $/unid.

Jogos Dinâmicos

Até aqui vimos só jogos estáticos, onde os jogadores se

encontravam uma só vez, o tempo não era uma variável.

Agora serão vistos jogos dinâmicos onde o tempo é

relevante e/ou os jogadores se encontram várias vezes.

Os jogos dinâmicos podem ser jogos repetidos ou não-repetidos.

Os jogos dinâmicos podem ser determinísticos ou estocásticos.

Antes, os elementos ação e estratégia se confundiam, mas

em jogos dinâmicos é necessário lembrar a diferença:

Uma estratégia s i do jogador i éum plano completo de ações tal

que especifica uma ação factível a i, c em cada contingência c na

qual o jogador i possa ser chamado a jogar.

Cada contingência c pode ser interpretada como cada instante t.

A ação de um jogador pode ou não ser observável pelo(s) outro(s).

Para analisar jogos dinâmicos precisamos do conceito de

Equilíbrio de Nash Perfeito em Subjogos (ENPS).

Refinamentos do EN: Equilíbrio Perfeito

O grande problema prático do EN é que geralmente se

têm múltiplos ENs. Isso é freqüente em jogos dinâmicos.

A pergunta natural é: qual o equilíbrio que deve prevalecer?

Em jogos dinâmicos, o conceito de EN não consegue eliminar

várias estratégias não-críveis. É necessário adicionar uma

racionalidade seqüencial no caminho do equilíbrio.

Princípio da racionalidade seqüencial: a estratégia de um jogador

deve especificar ações ótimas em todos os pontos da árvore de jogos.

Selten (1965) introduziu o conceito de equilíbrio de Nash

perfeito em subjogos (ENPS) para jogos dinâmicos.

ENPS usa o princípio da racionalidade seqüencial e o

conhecido processo de otimização backwards (retro-indução):

Estabelece primeiro as estratégias ótimas nos nós terminais e

depois vai estabelecendo as estratégias ótimas nos nós anteriores.

O precursor foi o teorema Zermelo (1913) que pode ser enunciado

assim “todo jogo finito de informação perfeita tem um EN em

estratégias puras que pode ser obtido através de retro-indução”.

Subjogos

Antes de definir o ENPS é necessário definir subjogo:

Subjogo é um subconjunto do jogo Γ E

com as propriedades: (a)

começa num conjunto de informação que contém apenas um

nó de decisão e contém todos os nós sucessores; (b) não há

conjuntos de informação quebrados, i. é, se o nó de decisão x

está no subjogo, então cada nó x’ ∈ H(x) (i. é, o conjunto de

informação onde está x) também estará no subjogo.

Todo jogo tem pelo menos um subjogo que é o próprio jogo.

Firma 1

não é subjogo (não contém

E NE todos os nós sucessores)

Firma 2

E NE E

(D 1 ; D 2 ) (M 1 ; 0) (0; M 2 )

NE

(0; 0)

subjogo

Quantos subjogos existem?

R: 3 subjogos.

Subjogos

Exemplo da segunda condição para ser subjogo:

Esse jogo só tem um único subjogo que é o próprio jogo.

Pode ser interpretado como um jogo simultâneo ou como

um jogo seqüencial onde a ação da firma 1 não é observável.

Firma 1

E

NE

Firma 2

E NE E

(D 1 ; D 2 ) (M 1 ; 0) (0; M 2 )

NE

(0; 0)

Não é subjogo, pois não

pode haver conjuntos de

informação quebrados.

Informação imperfeita x incompleta.

Caso acima é informação imperfeita. Veremos depois o outro caso.

Equilíbrio de Nash Perfeito em Subjogos

O perfil de estratégias σ = (σ 1

, σ 2

, … σ J

) no jogo na

forma extensiva Γ E

éum Equilíbrio de Nash Perfeito em

Subjogos se ele induz um EN em cada subjogo de Γ E

.

No jogo finito com informação perfeita ele pode ser obtido

backwards e o Teorema de Zermelo diz que existe o ENPS.

O ENPS é único caso nenhum jogador tenha os mesmos payoffs

em nós terminais quaisquer. Faremos um exemplo numérico.

Existe uma ligação estreita óbvia entre o conceito de ENPS e o

de programação dinâmica: ambos usam otimização backwards.

Para determinar o ENPS inicia-se procurando o(s) EN nos nós

terminais, substitui-se esse subjogo pelos payoffs do EN e analisa o

sujogo predecessor, procurando o EN, etc., até chegar ao início.

Nos casos de jogos infinitos, a definição de ENPS permanece no

sentido de que induz EN em todos os subjogos, apesar de não ter

a “última data” para trabalhar backwards. Faremos um exemplo.

Trabalhar com horizonte infinito é fácil, pois o tempo deixa de ser

variável de estado (sempre terá um horizonte infinito pela frente).

Equilíbrio de Nash Perfeito em Subjogos

Jogo abaixo: a forma normal mostra que existem

dois EN. Forma extensiva mostra que só um é ENPS.

1

u

2

d

0

3

½

2

U

L

1

u

D

R

2

-2

d

1

-1

1

UL

UR

DL

DR

0

½

-2

3

2

-2

0

1

3

-1

• Dois EN em estratégias puras (ver forma normal). Mas um deles

não é crível (não é sequencialmente racional).

• Um ENPS em estratégias puras: (DL ; u). É o EN “crível”.

Procedimento Backward Induction

O procedimento de retro-indução (backward induction) é:

Começe nos nós terminais do jogo e identifique quem joga.

Ache a decisão ótima do jogador nos nós de decisão comparando

os payoffs que os jogadores recebem em cada nó terminal.

Registre essa escolha, ela é parte da estratégia ótima dos jogadores.

Podar a árvore cortando todos os ramos que se originaram de #1.

Atribuir a cada um desses novos nós terminais os payoffs obtidos

quando a ação ótima é realizada nesse nó.

Uma nova árvore de jogo existe e é menor que a original.

Se não existirem mais nós de decisão, o jogo termina. Se ainda

existirem nós de decisão, aplicar os passos #1 a #4 até não haver

mais nós de decisão.

Para cada jogador, selecione as decisões ótimas em cada nó. Esse

conjunto de decisões constitem as estratégias ótimas desse jogo.

O resultado é um equilíbrio de Nash perfeito em subjogos.

O ENPS pode ser único ou não (mesmo payoff em nós de decisão).

Ex: Barreira de Entrada com Excesso de Capacidade

O caso a seguir é uma variante do modelo de Stackelberg

de líder e seguidor (caso mais geral é visto em seguida).

A motivação desse exemplo é um famoso caso de 1945: o

processo antitrust contra o poder de monopólio da Alcoa,

que dominava 90% do mercado de alumínio nos EUA.

A Alcoa foi condenada porque o juiz entendeu que o rápido

acúmulo de capacidade de produção por parte da Alcoa, que

excedia muito os níveis de demanda, tinha como objetivo criar

uma barreira de entrada para inibir a entrada de competidores.

Veremos que a teoria dos jogos e o ENPS pode justificar a

decisão do juiz americano, assim como o argumento usado.

Suponha que duas firmas estão considerando entrar ou

não no mercado, e também como (capacidade) entrar.

Seja P o preço de equilíbrio e Q T a produção total da indústria

que aqui é a soma das produções das duas firmas q 1 + q 2 .

Barreira de Entrada com Excesso de Capacidade

Seja uma curva de demanda inversa linear dada por:

P = 900 – Q T ou P = 900 – q 1 –q 2

Assuma que existem só duas alternativas de

investimento em capacidades: pequena e grande.

A unidade pequena demanda um investimento I p

= US$

50.000 e permite produzir 100 unidades.

A unidade grande teria de investir I g

= US$ 175.000 e

permitiria produzir qualquer quantidade de unidades.

Assim, só a unidade pequena é que tem restrição de capacidade.

Suponha que em ambos os casos o custo operacional é zero.

Assuma que a entrada das firmas é seqüencial:

Primeiro a firma 1 decide se entra e com que capacidade e

depois a firma 2, observando a ação da firma 1, decide se

entra ou não e com que capacidade.

Determine o Equilíbrio de Nash Perfeito em Subjogos (ENPS).

Barreira de Entrada com Excesso de Capacidade

Para achar o ENPS, vamos fazer alguns cálculos:

Suponha que a firma i está sozinha no mercado. Assim, o preço

duma unidade é P = 900 – q i e a receita R i = q i (900 – q i ).

O lucro de i é maximizado escolhendo q i = 450, que dá uma

receita (= lucro oper., pois o custo oper. = 0) de R* i = 202.500.

Mas a firma i só produz 450 se ela investir na unidade grande.

Se ela investiu na unidade pequena, ela só produziria 100 e só

obteria uma receita (lucro) de R = 80.000.

Suponha que esses valores estão todos em valor presente, de

forma que os VPLs dos dois casos anteriores seriam:

Unidade grande: VPL g = R – I g = 202.500 – 175.000 = $ 27.500.

Unidade pequena: VPL p = R – I p = 80.000 – 50.000 = $ 30.000.

Agora suponha que ambas as firmas estão no mercado. Assim,

a receita da firma i é R i = q i (900 – q i –q j ). A função melhor

resposta de i é dada pela condição de primeira ordem: ∂R i /∂q i

= 0 ⇒ q* i = 450 – q j /2. Resolvendo o sistema q* 1 = 450 – q* 2 /2 e

q* 2 = 450 – q* 1 /2 obtemos q* 1 = q* 2 = 300.

Barreira de Entrada com Excesso de Capacidade

Esse cálculo considera que ambas as firmas não têm restrição de

capacidades (investiram em unidades grandes).

Nesse caso sem restrição e com as duas firmas no mercado, as

firmas teriam receitas R i = (900 – 300 – 300) 300 = 90.000. Nesse

caso os VPLs seriam negativos: VPL 1 = VPL 2 = 90.000 – 175.000

⇒ VPL 1 = VPL 2 = – 85.000.

Se ambas as firmas estão no mercado, mas com capacidade

restrita, a receita será R i = (900 – 100 – 100) 100 = 70.000.

Logo, VPL 1 = VPL 2 = 70.000 – 50.000 ⇒ VPL 1 = VPL 2 = 20.000.

Se ambas as firmas estão no mercado, uma (i) com capacidade

sem restrição e a outra (j) com capacidade restrita, então a que

não tem restrição produziria no ótimo q* i = 450 – 100/2 = 400.

Logo, o preço será P = 900 – 400 – 100 = 400; as receitas das duas

firmas serão: R i = 400 x 400 = 160.000 e R i = 400 x 100 = 40.000.

Os VPLs serão: VPL i = 160.000 – 175.000 ⇒ VPL i = – 15.000 e

VPL j = 40.000 – 50.000 ⇒ VPL j = – 10.000.

Assim, uma análise não-estratégica recomendaria entrar com a planta

pequena ou não entrar. Mas análise estratégica dará outro resultado!

Barreira de Entrada com Excesso de Capacidade

Esse jogo seqüencial é mostrado na forma extensiva, onde N = não-entrar;

P = entrar com capacidade pequena; e G = entrar com capacidade grande.

N (0; 0)

Firma 2

P (0; 30)

Firma 1

N

P

Firma 2

G

N

P

G

(0; 27,5)

(30; 0)

(20; 20)

(− 10; − 15)

Backwards:

Primeiro a

escolha ótima

da firma 2 em

cada subjogo

terminal.

G

N

(27,5; 0)

P

(− 15; − 10)

Firma 2

G

(− 85; − 85)

Barreira de Entrada com Excesso de Capacidade

Agora podemos substituir os subjogos terminais pelo payoff advindo da

escolha ótima da firma 2. Com isso ficará claro a escolha ótima da firma 1.

Firma 1

N

P

(0; 30)

(20; 20)

A firma 1 escolhe a ação ótima

nesse subjogo, considerando as

respostas ótimas da firma 2.

G

(27,5; 0)

Assim, o único ENPS é o par de estratégias (G; N), ou

seja, a firma 1 entra com capacidade grande e a firma 2

não entra no mercado. Com isso, temos um monopólio!

Esse resultado é interessante, já que sem competição (sem a

firma 2 ameaçar entrar), o ótimo para a firma 1 seria entrar

com uma capacidade pequena (VPL = 30 > 27,5).

Logo, o excesso de capacidade inibiu a entrada do competidor!

Exemplo 2: Equilíbrio de Stackelberg

Stackelberg: entrada em um mercado com competição

em quantidades e com ações seqüenciais, i. é, primeiro

entra a firma 1 (líder) com q 1 e depois, observando a

quantidade q 1 , entra a firma 2 (seguidor) com q 2 *(q 1 ).

Firmas iguais com custo marginal c. As firmas já têm capacidades

irrestritas. Demanda p(Q) = a − b Q. Determine o único ENPS.

Firma 1

q 1

0 q 1

Firma 2

q 2

0 q 2

(π 1 ; π 2 )

Lembrando: em jogos dinâmicos finitos buscase

o ENPS por retro-indução (“backwards”).

Assim, primeiro verifica-se o q 2 ótimo para a

firma 2, dado que a firma 1 já entrou com q 1 .

A firma 2 observou q 1 e a melhor resposta da

firma 2 é a sua curva de reação q 2 *(q 1 ).

A firma 1 sabe que a firma 2 irá observar o

valor q 1 e sabe que a rival irá jogar q 2 *(q 1 ).

Assim, basta a firma 1 jogar q 1 * de forma a

maximizar π 1 , dado que a rival joga q 2 *(q 1 ).

Exemplo: Equilíbrio de Stackelberg

Vimos que a função lucro π 1 da firma 1 e a curva de

reação q 2 *(q 1 ) da firma 2 p/ C i (q i ) = c i q i , são dadas por:

π 1 = q 1 P(Q T ) − C 1 (q 1 ) ⇒ π 1 = q 1 (a − c 1 ) − q 1 b (q 1 + q 2 )

* a−c 2

− b q1

Firmas

* a−c − b q1

q(q)

2 1

=

2b homogêneas

⇒ q(q)

2 1

=

2b

Assim, temos um problema de maximização de π 1 ,

escolhendo q 1 e substituindo q 2 pela função q 2 *(q 1 ):

a − c − b q

Max P(q

1

+ q(q))

2 1

q

1

− C(q)

1

1 1

q

= Max q

1

(a − c) − b q

1

(q

1

+ )

1

q1

2 b

Aplicando a CPO (condição de primeira ordem) ∂π 1 /∂q 1 = 0:

* (a − c)

q

1

= ⇒ q

2

=

2 b

4 b

Exercício: Mostre que o lucro π 1 > π 2 e determine o preço P.

A firma 2 tem menor lucro por ter mais informação que a

firma 1 (sabe q 1 ): aqui é desvantagem ser informado!

No jogo do par-ou-ímpar, ao contrário, ter mais informação era melhor.

Inconsistência Temporal

O resultado de Stackelberg é não apenas EN como

também ENPS, desde que o jogo termine no 2 o estágio.

A figura abaixo (do exemplo da parte 1, com P(Q) = 30 - Q)

mostra que a quantidade q 1 não é melhor resposta para q 2 .

Assim, se houvesse um terceiro estágio seria ótimo para o líder

reduzir a sua produção q 1 para aumentar o seu lucro π 1 .

Esse problema é chamado de problema de inconsistência temporal.

Stackelberg:

* (a − c)

q

1

=

2 b

* (a − c)

q

2

=

4 b

Na prática a pergunta é:

Será a estratégia q 1 um

compromisso crível?

Inconsistência Temporal

O resultado de Stackelberg é um exemplo do problema

de inconsistência temporal (“time inconsistency”):

Como a quantidade q 1 de Stackelberg não é a melhor resposta

para o q 2 do seguidor, se o jogo continua essas quantidades

deixam de ser equilíbrio, pois existe um incentivo para o líder

mudar (reduzir) o valor de q 1 num terceiro estágio do jogo.

Ver, por ex., o livro do Fudenberg & Tirole (1991, pgs. 74-77).

Inconsistência temporal em geral descreve a situação

onde as preferências do decisor mudam ao longo do tempo

O que é preferido num certo instante é inconsistente com o que

é preferido num outro instante do tempo. Os jogadores com

freqüência “re-otimizam” no curto-prazo, abandonando o

plano de longo-prazo que antes era ótimo por um que era pior.

É comum que a série de decisões “ótimas” de curto-prazo tenha

resultados piores do que o compromisso do plano de longo-prazo.

Esse tema é relacionado com “credibilidade” e “compromisso”.

Inconsistência Temporal e Commitment

Esse tema ganhou popularidade após ser premiado com

o Nobel de Economia de 2004 para Kydland & Prescott.

O paper clássico (que inaugurou um tema em macroeconomia)

deles é “Rules Rather than Discretion: The Inconsistency of

Optimal Plans”, Journal of Political Economy, 1977.

Política monetária: Banco Central em vez de perseguir meta de

longo-prazo (commitment) de baixa inflação, ele pode afrouxar a

política devido ao incentivo de aumentar o emprego com emissão

de moeda (“curva Phillips”). No final há desemprego e inflação!

Essa inconsistência está muito ligada ao conceito de

compromisso (“commitment”) não-crível. Ex. na política:

Um governo pode anunciar que não negocia com terroristas

em caso de seqüestros. Entretanto, o terrorista sabe que isso é

um compromisso não-crível, vazio (“bravata”), a menos que

haja uma lei com punição prevista para quem negociar.

Para um compromisso ser crível é necessário que não hajam

incentivos para desviar no curto e longo-prazo.

Inconsistência Temporal e Macroeconomia

Uma política macroeconômica tem inconsistência

temporal quando o governo anuncia uma política de

longo-prazo ótima (ex.: baixa inflação), mas de forma

que há incentivos para desviar no curto-prazo.

Os agentes econômicos são racionais ⇒ consideram que o

compromisso do governo é não-crível e reajustam os preços

Uma maneira de conduzir uma política monetária

com consistência temporal é dar autonomia ou

independência ao Banco Central para que faça essa

política de forma a cumprir uma meta de inflação.

O BC tem de ser avaliado por cumprir essa meta e não

por agradar empresários ou centrais sindicais.

Assim o BC não terá incentivos de desviar no curto-prazo.

É isso que tem sido feito no Brasil e em outros países com

muito sucesso. Credibilidade do BC é a palavra-chave.

Jogos Repetidos

Jogo repetido é um jogo na forma extensiva que consiste

de algum número de repetições de um jogo básico

chamado estágio-jogo (“stage-game”).

O estágio-jogo é geralmente um jogo bem conhecido de dois

jogadores. O jogo todo é às vezes chamado de superjogo.

Os jogos repetidos podem ser finitos ou infinitos. Geralmente

os equilíbrios são totalmente diferentes em cada caso.

Quando a ameaça de retaliação é crível, alguns resultados que

não seriam EN no stage-game muitas vezes são sustentáveis no

superjogo. Isso ocorre principalmente em jogos infinitos.

Mas pode ocorrer em jogos repetidos finitos, especialmente os

que têm múltiplos EN no estágio-jogo. Veremos um exemplo.

Nos jogos repetidos finitos de informação perfeita, se o

estágio-jogo tem um único EN (como no dilema dos

prisioneiros), então o único ENPS é sempre jogar o EN.

A prova (“backwards”) é óbvia.

Jogos Infinitamente Repetidos

Nos jogos repetidos finitos existe uma última data de

jogo. Mas em várias interações sociais não existe essa

data-limite. Nesse caso, são mais adequado os jogos que

potencialmente podem ser infinitamente repetidos.

Nos jogos infinitamente repetidos é mais fácil sustentar

como ENPS uma ação que não é EN no estágio-jogo.

Ex.: cooperar no dilema dos prisioneiros pode ser ENPS no Γ E∞ .

Mas é necessário usar estratégias de punição e recompensa.

Um dos critérios p/ comparar estratégias é o VPL (valor

presente líquido) do fluxo de lucros descontado por δ < 1.

O fator de desconto δ pode ser vista como 1/(1 + µ), onde µ éa

taxa de desconto ajustada ao risco (dada pelo CAPM, por ex.).

O lucro total (VPL) da firma i é dado por:

VPL i = π i, 1 + (π i, 2 δ) + (π i, 3 δ 2 ) + … + (π i, t δ t − 1 ) + …

Que é finito para π i, t finito, ∀ t. Note que a soma da PG infinita

de razão menor que 1 é finita: 1 + δ + δ 2 + … = 1/(1 − δ).

Estratégias de Punição com Repetição Infinita

Em jogos repetidos os teoremas populares usam as

chamadas estratégias de punição (“trigger strategies”)

para obter certos payoffs. As três mais usadas são:

Estratégia “Grim” (rígida, intransigente): comece com a ação

“cooperar” (C); continue com C a menos que algum jogador

escolha “não-cooperar” (NC), nesse caso jogue NC p/ sempre.

Na repetição infinita do dilema dos prisioneiros pode-se sustentar

a cooperação (não-confessar) como ENPS com essa estratégia,

pois quem desvia tem um ganho imediato, mas uma perda eterna.

Estratégia “tit-for-tat” (“olho-por-olho…”): comece com a

ação “cooperar” (C); nos outros períodos, escolha em t a ação

que o outro jogador escolheu em t − 1. Desvio: ações cíclicas.

Não é ENPS no dilema dos prisioneiros, mas com ela Rapoport

ganhou o torneio desse jogo repetido 200 vezes (Axelrod, 1984)!

Estratégia “minimax”: Punir visando a máxima perda ao outro

jogador, que então minimiza a máxima perda ele que pode ter.

Como na “grim”, pode ser ENPS a depender do fator de desconto.

Exemplo Estilo Dilema dos Prisioneiros

Seja um jogo repetido infinitamente em que o estágiojogo

é do estilo dilema dos prisioneiros com os payoffs:

Jogador 2

Coopera Não-Coopera

Jogador 1

Coopera

Não-Coopera

3; 3 0; 5

5; 0 1; 1

Com repetição infinita, note que cada subjogo é igual ao

anterior com exceção talvez da sua história pregressa.

Com a estratégia “grim” e o fator de desconto δ∈[0, 1],

não há incentivo para desviar da estratégia grim se:

3 (1 + δ + δ 2 +…) = 3 / (1 − δ) ≥ 5 + 1(δ + δ 2 +…) = 5 + δ / (1 − δ)

Algebrando se vê que isso ocorre se e somente se δ≥½.

Esse valor limite (½) depende da estrutura de payoffs do jogo.

Jogos Estocásticos Repetidos (Shapley)

A versão clássica de jogos estocásticos é devido a

Shapley (1953). Hoje existe uma nova literatura mais

complexa de jogos de opções, que considera processos

estocásticos e exercício ótimo de opções (reais ou financ.)

A versão clássica é um jogo dinâmico repetido (finito ou

infinito) em que existem probabilidades de transição de

um estágio-jogo para outro estágio.

Assim, a cada estágio do jogo o payoff é em geral diferente,

existindo probabilidades p/ cada possível estado da natureza.

A cada estágio os jogadores devem tomar ações que dependem

não só do estado (e a matriz de payoffs) corrente, mas também

dos possíveis estados nos próximos estágios do jogo.

Jogos estocásticos clássicos são generalizações de jogos

repetidos para um ambiente de payoffs estocásticos.

Ver no anexo o caso do jogo de cotas da OPEP em que a

demanda é estocástica, mas com só dois estados da natureza.

Jogos de Informação Incompleta

Em muitos jogos é mais realista considerar que existe

informação incompleta sobre os payoffs dos rivais.

Nesses jogos, cada firma só recebe informações parciais sobre

os valores do jogo, representadas por distribuições de

probabilidades a priori sobre os possíveis cenários dos payoffs.

Um dos jogos dessa classe mais importantes é o jogo de

informação assimétrica, em que existe uma parte

informada e outra parte não (ou menos) informada.

Assimetria de informação já deu 5 prêmios Nobel em economia

Iremos ver alguns casos clássicos, como os jogos de sinalização.

O método geral para resolver os jogos de informação

incompleta é o método Bayesiano (Harsanyi, 1967-68).

O jogo original é transformado num jogo equivalente de Bayes

com informação completa, embora imperfeita.

Harsanyi desenvolveu o conceito de equilíbrio Bayesiano.

Informação Incompleta e Equilíbrio Bayesiano

Nesse jogo de informação incompleta, a natureza faz o

primeiro lance escolhendo a realização de θ i

, a variável

aleatória (v.a.) sobre o valor ou “tipo” de cada jogador i.

Cada jogador i tem uma função valor V i

(s i

, s − i

, θ i

), onde θ i

∈Θ i

é uma v.a. escolhida pela natureza, só observada pelo jogador i.

É assumido, como premissa, que a distribuição conjunta dos

payoffs (valores) dos jogadores são de conhecimento comum.

Estratégia pura p/ o jogador i é a regra de decisão ou função

s i

(θ i

) que dá a escolha para cada realização do seu tipo θ i

.

O valor esperado condicional do jogador i é dado por:

O equilíbrio Bayesiano de Nash (EBN) é definido de forma

similar ao EN, mas para valores esperados condicionais.

Um perfil de estratégias puras s = (s 1

, s 2

, … s J

) é EBN se, para

todos os J jogadores:

Informação Incompleta Vira Imperfeita

Harsanyi transformou um jogo de informação incompleta em

um jogo de informação completa mas imperfeita. Para isso, a

natureza joga. Ex.: informação incompleta sobre a firma 1:

Natureza joga:

Com probabilidade p, a

firma 1 é do tipo alto custo

Com probabilidade 1 - p, a

firma 1 é do tipo baixo custo

Firma1tipoAC

E

NE

informação

imperfeita

E

Firma1tipoBC

NE

Firma 2

E

NE

E

NE

E

NE

E

NE

(D 1 ; D 2 ) (M 1 ; 0)

(0; M 2 )

(0; 0)

(D’ 1 ; D’ 2 ) (M’ 1 ; 0)

(0; M 2 )

(0; 0)

Crise 2007/8 e Informação Assimétrica

A crise financeira que começou em agosto de 2007

(crédito imobiliário sub-prime) e se agravou a partir de

setembro de 2008 (crise sistêmica), é um exemplo radical

da gravidade do problema de assimetria de informação.

Assimetria de informação: como um banco não sabe se o outro

tem ou não títulos “podres”, ele não empresta para o outro que

fica com problemas para “fechar o caixa” do dia.

Se um banco, mesmo sólido, não honrar um pagamento devido

a essa paralisia no mercado interbancário, ele pode sofrer uma

“corrida bancária” e quebrar. Se quebra, não honra os seus

demais compromissos, criando mais dificuldades p/ os outros ...

Assim, rapidamente ocorre um grande problema de liquidez

devido a essa falta de confiança entre os bancos. A crise de

confiança é alavancada pela assimetria de informação.

A crise financeira de 1929 se tornou recessão e depois

depressão nos anos 30: o Banco Central (FED) errou ao

restringir ainda mais o crédito/reduzir liquidez.

Crise 2007/8 e Informação Assimétrica

Os Bancos Centrais aprenderam com o erro de 1929 e

hoje em dia a atuação padrão dos BCs nesses momentos

é prover liquidez no mercado interbancário para reduzir

os efeitos da informação assimétrica entre os bancos.

Isso é o que tem sido feito desde agosto/07 por BCs dos EUA,

Europa e Japão. No início, essa política foi bem sucedida.

O problema é que o volume de créditos “podres” parece

ser muito maior que se imaginava. Terão os BCs cacifes

suficientes p/ conter a crise? Qual o tamanho do rombo?

O “pacote” aprovado pelo congresso americano em 03/10/2008

é uma maneira de tentar revelar o tamanho do problema, ao

propor a compra desses títulos “podres”, assim como isolar o

problema que causou a crise de confiança interbancária.

Sem ele, poderia acontecer o mesmo problema do Japão nos anos

90 (crise imobiliária também) que teve prolongada recessão.

Problemas: custo ↑↑ do pacote; dúvida se será ele suficiente já que

persiste a assimetria de informação; e quanto pagar pelos títulos.

Crise 2007/8: Epílogo?

Em julho de 2009 aparentemente a crise de confiança no

sistema financeiro terminou e a economia se recupera.

Isso pode ser comemorado como um sucesso nas políticas dos

governos (especialmente os Banco Centrais) p/ reduzir os efeitos

da assimetria de informação (provendo liquidez ao mercado

bancário e dando estímulos econômicos a economia real).

Não foi repetido o erro de 1929. Se fosse, a situação seria bem pior.

Há indicadores surpreendentes de recuperação econômica.

Bancos americanos estão mostrando lucros semestrais elevados.

Já a redução da assimetria de informação em sí (quem detém os

títulos podres) foi apenas parcialmente alcançada, já que a

mudança nas regras contábeis de marcação a mercado está

ocultando problemas com ativos podres (assimetria persiste).

Marcação a mercado aqui significa lançar no balanço o valor de

mercado dum ativo e não o valor nominal. Os bancos americanos

estão podendo colocar o valor nominal de vários ativos no balanço.

O problema é que não é claro se isso causará crises mais adiante.

Também, o custo elevado de estímulo da economia, poderá causar

problemas fiscais nos governos, com inflação, elevação dos juros, etc.

Caso da Enron: Auditoria, Consultoria e Incentivos

Um exemplo de falha de mercado foi a falência da Enron e o

papel(ão) das cias. “independentes” de auditoria. Esse caso foi

analisado por Stiglitz (Valor Econômico, 17/02/02):

Firmas de auditoria de balanços existem para evitar que a assimetria

de informação cause prejuízos ao investidor por omissão ou falsidade.

A firma de auditoria joga jogos repetidos com os investidores, logo

teria o incentivo da reputação p/ bem informá-los sobre a Enron.

No entanto, quando a mesma empresa que audita também presta

consultoria, aparece outro (e perverso) incentivo de curto-prazo:

“agradar os clientes que não gostam de relatórios desfavoráveis”.

A auditora da Enron em 2001 chegou ao cúmulo de ajudar a

destruir diversos documentos (supostas provas de irregularidades).

A. Levitt, ex-presidente da SEC, tentou no passado proibir a mistura de

atividades de auditoria e consultoria pela mesma empresa.

Stiglitz argumenta que “a questão central de nossa época é

encontrar o equilíbrio certo entre governo e mercado”.

Mesmo com essas imperfeições no mercado, Stiglitz adverte:

“precisamos resistir a tentação de ir para o extremo oposto”.

Prêmio Nobel em 2007

Esse prêmio Nobel em 2007 foi p/ a teoria de desenho

de mecanismos, relacionada com jogos Bayesianos.

Veremos exemplos: bônus p/ gerentes e desenho de leilões.

Foram três ganhadores, sendo que dois deles

(Maskin e Myerson) têm na teoria dos jogos seu

principal foco de pesquisas (mas Hurwicz também

usou conceitos de teoria dos jogos nessa teoria).

Hurwicz (falecido em 2008) foi o fundador da teoria e de

conceitos tais como o de “incentivo-compatível”.

Myerson foi quem fez o link entre mecanismos incetivocompatível

e jogos Bayesianos, o princípio da revelação II.

Maskin refinou essa teoria com a teoria da implementação

e tem outras contribuições em jogos cooperativos e nãocooperativos,

desigualdade de renda, patentes, etc.

Myerson e Maskin estiveram no Rio em 2008 (LACEA).

Tive a honra de ser o apresentador da palestra do Maskin.

Desenho de Mecanismo e Princípio da Revelação

A teoria do desenho de mecanismo combina o modelo de

principal-agente com o conceito de equilíbrio Nash-Bayesiano.

Mecanismo é um jogo: especifica as estratégias possíveis e os payoffs.

Mecanismo direto é aquele que simplesmente pergunta ao agente

para revelar a sua informação privada.

Estratégias disponíveis são simplesmente reportar sobre o seu tipo.

Se for ótimo (ENB) para um jogador revelar a verdade, tal

mecanismo é chamado de incentivo-compatível.

O teorema do princípio da revelação diz que se pode restringir a

busca do mecanismo ótimo para aqueles que sejam diretos

(pergunta o tipo) e incentivo-compatível (revelador da verdade).

Prova-se que não há perda de payoff ao descartar os mecanismos

que não atendam ao princípio da revelação.

O link com jogos Bayesianos é devido a Myerson (1979):

Princípio da Revelação II: Qualquer equilíbrio Nash-Bayesiano

(ENB) de qualquer jogo Bayesiano, pode ser representado por um

mecanismo direto incentivo-compatível.

Ex.: Incentivos para Gerentes em Corporações

Exemplo simples de mecanismo incentivando tanto

revelar a verdade sobre a meta factível de produção

(Q f ), como maior empenho dada a meta.

Um bônus baseado no nível de produção Q incentiva maior

empenho, mas incentiva mais os gerentes de UNs maiores e

desestimula gerentes de UNs menores.

Também bônus baseado na diferença Q − Q f estimula os

gerentes a reportarem valores baixos para Q f .

Weitzman (1976) propõe o seguinte mecanismo para

induzir os gerentes a reportarem a verdade sobre Q f e ao

mesmo tempo induzir esforço para aumentar Q:

Bônus B = β Q f

+ α (Q − Q f

) se Q > Q f

e

B = β Q f

− γ (Q f

− Q) se Q ≤ Q f

Onde: γ > β > α > 0

Incentivos para Gerentes em Corporações

Vejamos um exemplo numérico (Pindyck & Rubinfeld, 1995,

Microeconomics, pp.613-616), com γ = 0,5 ; β = 0,3 ; α = 0,2.

Assuma que a verdadeira meta factível é Q f = 20.000 unidades.

Bônus

($/ano)

B = 0,3 Q f + 0,2 (Q − Q f ) se Q > Q f

B = 0,3 Q f − 0,5 (Q f − Q) se

Q ≤ Q f

Q f

= 30.000

9.000 Q f

= 20.000

Q f

= 10.000

6.000

3.000

$6.000 é o nível que a sede quer pagar

Resultado: bônus obedece

o princípio da revelação

(dizer a verdade sobre Q f

é

ótimo) e tem incentivo para

aumentar a produção Q

10.000 20.000 30.000 40.000

Produção Q (unidades/ano)

Introdução à Teoria dos Leilões

Do ponto de vista de modelagem, a teoria dos leilões

pode ser vista como uma aplicação da teoria de desenho

de mecanismos ou de jogos Bayesianos.

Leilão pode ser visto como um mecanismo de mercado

para equilibrar oferta e demanda (market clearing mec.).

Outros mecanismos incluem a venda a preço fixo (ex.: loja

comum) e barganha (ex.: na venda de uma casa, se barganha a

diferença de valor p/ o comprador e o valor p/ o vendedor).

Leilão é mais flexível que a venda a preço fixo e talvez consuma

menos tempo que a barganha, mas não garante o maior preço.

Leilão: regras de formação de preço são explícitas e conhecidas.

Leilões são usados para produtos em que não existe mercado

estabelecido. Exs.: objetos raros, privatizações, carros usados…

São usados porque o vendedor está incerto sobre o preço de venda.

Geralmente quem estabelece as regras do leilão é o

vendedor, que está incerto sobre o preço do objeto.

Há informação incompleta para o leiloeiro e para os “bidders”.

Leilões: Motivação e Conceitos Básicos

A essência de qualquer situação de leilão é que os

compradores valoram o bem de forma diferente:

Seja porque eles têm valores privados diferentes (ex.: mercado

de arte, colecionador versus mero admirador) ou porque eles

têm estimativas diferentes do valor interdependente do bem

(ex.: áreas para exploração de petróleo, as firmas têm

diferentes estimativas de probabilid. de sucesso, volume, etc.),

mas todos venderiam petróleo ao mesmo valor de mercado.

Valor comum é um caso especial de valor interdependente

Muitas situações da economia tb. podem ser modeladas

como leilões. Ex.: as aquisições (“takeovers”) de firmas:

Dois tipos de takeover: (a) disciplinar, pois a firma estaria mal

administrada e a firma pode se valorizar com novos gerentes;

(b) sinergético, em que a firma compradora teria benefícios

específicos com a junção das firmas. No caso disciplinar temos

valor comum e no caso sinergético temos valor privado.

Formatos ou Tipos de Leilões

Os leilões podem ser classificados de diversas maneiras.

Podem ser abertos (lances públicos, oral ou não) ou selados.

Leilões abertos podem ser com preços ascendentes (inglês, o

mais popular) ou com preços descendentes (holandês).

Leilões fechados (selados) de primeiro preço e de segundo preço.

Leilões de objeto único ou de múltiplos objetos.

Leilões de primeiro preço (ou 1 o lance), o mais alto lance (bid)

ganha o bem e paga o seu bid. Leilões de 2 o preço (lance) o

preço mais alto também ganha, mas só paga o 2 o maior bid.

O leilão de 2º lance (ou de Vickrey) tem sido usado, por ex.,

para venda de manuscritos antigos pelo Antebellum Covers.

Outro tipo de leilão é o leilão em que todos pagam (“all-pay

auction”). Usado para modelar situações tais como: disputa

por medalha de ouro nas olimpíadas; eleições; lobbies, etc.

Nem sempre o leiloeiro consegue a maior receita. Ver ex. em:

http://isc.temple.edu/economics/Econ_92/Game%20Hwk/Auctions/hwk11-auctions.htm

Estratégias Ótimas do Comprador

A decisão de quanto oferecer (“bidar”) num leilão é uma

decisão sob incerteza. Em alguns casos é bem simples:

No leilão aberto inglês, se você tem um valor privado = v, então

a regra é permanecer no leilão enquanto o último lance b ≤ v.

Nesse caso sua estratégia ótima independe das estratégias dos

outros jogadores: não é necessário estimar os planos dos rivais.

No leilão selado de 2º lance, veremos que é ótimo dar um lance

igual ao seu valor privado (b = v), já que se ganhar paga ≤ v.

O caso de leilão selado de 1º lance não é tão simples:

O melhor seria ganhar o leilão com lance b < v, mas pagando o

mínimo possível: b apenas um pouco maior que o 2º maior bid.

Se der um lance muito baixo, a chance de ganhar diminui; se

der um lance muito alto, o payoff v – b é pequeno se ganhar.

Estratégia ótima: escolha b de forma a maximizar o payoff

esperado = probabilid. de vencer x payoff se vencer (= v – b).

Regra prática: presuma que você tem a maior valoração,

estime a 2ª maior valoração (v 2 ) e dê um lance b = v 2 .

Vickrey: Leilão de Segundo Maior Lance

Num leilão de valor privado, cada pessoa (tipo) avalia o bem

de forma diferente (e ninguém quer pagar mais do que vale).

Leilãoseladode segundo lance: ganha o envelope com o

maior lance, mas só paga o valor do segundo maior lance.

Vickrey em 1961 (logo, antes de Harsanyi em 1967/8

formular o equilíbrio Bayesiano, considerar tipos, etc.)

mostrou as estratégias ótimas para esse leilão:

Vickrey mostrou que dar um lance igual a quanto vale o bem para

cada tipo éumaestratégia dominante e independe do tipo.

Será ótimo p/ todos os jogadores revelar quanto realmente vale o bem p/

cada um (cada tipo irá dar um lance diferente) e ganha quem acreditar

que o bem é mais valioso. Ou seja, será ótimo “bidar” seu próprio valor.

Portanto, o leilão de 2º lance atende ao princípio da revelação.

Logo, esse leilão incentiva cada tipo a dizer a verdade sobre o valor

do bem e ganha quem mais está interessado no bem (é eficiente).

Com muitos tipos participando do leilão, no limite, o leiloeiro conseguiria

vender o bem pelo valor máximo (menos δ) do tipo com maior avaliação.

Vickrey: Leilão de Segundo Maior Lance

Vamos mostrar que é ótimo para cada pessoa (tipo) dar o lance

exatamente igual a quanto vale para ela.

Suponha que o objeto valha V θ para o tipo θ.

Será que existe algum incentivo para dar um lance maior ou menor?

Se o tipo θ der um lance V + > V θ então se ele ganhar o objeto (isto é, se V + >

V 2 onde V 2 éo segundo maior lance) podem ocorrer dois cenários:

V θ

V 2 V 2

V +

Se V 2 < V θ

então ele obtém a mesma utilidade V θ

− V 2

tanto com lance V + como V θ

Se V + > V 2 > V θ

então ele obtém utilidade negativa V θ

− V 2

com o lance V + e assim

ele estaria pior se desviando de V θ

. Logo ele não tem incentivo para desviar e jogar V +

Se o tipo θ der um lance V − < V θ então podem ocorrer dois cenários:

V 2

V −

V 2

V θ

Se V 2 < V − então ele obtém a mesma utilidade V θ

− V 2

tanto com lance V − como V θ

Se V − < V 2 < V θ

então ele não ganharia o objeto e estaria pior jogando V − pois ele

poderia ganhar com V θ

e obter utilidade positiva. Logo não há incentivo para jogar V −

Logo, jogar o seu valor V θ é equilíbrio separador dominante (Nash-Bayesiano).

MATERIAL

ANEXO

Os anexos nos materiais do curso contém slides que

reforçam os conceitos teóricos e/ou apresentam

exemplos adicionais que não serão discutidos em

sala de aula, mas que podem ser úteis para um

melhor entendimento de conceitos apresentados.

Websites Úteis

Existem muitos websites com materiais de teoria dos jogos.

Dois websites muito ricos em materiais e informação são:

http://www.gametheory.net/

http://plato.stanford.edu/entries/game-theory/

Experiência do professor em teoria dos jogos e jogos de OR:

Paper pioneiro em jogos de opções reais (1997, Dallas, EUA):

1º jogo de OR de guerra de atrito; 1º jogo de OR em petróleo).

Mais dois papers (esses com o Prof. José Paulo) em jogos de

OR, sendo um recém publicado e outro aceito para publicação.

Tese de doutorado: capítulo de jogos de OR. Ver capítulo 4 (e

aplicação no capítulo 5) do arquivo da tese em:

http://www.puc-rio.br/marco.ind/pdf/tese_doutor_marco_dias.pdf

Ministra curso de teoria dos jogos na Petrobras também, além de

usar em aplicações de teoria de jogos em parceiras da Petrobras.

Competição Imperfeita e Teoria dos Jogos

A ferramenta neo-clássica para análise de competição

imperfeita éa teoria dos jogos (“game theory”).

A teoria dos jogos ganhou o Nobel de Economia em 1994 com

Nash (equilíbrio básico), Harsanyi (equilíbrio com informação

incompleta) e Selten (equilíbrio perfeito em jogos dinâmicos).

Ganhou de novo em 2005 com Aumann (jogos repetidos e

cooperação) e Schelling (teoria do conflito e do “commitment”).

Aplicações da teoria dos jogos também ganharam o Nobel em

1996 (teoria dos incentivos com informação assimétrica) com

Mirrlees e Vickrey; em 2001 (teor. de mercados com informação

assimétrica) com Akerlof, Spence e Stiglitz; e em 2007 (teoria de

desenho de mecanismos) com Hurwicz, Maskin e Myerson.

A teoria dos jogos também permite analisar interações

estratégicas de cooperação entre as firmas.

Do ponto de vista da firma, a teoria dos jogos permite

modelar de forma endógena os efeitos da competição e

das oportunidades de cooperação.

História Resumida da Teoria dos Jogos

Veremos de forma resumida os principais fatos históricos.

Em 1913, Zermelo estabelece o 1º teorema da teoria dos jogos;

Década de 20: Borel, formulação de estratégias mistas e solução

minimax; John von Neumann provou o famoso teorema minimax.

1944: von Neumann & Morgenstern publicam o 1º livro de T. dos J.

1950-1953: Nash publica seus famosos artigos, com os conceitos de

equilíbrio de Nash em jogos não-cooperativos e a solução de Nash em

jogos cooper. de barganha. Inicia a era moderna da teoria dos jogos.

1960: Schelling publica seu famoso livro “The Strategy of Conflict”.

1965: Selten publica o paper sobre equilíbrio perfeito em sub-jogos.

1967-68: Harsanyi publica artigos sobre equilíbrio Nash-Bayesiano.

1972: Maynard Smith publica artigo sobre eq. evolucionário estável.

1994: Prêmio Nobel em Economia para Nash, Selten e Harsanyi.

2005: Prêmio Nobel em Economia para Aumann e Schelling.

2007: Prêmio Nobel em Economia p/ Hurwicz, Maskin e Myerson.

Para muito mais detalhes históricos, ver na internet:

http://www.econ.canterbury.ac.nz/personal_pages/paul_walker/gt/hist.htm

Forma Normal x Forma Extensiva

Duas formas extensivas podem ter a mesma forma normal. Exemplo:

Firma 1

A

B

(1; 2)

Firma 2

C

D

(3; 1)

(2; 4)

A

B

C

D

1; 2 1; 2

3; 1 2; 4

Reta tracejada:

firma 2 não sabe

em que nó está.

Firma 1

A

B

Firma 2

C (1; 2) Note que os jogos são diferentes:

na árvore de cima o jogador 2

sabe o que o jogador 1 jogou.

D Precisamos da forma extensiva.

(1; 2)

●Na árvore de baixo eu estou

(3; 1)

C

usando uma reta tracejada para

dizer que o jogador 2 não sabe em

D

que nó está (conjunto de

(2; 4) informação com dois nós).

Dilema dos Prisioneiros: Exemplos

A Tragédia dos Comuns (Hume, 1739): dois pescadores e um

único lago têm incentivo de fazer pesca predatória, embora o

melhor para ambos (Pareto ótimo) seja a pescaria leve:

Pescador 1

Estratégias

Pescaria Leve

Pescaria Intensa

Pescador 2

Pescaria Leve Pescaria Intensa

32, 32

28, 35

35, 28 30, 30

Se os cidadões responderem só a incentivos privados, os recursos

públicos serão demasiadamente depletados. Além disso, os bens

públicos não serão providos (ver a seguir) e isso justifica os impostos.

Bens Públicos: contribuição para uma construir uma ponte:

ninguém contribui se for opcional (que é pior para ambos).

Contribuinte 1

Estratégias

Contribui

Não Contribui

Contribuinte 2

Contribui Não Contribui

32, 32

28, 35

35, 28 30, 30

Características e Nomes das Estratégias

Contribuinte 1

Estratégias

Contribui

Não Contribui

Contribui

Contribuinte 2

Não Contribui

Dominância de Pareto: nenhum jogador está pior e pelo menos um

está melhor. Ex.: (32, 32) Pareto domina (30, 30).

(35, 28) domina (30, 30)? Não, pois 28 < 30.

(32, 32), (28, 35) e (35, 28) são ditos Pareto Ótimo, pois só se pode

melhorar o valor de um às custas do prejuízo do outro.

Desses o mais eficiente (maior ganho conjunto) é o (32, 32) que soma 64.

Free Rider (benefício grátis): No caso de (35, 28), dizemos que o

contribuinte 1 está sendo um free rider, pois tem o benefício da ponte

mas nada paga por ela.

Externalidade Negativa: o jogador 1 passando de pagante para nãopagante

gera uma externalidade negativa para o jogador 2, pois

reduz o valor do jogador 2, que arcará com uma maior contribuição.

Conflito individual x social. Sonegadores prejudicam os pagantes.

32, 32

28, 35

35, 28 30, 30

A Tragédia dos Comuns

Esse clássico da sociologia (Hume, 1739) é um caso

particular do dilema dos prisioneiros. Mostra o seguinte:

Se o “bolo” é comum, as pessoas (a maioria) são incentivadas a

contribuirem o mínimo possível e a tirarem o máximo proveito.

Caso clássico: a colônia de Plymouth (EUA, 1621) assinou um

contrato coletivo em que toda a produção era comum e entregue

para armazenamento comunitário, sendo que cada indivíduo

receberia uma fração igual, não importando a sua contribuição.

O resultado foi que a produção era insuficiente até para consumo

próprio: faltava comida, mas sobrava ócio e acomodação. Os

homens lamentavam ter de “trabalhar para a esposa e filho dos

outros”, sem ter recompensa. A experiência foi um fracasso.

Dois anos depois foi desfeito o contrato, cada família obteve a sua

própria terra e a comunidade teve estímulo e progrediu.

Como já dizia Aristóteles: “Aquilo que é comum ao maior

número despertará sobre si os menores cuidados”.

Ver artigo “A Tragédia dos Comuns” de João Mauad (O Globo,

julho de 2009) na pasta 72, para detalhes.

Competição com Projetos de P&D

Mesmo com apenas duas firmas no mercado

(duopólio), a competição pode ser muito intensa.

Em indústrias maduras, é freqüente a competição em

preços através de inovações de redução de custo.

O gasto em P&D para reduzir custos pode não ser Pareto

ótimo para as firmas, mas freqüentemente é a estratégia

dominante para ambas as firmas (dilema dos prisioneiros):

Firma 1

P&D

Não-P&D

P&D

20 ; 10 40 ; −10

−10 ; 30

Firma 2

Não-P&D

30 ; 20

A estratégia de P&D nesse

contexto cria barreiras de

entrada para novas firmas

interessadas nesse mercado.

Ocorre mais se a demanda

é mais elástica com o preço.

Uma alternativa ao P&D

(não analisada) é reduzir

custos com ganhos de escala.

Equil. de Nash: Jogo Batalha dos Sexos

Uma versão do jogo clássico da batalha dos sexos é:

Um casal tem de decidir o que fazer na sexta-feira à noite.

Eles concordam em ir ao cinema, mas ele prefere assistir

um filme de ação e ela prefere assistir um romance.

Ir ao cinema sozinho é o pior resultado (menor utilidade).

As utilidades são mostradas abaixo. Quais os EN do jogo?

ELE

Dica: ver as melhores respostas simultâneas dos jogadores.

ELA

Resposta:

Ação Romance Os EN em estratégias puras

são dois: {ação; ação} e

Ação 2; 1 0; 0

{romance; romance}. Tem

um EN em estratég. mistas

que é jogar uma estratégia

com probabilidade de 2/3

Romance 0; 0 1; 2 e a outra com prob. 1/3.

Ver slides seguintes.

Batalha dos Sexos: Solução em Est. Mistas

Sejam π 1

e π 2

as probabilidades com que ele e ela,

respectivamente, escolhem “filme de ação”.

O payoff esperado dele (Payoff 1

) será dado por:

2 π 1

π 2

+(1−π 1

) (1 −π 2

)=π 1

(3 π 2

− 1) +1−π 2

O payoff esperado dela (Payoff 2

) será dado por:

π 1

π 2

+2(1−π 1

) (1 −π 2

) = π 2

(3 π 1

− 2) +2 (1−π 1

)

Curvas de reação das firmas 1 e 2 (deriva e faz = 0):

∂Payoff 1 /∂ π 1 = 0 = 3 π 2 − 1 ⇒ π 2 = 1/3 ⇒ qualquer π 1 éótimose π 2 = 1/3

Se ela joga π 2 < 1/3, por ex. π 2 = 0, Payoff 1 = 1 − π 1 ⇒ ótimo: π 1 = 0;

Se ela joga π 2 > 1/3, por ex. π 2 = 1, Payoff 1 = 2 π 1 ⇒ ótimo 1 : π 1 = 1, etc.

⎧ 0 caso π 1

2

<

3

⎪

π

1

= ⎨qualquer valor entre 0 e 1 caso π

2

=

3

⎪

⎪1 caso π 1

2

>

⎩

3

⎧ 0 caso π 2

1

<

3

⎪

π

2

= ⎨qualquer valor entre 0 e 1 caso π1

=

3

⎪

⎪1 caso π 2

1

>

⎩

3

Batalha dos Sexos: EN em Estratégias Mistas

π 2

1

Equilíbrios

de Nash com

estratégias

puras

1/3

Curva de reação dela

Repare que as curvas de

reação não são funções.

Elas são correspondências.

Curva de reação dele

Equilíbrio de Nash

com estratégias

mistas.

2/3 1

Equilíbrios em estratégias mistas: três, sendo um não-degenerado,

que é ele jogar “ação” com 2/3 de probabilidade; e ela jogar

“ação” com 1/3 de probabilidade (⇒ ela joga “romance” com 2/3).

Esse caso resulta: {ação; ação} tem probab. 2/3 x 1/3 = 2/9 de ocorrer;

{romance; romance} tem 1/3 x 2/3 = 2/9; e irem sozinhos, probab. = 5/9.

π 1

Tópicos em EN em Estratégias Mistas

O valor de uma estratégia mista é o valor esperado dos

“payoffs” das relevantes estratégias puras randomizadas.

As probabilidades das estratégias mistas são resultados da análise

de equilíbrio. Elas não são exógenas (estimativas de estados da

natureza) e nem advindas de preferências dos jogadores.

Elas foram calculadas maximizando payoffs simultaneamente.

Essas probabs. são tais que fazem o outro jogador ficar indiferente

entre jogar as suas diferentes estratégias puras relevantes.

Nem sempre as probabilidades de estratégias mistas são intuitivas

já que não refletem características individuais e sim estratégicas.

A análise gráfica anterior é viável para o caso de dois jogadores

com duas estratégias cada. Mas pode-se usar métodos analítico ou

numéricos p/ obter os pontos fixos de melhor resposta simultânea.

Se há múltiplos EN em estrat. puras ⇒ há EN em estrat. mistas

com a randomização dos EN em estratégias puras.

Nesse exemplo tivemos três equilíbrios de Nash (EN).

Múltiplos EN: qual deles é o mais provável ou recomendável?

Veremos alguns refinamentos de EN que reduz o n o de equilíbrios.

Exercício sobre Estratégias Mistas

Mostre que o jogo do par ou ímpar com disputa de 1 R$

(ver início da parte 1) tem apenas um único EN em

estratégias mistas que é jogar σ* = (1/2 ; 1/2), onde o 1 o

termo é a probabilidade do 1 o jogador jogar um n o par e

o 2 o termo é a probabilidade do 2 o jogador jogar n o par.

Verifique que o EN em estratégias mistas não-degeneradas tem

a propriedade de fazer o outro jogador ficar indiferente entre

o que jogar.

Dica: siga os passos do jogo Batalha dos Sexos. Verificar que só

existe um ponto de cruzamento nas correspondências de melhor

resposta (cruzamento = simultaneamente melhor resposta).

Mostre que o EN seria exatamente o mesmo (1/2 ; 1/2)

se em vez de “disputa por R$ 1” fosse “aposta de R$ 1”, i.

é, se nos payoffs onde está “zero” fosse “− 1”.

Nesse formato, o jogo do par-ou-ímpar corresponde ao jogo de

soma zero “matching pennies” dos livros da língua inglesa.

Exemplo de Cournot: OPEP x Não-OPEP

Esse exemplo (e outro da OPEP a ser visto) é retirado do

livro do Dutta (Strategy and Games), publicado em 1999.

Assim, a análise foi feita no contexto de baixos preços do

petróleo na década de 90, quando sobrava petróleo no mercado.

Considere o jogo de quantidades no mercado de petróleo

em que temos dois jogadores: OPEP e Não-OPEP.

É uma aplicação do resultado de Cournot. Assuma a seguinte

curva de demanda linear: P(Q T ) = a – b (Q T ) = a – b (q O + q N )

Onde q O e q N são as produções da OPEP e Não-OPEP, respectivamente.

Note que o parâmetro “a” dá o preço máximo dessa função. No

livro o autor colocou a = 65 ($/bbl) refletindo os baixos preços da

época (em dez/98 o petróleo chegou a ficar abaixo de 10 $/bbl).

Ele usou b = 1/3, de forma que a demanda é: P = 65 – 1/3 (q O + q N ).

Assuma que (naquela época) os custos unitários de produção da

OPEP e Não-OPEP são, respectivamente de 5 e 10 US$/bbl.

Hoje esses custos seriam bem maiores. Depois iremos colocar

valores mais representativos da atualidade para ver o que ocorre.

Exemplo de Cournot: OPEP x Não-OPEP

Os lucros dos dois jogadores (receita – custos oper.) são:

O lucro da OPEP é: π O

= q O

[65 – 1/3 (q O

+ q N

)] – 5 q O

;

O lucro Não-OPEP é: π N

= q N

[65 – 1/3 (q O

+ q N

)] – 10 q N

As curvas de reação (melhor resposta) são obtidas com a CPO

(∂π O

/∂q O

= 0; e ∂π N

/∂q N

= 0) p/ maximizar esses lucros e são:

* 180 − qN

q

O(q N) =

se qN

≤ 180 (e zero caso contrário)

2

* 165 − qO

q

N(q O) =

se qO

≤ 165 (e zero caso contrário)

2

O cruzamento dessas curvas (retas) – ou substituindo

uma na outra – chega na solução de Nash-Cournot.

Com a solução q* O e q* N , é fácil obter o preço e os lucros:

OPEP

Não-OPEP

Quantidades

65 (MM bbl/d)

50 (MM bbl/d)

Preço (US$/bbl)

26,67

Lucro (MM $/d)

1.408,3

833,3

Exemplo de Cournot: OPEP x Não-OPEP

A planilha jogos da OPEP.xls permite (re)calcular o jogo.

Sabemos hoje que os custos subiram muito em relação à

década de 90 (~ 2 a 3 vezes), principalmente os não-OPEP.

Além disso, a curva de demanda é muito mais alta e por isso

o preço máximo está muito acima de 65 (já bateu em 79).

Vamos re-calcular o jogo usando os dados: a = 130; b = 1; e

custos marginais unitários c O = 12 $/bbl e c N = 30 $/bbl:

Quantidades Preço (US$/bbl) Lucro (MM $/d)

OPEP 45,3 (MM bbl/d) 57,33

2.055

Não-OPEP 27,3 (MM bbl/d) 57,33

747

Embora a soma das produções estejam próximas do ano de

2007 (~ 72,4 MM bbl/d), estão ~ invertidas as produções.

Existem restrições de capacidade não-consideradas aqui. Além

disso, só a OPEP tem algum comportamento estratégico. Os

países Não-OPEP se comportam como tomadores de preços.

O modelo de Cournot não se adapta bem nesse caso.

Demanda Residual e o Mercado de Petróleo

Em muitos casos podemos analisar o conflito de dois

competidores usando análise simplificada.

Imagine o mercado de petróleo com os produtores

sendo a firma 1, a firma 2 e o resto do mundo.

Assim, a produção da indústria é Q T

= q 1

+ q 2

+ q resto

.

Seja uma curva de demanda linear dada por:

p(Q T

) = a – b (Q T

) = a – b (q 1

+ q 2

+ q resto

).

Que pode ser re-escrito como uma demanda residual:

p(Q T

) = (a – b q resto

) – b (q 1

+ q 2

) ⇒

⇒ p(Q T

) = a´ – b (q 1

+ q 2

)

Assim, desde que se mantenha a produção do resto do

mundo constante, bastaria ajustar o parâmetro a da

função demanda. Mas essa é um abordagem simplificada.

A rigor, se mudar q 1 e/ou q 2 , q resto poderia se ajustar otimamente.

Jogo de Cotas da OPEP com Dois Países

Seja o seguinte jogo de quotas da OPEP (planilha

jogos da OPEP.xls , aba “quotas”) com demanda linear

residual dada por p = α − β (q A + q V ), onde:

α = 100; β = 5; as produções são q A (Arábia) e q V (Venezuela),

que podem produzir só as cotas ou acima. Sejam os custos

unitários c A = 12 $/bbl (Arábia) e c V = 20 $/bbl (Venezuela).

As cotas estabelecidas são 8 milhões de bbl/dia para a Arábia

Saudita e 2 milhões de bbl/dia para a Venezuela.

Caso esses países não respeitem as quotas, eles iriam produzir

um montante 25% acima das quotas: 10 MM bbl/d para a

Arábia Saudita e 2,5 MM bbl/d para a Venezuela.

Calcule o EN desse jogo considerando que a escolha da

quantidade produzida pelos países é simultânea.

Calcule também os preços do petróleo em cada possível resultado.

Se o mercado ficar mais aquecido e a demanda subir

(fazendo α = 120). Qual o novo EN? Por que mudou?

Jogo de Cotas da OPEP com Dois Países

No primeiro caso, a planilha destaca o EN e mostra os

resultados de payoffs (em milhões US$/dia), preços:

Analisando o jogo vemos que ambos os países têm uma

estratégia dominante. A estratégia da Arábia Saudita é

sempre cooperar (produzir só as cotas) e a da Venezuela

é sempre trair a OPEP (produzir acima das cotas).

Aqui a Arábia sempre coopera por puro interesse próprio!

Jogo de Cotas da OPEP com Dois Países

No exemplo numérico anterior os preços estiveram na

faixa de 37,5 a 50 US$/bbl. Veremos agora o que ocorre

se a demanda estiver mais aquecida (α = 120):

Vemos que ambos os países têm estratégias dominantes,

mas agora para ambos os países essa estratégia é sempre

não-cooperar (produzir acima das cotas).

Note que obtemos um esquema de dilema dos prisioneiros: o

melhor para ambos (Pareto ótimo) seria obedecer as quotas!

Jogo de Cotas da OPEP com Dois Países

A mudança de EN ocorreu porque agora, com a maior

demanda (α = 120), a produção extra obtém preços

maiores e a Arábia passa a ter incentivo de não-cooperar.

Como é praxe de jogos não-cooperativos, a cooperação pode

emergir como resultado apenas se for equilíbrio.

Em jogos repetidos, a cooperação da OPEP pode emergir se os

membros usarem estratégias de punição (será visto).

Exercício 1: mostre que para uma demanda intermediária

com α = 114,5 existem dois EN em estratégias puras.

Exercício 2: seja o caso original (com α = 100, etc.), mas

tendo a Venezuela um custo bem maior c V = 38 $/bbl.

Mostre que nesse caso o único EN é {cooperar ; cooperar} e

esse equilíbrio também é em estratégias dominantes p/ ambos.

⇒ O resultado desse jogo depende da demanda, custos, etc.

Discutiremos agora modelos de escolha ótima de quantidades

(Cournot) de um range contínuo de possíveis quantidades.

Duopólio de Cournot: Caso com Custo Fixo

Seja a função demanda linear: p(Q T

) = a − b Q T

Seja o caso mais geral de custo operacional C i (q i ).

Por simplicidade assuma que ∂ 2 C i /∂q i2 = 0 (função linear, tem

custo variável e um custo fixo constante) e ∂C i /∂q j = 0 p/ i ≠ j (a

produção da firma i não influencia o custo da firma j).

A CPO e as resultantes curvas de reação são dadas por:

O EN-Cournot é o par {q 1 *(q 2 *); q 2 *(q 1 *)} obtido pela

substituição de uma curva de reação na outra, que dá:

Exercícios sobre EN-Cournot

O que ocorre se uma das firmas investe em P&D para

reduzir seus custos a fim de ter maior competitividade

em quantidades (Cournot)?

Diga o que ocorreria na curva de reação, no lucro de cada

firma, nas quantidades em equilíbrio e no preço.

Resolva o problema anterior sem custo fixo, mas com

custo variável quadrático: c i (q i ) = q i2 .

Resolva agora com o custo variável linear anterior, mas

com custo fixo f i > 0 e com q i > 0.

Dilema dos Prisioneiros e Jogos Cooperativos

Todo jogo não-cooperativo pode ser transformado

num jogo cooperativo (embora nem sempre seja

prático, legal ou ético), com a função característica.

A conversão de qualquer jogo não cooperativo com N-

jogadores para a forma de coalizão (função característica),

é devido a von-Newman & Morgenstern (1944).

No caso anterior, as coalizões seriam de um ou de

dois jogadores com a seguinte função característica:

C(1) = C(2) = 4; C(1; 2) = 12.

A coalizão de só um jogador teria o resultado do jogo nãocooperativo,

que no caso é o mínimo que cada jogador

pode receber. A coalizão de dois jogadores tem valor igual

ao máximo payoff conjunto que a coalizão pode obter.

Nesse caso o maior valor é 6 + 6 = 12 > 10 + 0 > 4 + 4.

Em jogos repetidos a cooperação pode emergir como

equilíbrio de um jogo não-cooperativo (a ser visto).

Forma de Coalizão & Jogos Cooperativos

Coalizão é quando um grupo de jogadores se coordenam

em torno dum objetivo comum visando ter maior poder.

Quando são firmas que deviam competir na economia, é ilegal

ou anti-ético e a coalizão é chamada de colusão coordenada.

Em outros contextos (ex.: partidos políticos numa eleição ou

votando uma lei) não é ilegal e (geralmente) nem anti-ético.

Jogos cooperativos em forma de coalizão se dividem em:

Jogos com utilidade transferível (TU), em que existe uma regra

simples qualquer de divisão da utilidade em cada coalizão S.

Também são chamados de jogos com “side payments” (pagamentos

laterais) e são mais simples e mais analisados do que os jogos NTUs:

Jogos com utilidade não-transferível (NTU), em que não existe

uma regra simples de divisão da utilidade e sim p/ cada S um

vetor s j -dimensional de funções payoff p/ cada S com s j players.

Veremos um exemplo simples de jogo TU: votação com N = 3

jogadores (= eleitores), para ilustrar a forma de coalizão.

Jogos Cooperativos TU. Ex: Votação

Seja um jogo eleitoral (cooperat. TU) em que os eleitores

(jogadores) têm várias possibilidades (candidatos a votar).

Os eleitores podem se associar, i.é, formar coalizões (em torno

dum candidato). Ganha a eleição a coalizão S que tem mais

eleitores. Seja uma eleição com N = 3 eleitores (jogadores).

Seja a função característica C(S), com a normalização:

“Grande coalizão” C(N) = 1. Para cada jogador i, C({i}) = 0.

Além disso, C(S) = 1 se a coalizão S vencer e C(S) = 0 se S perder.

A forma de coalizão no jogo TU especifica {N = 3; C(S)}, onde:

C(S)

⎧ 0 se # S < 2

= ⎨

⎩ .1 se # S ≥ 2

Esse tipo de jogo tem grande relevância em sociologia,

mas menos importância em economia.

Em termos de jogos cooperativos, os mais importantes p/

a economia são os jogos de barganha cooperativa.

Oligopólio e Colusões: Equilíbrio de Coalizões

Uma literatura que vem crescendo é a que combina

jogos cooperativos com jogos não-cooperativos.

Nela se discute competição entre coalizões, saídas de membros

de uma coalizão para entrar em outra (e o que ocorrerá com a

coalizão rejeitada) e equilíbrio entre coalizões.

O seguinte exemplo usando o oligopólio de Cournot p/ 3

firmas homogêneas é discutido no livro de Ray (A Game-

Theoretic Perspective on Coalition Formation, 2007).

Para facilitar a análise, seja K = (a – c) 2 /b. O lucro da firma i é:

2

(a − c)

K

π

i

= ⇒ π

2 i

=

2

(N + 1) b ( N + 1)

Sem acordo (sem colusão) o lucro de cada uma é de π i = K/16.

Se as três firmas entram em colusão (N = 1), o lucro da

coalizão é π total = K/4. Nesse caso, qualquer que seja a regra de

divisão da colusão, pelo menos uma firma não ganharia mais

do que π i = K/12. Esse valor é maior que sem colusão (K/16).

Oligopólio e Colusões: Equilíbrio de Coalizões

Será que existe incentivo para uma firma desviar da

colusão? Seja o caso de uma firma saindo da colusão:

Nesse caso é como se tivesse duas firmas no mercado (N = 2), a

firma que desviou (i = 1) e a coalizão de duas firmas (j = 2 + 3).

Nesse caso, π 1 = π 2+3 = K/9. Para a firma 1 isso parece atrativo,

pois K/9 > K/12 e assim parece haver incentivo para desviar.

Mas nesse caso pelo menos uma das firmas da coalizão de duas

firmas teria um lucro não maior do que D/18. Esse valor é

menor do que ela obteria também saindo da coalizão (K/16).

Assim, se uma firma deixar a coalizão de três firmas, o ótimo será

a quebra total da colusão, ficando as três firmas produzindo de

forma competitiva (separadas) e lucrando cada uma K/16.

Assim, na análise de equilíbrio da coalizão de 3 firmas, não é

ótimo para a firma 1 desviar, pois ela deverá antecipar que a

coalizão restante seria desfeita e assim em vez de payoff de

colusão igual a K/12, ela obteria no final apenas K/16.

Logo, a colusão de três firmas é estável (coalitional equilibrium).

Equilíbrio de Coalizões e Função Partição

No exemplo anterior vimos que a função característica é

insuficiente para descrever a competição entre coalizões.

No caso da coalizão de duas firmas temos de dizer não só o

payoff da coalizão de 2 (função característica) como também o

payoff da firma que está fora da coalizão.

Essa descrição mais completa é chamada de função partição.

Exercício (livro do Ray, pgs. 18-19, “Bens Públicos”):

Analizar a estabilidade das coalizões e mostre que uma firma

terá incentivo de deixar a grande coalizão (de 3 firmas), mas as

outras duas firmas não terão incentivos de dissolver a coalizão

de duas firmas restantes (ao contrário do caso anterior).

A função partição é (ver a

planilha public_goods.xls):

Jogos Estritamente Competitivos & Soma Zero

Jogos de soma fixa (de payoffs) são chamados de jogos

estritamente competitivos, pois um jogador só aumenta o

seu payoff se houver uma redução no payoff de outro.

O resultado desses jogos são sempre Pareto eficiente, pois só se

pode melhorar o payoff dum jogador se piorar o de outro.

Uma classe particular é a classe dos jogos de soma zero. Mas

muitos autores chamam os jogos de soma fixa de jogos de soma

zero. Aqui usaremos os dois termos de forma intercambiável.

Jogos estritamente competitivos se tem um “vencedor” e

um “perdedor”. Exs.: xadrêz, pôquer, futebol, etc.

Esses jogos tem pouca importância em economia, já que a

maioria dos jogos na economia são jogos de soma variável.

Minimax (ou minmax) é um método da teoria da decisão

tradicional para minimizar a máxima perda possível.

Também pode ser visto como a estratégia de punir um outro

jogador, minimizando o máximo que o outro pode obter.

Jogos de Soma Zero, Maximin e Minimax

Em jogos estritamente competitivos com 2-jogadores,

minimizar o payoff adversário equivale a maximizar o

seu próprio payoff. Assim, a matriz de jogos pode ter

apenas uma entrada de payoff (do jogador 1), em que:

O jogador 1 tenta maximizar o seu payoff e o jogador 2 tenta

minimizar esse payoff (⇒ maximizando o seu próprio payoff).

Dado o que o adversário está fazendo, a estratégia de segurança

do jogador 1 é maximizar o conjunto de seus payoff mínimos

(estratégia maximin), enquanto que para o jogador 2 ela é a de

minimizar o conjunto de máximos de 1 (estratégia minimax).

Assim, podemos definir estratégias maximin e minimax:

● O equilíbrio do jogo (s*1; s*2) é

Máx Mín v

1(s 1, s

2)

obtido resolvendo o problema:

s1∈S1

s2 ∈S2

Máximo v (s , s *)

Mín Máx v (s , s )

s

∈S

s ∈S

2 2 1 1

1 1 2

s ∈S

1 1

1 1 2

Mínimo v (s *, s )

s

∈S

2 2

1 1 2

Estratégias MiniMax & Maximin

O teorema minimax de John von Neumann (1928) diz:

Admitindo estratégias mistas, a estratégia minimax sempre existe

em jogos de soma zero com dois jogadores e é única.

As estratégias minimax e maximin surgiram na análise

de jogos de soma fixa, mas podem ser usadas em jogos de

soma variável. Mas o eq. de Nash é muito mais aceito.

Nos jogos de soma variável, em economia, estrat. minimax só

tem algum interesse como estratégias de punição em jogos

repetidos, a fim de forçar a cooperação dos jogadores.

O payoff minimax m i é o menor payoff que os rivais do jogador i

podem impor ao jogador i. É uma punição mais severa do que o EN.

O jogador i se defende jogando a estratégia maximin.

Como observa Rasmusen no seu livro de teoria dos jogos:

Nos jogos de soma variável, a estratégia minimax é para

sádicos e a estratégia maximin é para paranóicos!

Em jogos de soma zero, a estratégia minimax ép/ neuróticos

otimistas e a estratégia maximin p/ neuróticos pessimistas!

Simplex de Três Jogadores

Em topologia, simplex é um invólucro convexo no R n .

No caso de 3 estratégias puras ele é um tetraedro no 3 com 4

pontos: (0, 0, 0); (1, 0, 0); (0, 1, 0) e (0, 0, 1). Ver a figura.

Os valores são normalizados: os valores do gráfico podem ser

interpretados como percentagens. Assim é usado para

estratégias mistas (probabilidades alocadas p/ cada estratégia).

Em muitas aplicações só interessa o plano eficiente que dá o

payoff máximo: plano x 1 + x 2 + x 3 = 1.

Por isso pode-se trabalhar no R 2 com esse triângulo eficiente.

x 3

x 1

x 2

Fonte: Wikipedia

Curva de Demanda Linear e Lucro

O mercado de um produto qualquer tem uma curva de

demanda p = f(q), onde p é o preço e q a quantidade total

demandada. Suponha uma curva de demanda linear.

a

p

p = a − bq

β

Assuma que a = 16 + c , onde c é o custo unitário do produto

(⇒ margem = p − c) e suponha b = 1 (⇒ β = 45 0 )

Função lucro π é a margem vezes as vendas: π = (p − c) q

Logo, π = (a − bq − c) q = (16 - q) q ⇒ π = 16 q − q 2

q

Competição Perfeita e Monopólio

Na competição perfeita, as firmas são tomadoras de preço e

irão produzir com margem igual a zero, isto é, p = c . Logo, a

quantidade produzida em competição perfeita será:

c = a − bq ⇒ a − c = bq ⇒ 16 = 1 . q ⇒ q = 16

No caso de monopólio, isto é, com apenas uma firma no

mercado, o monopolista irá produzir de forma a maximizar

o lucro. Logo a quantidade produzida em monopólio será tal

que maximiza o lucro π = 16 q − q 2 :

Condições de maximização:

∂π = 0 ; e

∂ 2 π

∂q

∂q < 0 2

∂π = 16 − 2q = 0 ⇒ q = 8

Conclusão

∂q

Competição produz 16

∂ 2 π

∂q = − 2 < 0 (logo é um máximo) Monopólio produz 8

2

Cournot com Função Demanda Genérica

Para uma curva de demanda inversa genérica p(Q) com

N ≥ 1 firmas de mesmo custo variável c e custofixo= 0,

a condição de primeira ordem (CPO) é dada por:

p’(Q*) (Q*/N) + p(Q*) = c

Para N = 1 temos o caso de monopólio.

Quando N → ∞temos o caso de competição perfeita com p = c.

Além da CPO, depois deve-se verificar a existência ou não de

solução de canto, i. é, com q i = 0.

Cournot permite também ser visto de forma dinâmica:

Se um par de estratégias iniciais não é EN, então os desvios

seqüenciais de cada jogador para a sua curva de melhor

resposta dado o que o outro jogou, converge para o único EN-

Cournot.

Competição de Curto-Prazo: Quantidade x Preços

A competição de curto-prazo com quantidades (Cournot)

supõe que o preço resulta do balanço oferta x demanda.

É como se existe um leilão do produto. Mas quem é o leiloeiro?

Parece mais natural as firmas escolherem preços no curto-prazo.

A primeira tentativa de modelar a competição por preços

foi de Bertrand (1883), na crítica ao livro de Cournot.

Ele argumentou que seria mais provável que a competição

entre as firmas fossem em preços e não em quantidades.

Mas quando uma firma pensa em reajustar preços, deve levar

em conta que a outra firma também pode reajustar o preço.

Ex.: a IBM tem de decidir que preço cobrar de seus “personal

computers”, levando em conta a reação das rivais Dell e HP.

O que diferencia a competição de preços dos casos de monopólio e

competição perfeita, em que essa interação estratégica não existe.

Veremos o modelo clássico de Bertrand de duopólio simétrico.

Esse modelo de duopólio leva a resultados de competição perfeita.

Duopólio de Preços de Bertrand

Como em Cournot é um jogo simultâneo de curto-prazo,

mas as estratégias de Bertrand são preços p i ∈ S i = [0, ∞).

Encontraremos um equilíbrio de Nash totalmente diferente!

As premissas fundamentais do duopólio de Bertrand são:

1) As firmas vendem o mesmo produto (produto homogêneo) e só

têm custos variáveis que são iguais c 1 = c 2 (firmas homogêneas);

2) Se uma firma cobrar um preço menor que a rival, ela obterá

toda a demanda do produto e terá capacidade de atendê-la; e

3) Cobrando preços iguais, cada firma leva a metade da demanda.

A premissa crítica é a segunda, pois supõe não haver restrição

de capacidade, podendo uma só firma atender todo o mercado.

Para calcular o(s) EN-Bertrand do jogo, note que numa

competição “guerra de preços”, o preço tem dois limites:

Limite inferior éo custo c: não é ótimo p < c (teria prejuízo); e

Limite superior éo preço de monopólio p M : ótimo p/ 1 firma.

Pois é razoável supor que os lucros são tais que 0 ≤ π 1 + π 2 ≤π M .

Duopólio de Preços de Bertrand

Para determinar o EN temos de traçar as curvas de

reação das duas firmas, pois o preço ótimo da firma 1

depende do preço cobrado pela firma 2 (ver gráfico):

Demanda da firma 1 ⎧ Q(p ) se p < p

(descontínua):

q (p , p ) se p p

⎪ 2

⎪⎩ 0 se p > p

Problema:

Máx π = (p −c) q (p , p )

p1

1 1 2

⎪ Q(p

1

)

1 1 2

= ⎨

1

=

2

1 1 1 1 2

1 2

Se a firma 2 joga p 2 ≤ c, a melhor

respostadafirma 1 ép 1 = c.

‣Preços menores dariam prejuízo e

preços maiores não venderiam nada.

Se a firma 2 jogar p 2 ∈ (c, p M ], o

melhor é jogar p 1 apenas um pouco

menor que p 2 e ter todo o mercado.

‣Preços iguais dividiriam o mercado e

preços maiores não venderiam nada.

Se a firma 2 jogar p 2 > p M , o melhor é

jogar p 1 = p M e ter todo mercado.

‣ Preço p 1 tal que p M

o mercado tb., mas com menor lucro.

Duopólio de Preços de Bertrand

Como as firmas são homogêneas, o problema é simétrico

em relação à reta de 45 o . Assim, plotando no mesmo

gráfico a curva de melhor resposta da firma 2, p 2 *(p 1 ):

O único ponto de cruzamento,

i. é, melhor resposta simultânea,

é o ponto {p 1 = c; p 2 = c}, que é

o único EN-Bertrand.

Assim, o único equilíbrio de

Nash é cada firma escolher um

preço igual ao custo marginal.

Logo, no EN-Bertrand o lucro

operacional de cada firma é zero.

O resultado equivale ao do obtido

no caso de mercado em competição

perfeita, mas com só duas firmas!

Duopólio de Preços de Bertrand

Em resumo, o único EN desse jogo é ambas as firmas

jogarem preço = custo como na competição perfeita

(mas só tem duas firmas no mercado!)

Note que se uma das firmas não jogar p 1 = p 2 = c, existe

incentivo para a outra desviar (não seria EN), pois:

Se p 1 = p 2 > c , a firma 1 ou a firma 2 desvia para p i −ε;

Se p 1 > p 2 = c , a firma 2 desvia para p 2 + ε;

Se p 1 > c > p 2 , a firma 2 desvia para p 1 −ε;

Se c > p 1 > p 2 , a firma 1 ou a firma 2 desvia para c;

Se p 1 > p 2 > c , a firma 1 desvia para p 2 −ε; e

Se p 2 > p 1 = c , a firma 1 desvia para p 1 + ε.

Exercício: Mostre que não há EN em estratégias puras na

competição com preços num produto homogêneo se o custo

marginal (constante) de uma firma for maior que a da outra.

Os Paradoxos de Bertrand

O fato da presença de apenas mais uma única firma ser

suficiente para passar de monopólio para competição

perfeita com firmas tendo lucro zero é difícil de acreditar.

Isso é chamado de paradoxo (clássico) de Bertrand.

Um outro paradoxo é por que uma firma entraria nessa

indústria se o lucro operacional é igual a zero?

Além disso, suponha que existe algum custo fixo de entrar no

mercado ou produzir. Então se uma firma entrar (monopólio)

a outra firma não irá entrar (pois não pagaria o custo fixo).

Logo, mesmo um pequeno custo fixo (de produção ou de entrada)

é barreira suficiente para o mercado ser um provável monopólio!

Um paradoxo relacionado ao clássico é que o preço de

equilíbrio independe da quantidade de firmas no mercado.

No caso de N > 2 firmas homogêneas competindo em preços

(Bertrand), mostra-se que o único EN é todos jogarem p i = c.

Soluções dos Paradoxos de Bertrand

A 1 a proposta de solução p/ o paradoxo de Bertrand foi

de colocar restrições de capacidades (Edgeworth, 1897).

A premissa de que reduzindo um pouco o preço se obtém todo

o mercado é muito forte na maioria dos casos. Exemplo:

Imagine uma pequena cidade com dois hotéis. Como o número de

quartos é fixo por hotel, uma guerra de preços não teria lógica

pois um hotel não poderia absorver toda a demanda.

Com restrição de capacidades, passa a ser ótimo um preço p i > c.

Produtos diferenciados: outra solução é que os produtos

das firmas geralmente não são totalmente homogêneos.

Por ex., a firma que vende um software não tem restrição de

capacidades, mas geralmente tem alguma diferenciação: p i ≠ p j

Dinâmica da competição e/ou incerteza na demanda.

As firmas geralmente não se encontram apenas uma vez no

mercado, como assume o modelo. Elas jogam jogos repetidos e

existe a ameaça de punição que pode levar a cooperação p i > c.

Incerteza na demanda também pode levar a p i > c (livro do Shy).

Dois Estágios: Cournot + Bertrand = Cournot

O paper clássico de Kreps & Scheinkman (1983) mostra

o caso em dois estágios em que as firmas escolhem

capacidade (Cournot) no primeiro estágio e então

seguem uma competição de preços de Bertrand.

O primeiro estágio pode tanto ser visto como o de investimento

em capacidades como o de acúmulo de estoques.

Em muitos casos é um estágio necessário antes de ir ao mercado.

No segundo estágio as quantidades não podem alteradas (logo,

restrição de capacidade) e as firmas escolhem preços.

Eles mostram que o resultante equilíbrio de Nash (perfeito

em subjogos, a ser visto) é os jogadores escolherem as

quantidades e os preços iguais ao de Cournot em 1 estágio!

Os autores concluem que “Com premissas brandas sobre a

demanda, o único equilíbrio resultante é o de Cournot”.

Modelos de Cournot, Bertrand, etc., são mais detalhados

em bons livros de organização industrial (Tirole, Shy, etc.)

Bertrand com Restrição de Capacidade

Considere que as firmas têm capacidade limitada, de

forma que no máximo produzem q 1máx = k 1 e q 2máx = k 2 .

Para a firma 1, se ela jogar os preços para baixo, não irá obter

todo o mercado e sim k 1 . Se ela jogar os preços acima, p 1 > p 2 , ela

não perde todo o mercado, pois a firma 2 no máximo produz k 2 .

A figura ilustra essa idéia, onde c = custo unitário marginal:

p

p(k 2 )

p = c

demanda atendida

pela firma 2

Digamos que a firma 2 atenda as k 2

primeiras unidades demandadas.

A firma 1 tem incentivo p/ desviar

de p* = c, pois poderia jogar um

preço p 1 > c e obter lucro positivo

(em vez de lucro = 0 com p = c)

A firma 2 não pode “roubar” o

mercado jogando p = c, pois não

teria capacidade de atendê-lo.

p 1

k 2 vendas da firma 1

Q T

Cournot + Bertrand = Cournot

A demonstração do modelo de Kreps & Scheinkman não

é simples e envolve conceitos ainda a serem vistos.

Entretanto iremos mostrar a idéia com um exemplo simples.

Seja um curva de demanda dada por p = 10 – Q T e c 1 = c 2 = 1.

Usando as equações vistas, a produção em Cournot é q 1 = q 2 = 3.

No primeiro estágio as firmas investem em capacidades.

Suponha que por algum motivo tenham escolhidos investir

numa capacidade de produzir a quantidade de Cournot q* = 3.

No segundo estágio do jogo as firmas irão escolher preços, mas

com restrição de capacidade. Vimos que nesse caso as firmas

têm incentivos para desviar da escolha clássica de p Bertrand = c.

Iremos mostrar que eles escolherão p = p(k 1 + k 2 ) como EN,

onde k 1 = k 2 = 3 (= q*), devido à restrição de capacidade.

Se no 2º estágio é ótimo jogar um preço p(k 1 + k 2 ), então temos

de verificar qual o ótimo no 1º estágio em que se escolhe a

quantidade. Mas isso é exatamente o problema de Cournot já

visto, i. é, de maximização de lucros escolhendo quantidades!

Cournot + Bertrand = Cournot

Provaremos que a escolha ótima de preços no 2º estágio

é p 1 = p 2 = p Cournot = $ 4 [pois p Cournot = 10 – (3 + 3)].

Se a firma 1 atende os 1 os três consumidores, então a curva de

demanda residual p/ a firma 2 (após a produção da firma 1) é:

p = 10 – (q 1 + q 2 ) ⇒ p = 10 – (3 + q 2 ) ⇒ p = 7 – q 2 . Ou q 2 = 7 – p.

Só será ótimo a firma 2 desviar na escolha de preço se isso

aumentar o lucro dela. Sua função lucro Π 2 (p 2 ) é dada por:

Π 2 (p 2 ) = p 2 q 2 –c 2 q 2 ⇒Π 2 (p 2 ) = p 2 (7 – p 2 ) –1.(7 –p 2 ) ⇒

⇒Π 2 (p 2 ) = 7 p 2 –p 22 – 7 + p 2 ⇒Π 2 (p 2 ) = 8 p 2 –p 22 –7

Usa-se a CPO p/ maximizar o lucro escolhendo p, ∂Π 2 / ∂p 2 = 0:

∂Π 2 / ∂p 2 = 0 ⇒ 8 – 2 p 2 = 0 ⇒ p 2 = 4, que é exatamente o preço

obtido quando se joga a quantidade de Cournot!

Por simetria, o mesmo vale para a firma 1 (não é ótimo desviar).

Intuição: preços menores não aumenta as vendas, só obtém

menos receita p/ o mesmo q. Preços maiores diminui a demanda e

mesmo com maior margem, o lucro por vender menos é menor.

Notas sobre Cournot + Bertrand = Cournot

A idéia do exemplo ilustrativo foi mostrar que p(k 1 + k 2 )

para os jogadores é EN por não valer a pena desviar.

Foi colocada a curva de demanda residual para a firma 2

apenas para analisar se tinha vantagem a firma 2 desviar de

forma unilateral, i. é, mantendo fixa a estratégia da firma 1.

Por definição, demanda residual da firma 2 é quando fazemos a

demanda da firma 1 fixa. Por isso pode-se ver desvio unilateral.

A curva de demanda residual não assume que a firma 1 jogou

primeiro (atendendo k 1 ) e depois a firma 2 jogou atendendo a

demanda restante. O jogo é simultâneo (não é sequencial).

A análise do EN é: as firmas estão jogando um preço tal

que está sendo demandado k 1 + k 2 . Esse preço é p(k 1 +

k 2 ). Vale a pena de forma unilateral cobrar outro preço?

Preço menor só reduz a receita da firma 2 por estar no limite

da capacidade (não consegue vender mais).

Preço maior da firma 2 vende menos que k 2 e usando demanda

residual vimos que ela maximiza o lucro com p preço p(k 1 +k 2 ).

Existência de Equilíbrio de Nash

Existência de EN: todo jogo tem pelo menos um EN se:

1) Puder jogar estratégias mistas e se há um número finito de

estratégias puras no conjunto de estratégias de cada jogador

Senão, o jogo do par ou ímpar e outros tais como o leilão que

todos pagam (“all-pay auction” a ser visto) não teriam equilíbrio.

2) Caso o jogo só permita estratégias puras, a existência de

EN só é garantida em certas condições.

Por ex., com conjuntos S i , ∀i, tendo um contínuo de estratégias

(infinitas estratégias, ex.: quantidades no modelo de Cournot).

Mais precisamente, EN em estratégias puras existe se para

todos os jogadores i, o conjunto de estratégias S i é nãovazio,

convexo e compacto e a função payoff v i (s 1 , … s I ) é

contínua em (s 1 , … s I ) e quase-concava em s i .

São condições suficientes (garante EN), mas não necessárias.

Ver apêndices matemáticos do livro MWG: M.C.3 (p. 933, função

quase-concava); M.F (p.943, conjunto compacto = conjunto

limitado e fechado); M.G (p.946, conjunto convexo).

Existência de Equilíbrio de Nash

Para provar isso veremos uma definição alternativa de EN

usando o conceito de ponto fixo de uma correspondência.

Correspondência: conceito generalizado de função. Associa a cada

ponto x um conjunto de pontos e não um único ponto y. MWG: p. 949

Ponto fixo: Dada uma função ou correspondência f: A → A

(conjunto A nele mesmo), o vetor x ∈ A é ponto fixo de f(.) se:

x = f(x) em caso de função e x ∈ f(x) em caso de correspondência.

Ver apêndice matemático M.I, do livro MGW, p. 952.

Teorema do ponto fixo de Brouwer:

Seja f: S → S uma função contínua de

um conjunto não-vazio, compacto e

convexo S ⊂ R n nele mesmo. Então

existe um x* ∈ S tal que x* = f(x*), i.

é, existe um ponto fixo x* da função f.

Figura: S é o intervalo [0, 1], por ex.,

probabilidades de estratégias mistas.

Tem 3 pontos fixos (corta reta f(x) = x)

Figura: Wikipedia

Existência de Equilíbrio de Nash

No caso mais geral temos correspondências e usa-se o

teorema do ponto fixo de Kakutani:

Seja ϕ : S → S uma correspondência superior hemi-contínua de

um conjunto não-vazio, compacto e convexo S ⊂ R n nele

mesmo tal que para todo x ∈ S, o conjunto ϕ(x) é convexo e

não-vazio. Então existe um x* tal que x* ∈ ϕ(x*), i. é, existe um

ponto fixo x* pertencente à correspondência ϕ(.).

Figura: cepa.newschool.edu

EN como Ponto Fixo de Correspondência

EN são matematicamente equivalentes aos chamados

pontos fixos das correspondências de melhor resposta.

No caso do EN-Cournot, vimos que q 1 * = f(q 2 *) e q 2 * = g(q 1 *).

Logo, temos um ponto fixo no EN: q 1 * = f(g(q 1 *)) = h(q 1 *).

No caso mais geral usa-se correspondência, pois mais de uma

estratégia pode ser melhor resposta a uma certa estratégia.

Assim, podemos definir o EN também como ponto fixo:

Seja R i (s 1

, s 2

, … s N

) a correspondência de melhor resposta do

jogador i contra s −i . O perfil de estratégias s = (s 1

, s 2

, … s N

) é

equilíbrio de Nash de um jogo se, p/ todo jogador i = 1, …, N:

s i

* = R i (s 1

*, s 2

*, … s N

*)

A equação acima deixa claro que um EN é um ponto fixo dessa

correspondência de melhor resposta. Uma intuição:

Se iniciarmos com um perfil de estratégias que seja um EN e

aplicarmos na correspondência de melhor resposta para todo i,

então permaneceremos fixos nesse ponto (obtém o mesmo perfil).

EN como Ponto Fixo: Exemplo em Cournot

Dizemos que se iniciarmos com um perfil de estratégias

que seja um EN e aplicarmos na correspondência de

melhor resposta para todo i, então permaneceremos

fixos nesse ponto (obtém o mesmo perfil). Exemplo:

No caso do duopólio de Cournot com demanda linear e sem

custo fixo, vimos que as curvas de melhor resposta são:

Funções melhor

a−c 1

− b q2

a−c 2

− b q1

q(q)

1 2

= q(q)

2 1

=

resposta (reação):

2b

Se substituirmos q 2 (q 1 ) em q 1 (q 2 ) iremos obter q 1* = f(q 1* ):

*

⎛a−c 2

− b q ⎞

1

a−c 1

− b ⎜ ⎟

*

2b 2a −2c 1− a + c

2

+ b q1

q

1

=

⎝

⎠

=

2b

4b

Assim q 1 é uma função de q 1 , i. é, q 1 = f(q 1 ). Se na expressão

acima chutarmos no lado direito um valor de q 1* que seja EN,

então o valor de q 1 obtido do lado esquerdo é o mesmo q

*

1

chutado. Logo, se chutarmos um EN, temos um ponto fixo.

Exemplo de Ponto Fixo de Correspondência

No jogo “batalha dos sexos” foi contruído um gráfico

para determinar o equilíbrio em estratégias mistas que

ilustra o EN como ponto fixo de correspondências de

melhor resposta.

π 2

1

Correspondência do jogador 2: π 2 *(π 1 )

Correspondência do jogador 1: π 1 *(π 2 )

1/3

EN em estratégias

mistas: um dos três

pontos fixos π 1 *(π 2 *)

2/3

π 1

Exercício de Jogos Repetidos: Cournot

Seja o estágio-jogo G uma competição em quantidades de

Cournot, num mercado com demanda P(Q) = a − b Q e

jogadores com os mesmos custos marginais c.

Mostre que num jogo G repetido infinitamente, existe

algum fator de desconto δ ∗ , tal que se δ ≥ δ * então:

Pode ser sustentado num ENPS o payoff de colusão obtido com

cada firma produzindo a metade da quantidade de monopólio

q M e cada firma usando a seguinte estratégia “grim”:

‣ Produzir q M / 2 no primeiro período. No período t continuar

produzindo q M / 2 se ambas as firmas tiverem produzidos q M / 2

nos t − 1 períodos anteriores. Caso contrário produzir a

quantidade do EN-Cournot q C .

Determine o valor de δ * (o que também prova que ele existe)

Dicas: ver ex. do dilema dos prisioneiros; calcule o máximo lucro

de desvio π D em um estágio (dado que o outro está jogando q M /2)

que, somado aos lucros de Cournot π C nos estágios seguintes, deve

ser comparado com o lucro eterno de π M /2se não desviar de q M /2

Cotas da OPEP com Repetição Infinita

Seja o jogo de quotas da OPEP, mas com repetição

infinita. Considere dois países Arábia Saudita e Irã.

Ver planilha Jogos da OPEP.xls (aba “quotas_repetido_estoc”)

O jogo é apresentado no livro do Dutta (“Strategy and Games”,

MIT Press, 1999), ver trecho do livro na Pasta 72.

Considere que em qualquer período a demanda pode ser

alta ou baixa. A função demanda é linear e dada por:

Demanda alta: p H = a H –b H (q A + q I ) = 44,5 – 1,5 (q A + q I ).

Demanda baixa: p L = a L –b L (q A + q I ) = 22,5 – 0,5 (q A + q I ).

Sejam os custos unitários marginais c A = c I = 5 US$/bbl e

cada país pode produzir o valor da quota OPEP ou nãocooperar

produzindo dois milhões bbl/dia acima da cota.

As quotas são de 8 milhões de bbl/dia para a Arábia Saudita e

de 5 milhões de bbl/dia para o Irã. Assim, as produções totais

possíveis são 13 ; 15 e 17 milhões bbl/dia.

Cotas da OPEP com Repetição Infinita

Considere que caso algum país não-coopere em um

estágio, a seguir haverá punição com a estratégia “grim”.

Se um dos países jogar “não-cooperar” (produção acima da

cota) num estágio, então será jogado sempre {não-cooperar;

não-cooperar} nos estágios sub-sequentes do superjogo.

Determine, p/ cada país, os fatores de desconto mínimos

para sustentar a cooperação (jogar as cotas) nos estados

de demanda alta e fraca.

Depois considere uma probabilidade p da demanda ser alta

em qualquer estágio (e, logo, 1 – p para a demanda ser fraca).

Iremos considerar repetição infinita, como aproximação

razoável. Mas alguns autores consideram que o jogo da

OPEP é de repetição finita, pois as reservas são finitas.

Para resolver, teremos de montar as matrizes de payoffs

para os dois casos de demanda (ver próximo slide).

Cotas da OPEP com Repetição Infinita

A matrizes de payoffs para os dois casos de demanda são

(checar!):

Demanda Alta:

Demanda Baixa:

Cotas da OPEP com Repetição Infinita

Observando a matriz no caso de demanda alta, temos

um caso típico de dilema dos prisioneiros, onde existe

ganho para ambos cooperarem.

O mesmo não ocorre para o caso de demanda fraca, onde

{cooperar ; cooperar} tem um payoff somado (143) menor que

o caso do EN {não-cooperar ; não-cooperar} (payoff = 153).

Isso ocorre devido aos valores adotados (não é regra geral), mas o

livro usa isso p/ explicar a falta de cooperação nos anos 60, já que

não-cooperar atende as racionalidades individuais (EN) e coletiva.

Vejamos o caso de interesse (demanda alta). Se a Arábia

tem um fator de desconto δ A e não desviar o payoff será:

Π A (coopera) = 160 + 160 δ A + 160 δ A2 + ... = 160 / (1 − δ A )

Se ela desviar no 1º estágio, terá um ganho de curto prazo, mas

será punido com o EN nos demais estágios e o payoff será:

Π A (desvia) = 170 + 140 δ A + 140 δ A2 ... = 170 + [140 δ A /(1 − δ A )]

A cooperação ocorre se Π A (coopera) ≥ Π A (desvia) ⇒ δ A ≥ 1/3

Cotas da OPEP com Repetição Infinita

Assim, para a Arábia Saudita não seria difícil cooperar

com demanda alta, já que o fator de desconto mínimo

(taxa de desconto máxima) é bem baixo.

Para o Irã um raciocínio análogo resulta em:

Π I (coopera) = 100 + 100 δ I + 100 δ I2 + ... = 100 / (1 − δ I )

Se ele desviar no 1º estágio e ser punido depois, o payoff será:

Π I (desvia) = 119 + 98 δ I + 98 δ I2 ... = 119 + [98 δ I /(1 − δ I )]

A cooperação ocorre se Π I (coopera) ≥ Π I (desvia) ⇒ δ I ≥ 19/21

Logo, o fator de desconto mínimo do Irã é bem mais alto

que o da Arábia. É bem mais difícil para o Irã cooperar.

Note que o Irã ganha mais desviando que a Arábia e a perda

com a punição grim é menor para o Irã do que para a Arábia.

No caso estocástico cada país tem 4 estratégias diferentes:

Sempre cooperar [q C ; q C ]; cooperar só se a demanda for alta

[q C ; q N ]; coop. só se for baixa [q N ; q C ]; nunca cooperar [q N ; q N ] .

Cotas da OPEP com Repetição Infinita

Onde o 1º termo em [. ; .] é relativo a demanda alta e o 2º

em relação a demanda fraca. A matriz de payoffs para

uma probabilidade de demanda alta de p = 50% é:

Note que a estratégia de cooperação de interesse, onde a soma

de payoffs é máxima, é quando ambos jogam baixa produção se

a demanda é alta e alta produção se a demanda é baixa.

Mostre que esse resultado vale para qualquer probabilidade p.

Cotas da OPEP com Repetição Infinita

Note que o único EN é produção alta para ambos os

países. Esse par de estratégias é EN para qualquer p e é

EN único para qualquer p não trivial, i. é, p ≠ 0 e p ≠ 1.

A cooperação baseada na estratégia de punição grim é:

Cooperar enquanto o ambos cooperam, sendo cooperar é

quando ambos jogam baixa produção se a demanda é alta e

alta produção se a demanda é baixa.

Se algum país não cooperar, então será jogado o único EN

(ambos produzindo o máximo) em todos os estágios futuros.

Imagine que a demanda é alta, de forma que existe um

ganho de curto prazo desviando da cooperação.

Quais os fatores de desconto mínimos p/ sustentar a cooperação?

Considere primeiro o caso da Arábia. Se ela nunca trair:

Π A (coop.) = 160 + [160 p + (1 – p) 90] δ A + [160 p + (1 – p) 90] δ A

2

+ ... ⇒ Π A (coop.) = 160 + {[160 p + (1 – p) 90] δ A / (1 − δ A )}

Cotas da OPEP com Repetição Infinita

Caso a Arábia desvie no 1º período, seu payoff ficaria:

Π A (não-coop.) = 170 + [140 p + (1 - p) 90] δ A + [140 p + (1 - p) 90] δ A

2

+ ... ⇒ Π A (não-coop.) = 170 + {[140 p + (1 – p) 90] δ A / (1 − δ A )}

Não haverá incentivo para trair se Π A (não-coop.) ≥ Π A (coop.):

160 + {[160 p + (1 – p) 90] δ A / (1 −δ A )} ≥ 170 + {[140 p + (1 – p) 90] δ A / (1 −δ A )}

⇒ δ A ≥ 1 / (1 + 2 p) para a Arábia cooperar.

Considere agora o caso do Irã. Se ele nunca trair:

Π I (coop.) = 100 + [100 p + (1 – p) 63] δ I + [100 p + (1 – p) 63] δ I2 +

... ⇒ Π I (coop.) = 100 + {[100 p + (1 – p) 63] δ I / (1 −δ I )}

Caso o Irã desvie no 1º período, seu payoff ficaria:

Π I (não-coop.) = 119 + [98 p + (1 - p) 63] δ I + [98 p + (1 - p) 63] δ I2 +

... ⇒ Π I (não-coop.) = 119 + {[98 p + (1 – p) 63] δ I / (1 − δ I )}

Não haverá incentivo para trair se Π I (não-coop.) ≥ Π I (coop.):

100 + {[100 p + (1 – p) 63] δ I / (1 −δ I )} ≥ 119 + {[98 p + (1 – p) 63] δ I / (1 −δ I )}

⇒ δ I ≥ 19 / (19 + 2 p) para o Irã cooperar.

Cotas da OPEP com Repetição Infinita

A não ser no caso trivial de p = 0, o fator de desconto

mínimo requerido para o Irã é maior (ou bem maior)

que o requerido para a Arábia.

Logo, é relativamente fácil para a Arábia cooperar sempre,

mas é geralmente difícil para o Irã cooperar.

Essa é uma conclusão consistente com a realidade observada,

conforme o autor (Dutta) argumenta.

Note que usamos os mesmo custos unitários, apenas as

capacidades de produção desses países é que são diferentes.

A tabela abaixo mostra a sensibilidade com a probabilidade p:

Ex: Cournot com Informação Incompleta

Seja a competição em quantidades (Cournot) mas com

informação incompleta e assimétrica sobre o custo:

Firma 1 é uma firma estabelecida no mercado e por isso tem

custo marginal c conhecido pela firma 2.

Firma 2 é uma firma nova, que está entrando no mercado e

que tem custo conhecido por ela, mas que a firma 1 desconhece.

Assim, a informação incompleta é assimétrica: a firma 2 é a firma

informada e a firma 1 tem informação incompleta sobre a firma 2.

Assuma só dois cenários: a firma 2 pode ser de alto custo c H , ou

de baixo custo c L , por ex. devido a diferenças de tecnologia.

No contexto Bayesiano, diz-se que a firma 1 tem um só tipo

(espaço de tipos Θ 1 = {c}) e a firma 2 tem dois tipos, Θ 2 = {c L , c H }.

Porém, é conhecimento comum (firmas 1 e 2) a distribuição de

probabilidades a priori sobre os tipos dos jogadores:

A firma 1 sabe que a firma 2 tem probabilidade p de ser do

tipo c H e probabilidade 1 − p de ser do tipo c L .

Aqui os tipos são independentes ⇒ prob(θ 2 = c L | c) = prob(θ 2 = c L ).

Cournot com Informação Incompleta

Seja a função demanda inversa linear P(Q) = a − Q, com

Q = q 1 + q 2 . As firmas maximizam o lucro escolhendo as

quantidades, mas agora a curva de reação da firma 2

depende se ela é do tipo alto custo ou do tipo baixo custo.

Denote q 2* (c L ) e q 2* (c H ) as curvas de reação da firma 2 a

depender de seu tipo e q 1* a curva de reação da firma 1.

Se a firma 2 for do tipo baixo custo, ela escolhe q 2* (c L ) que

resolve: max [(a − q − q ) − c ] q

q2

1 2 L 2

Se a firma 2 for do tipo alto custo, ela escolhe q 2* (c H ) que

resolve: max [(a − q

1

− q

2) − c

H] q

2

q2

A firma 1 escolhe q 1* sabendo que existe uma probabilidade p

da firma 2 ter a curva de reação q 2* (c H ) e 1 − p dela ser q 2* (c L ):

max p [(a −q −q (c )) −c ] q + (1 −p) [(a −q −q (c )) −c ] q

q1

1 2 H 1 1 2 L 1

Usando as condições de primeira ordem para cada um dos três

problemas de maximização e como as quantidades têm de ser ≥ 0:

Cournot com Informação Incompleta

Usando CPOs (derivando e igualando a zero):

* ⎧ a−q1 −cH

⎫

* ⎧ a−q1 −cL

⎫

q

2(c H) = max ⎨0,

⎬

q

2(c L) = max ⎨0,

⎬

⎩ 2 ⎭

* ⎧ p [a −q 2(c H) −c ] + (1 −p) [a −q 2(c L) −c ] ⎫

q

1

= max⎨0,

⎬

⎩

2

⎭

Substituindo a curva de reação duma firma na curva de reação da

outra firma se obtém os valores de quantidades em equilíbrio:

* ⎧ a 2 c

H

+ c (1 p) (cH c

L)

q

2(c H) = max 0,

− − − ⎫

⎨

+

⎬

⎩ 3 6 ⎭

* ⎧ a−2 c

L

+ c p (cH −c L)

⎫

q

2(c L) = max ⎨0,

− ⎬

⎩ 3 6 ⎭

* ⎧ a − 2 c + p c

H

+ (1 −p) cL

⎫

No caso + geral ocorre

q

1

= max ⎨0,

⎬

E[q

2(c)]

≠ q

2(E[c])

⎩

3

⎭

Compare com o caso com informação completa, em que tínhamos

q i* = (a − 2 c i + c j ) / 3 (se não-negativo). Firma 1: linearidade de π 1

com q 2 e o custo a fez usar o valor esperado do custo da rival no q

*

1 .

Firma 2: se ela for de alto custo ela produziria mais do que com

inform. completa. Mas se for de baixo custo, ela produziria menos.

Cournot com Informação Incompleta

Assim, uma firma de alto custo irá querer esconder o

seu custo da outra firma, p/ produzir mais e lucrar mais.

Já uma firma de baixo custo poderá querer sinalizar que ela é

de baixo custo, i. é, divulgar de forma crível o seu custo baixo.

q 1 Curva de reação da firma 2

se ela for de baixo custo: q 2 *(c L )

q 2

Curva de reação da firma 2

se ela for de alto custo: q 2 *(c H )

q 1

*

Curva de reação esperada da firma 2: E[q 2 ]. Coincidência: a firma 1

maximiza E[π 1 (q 2 )], mas aqui π 1 é linear com q 2 ⇒ pode usar E[q 2 ].

Com informação completa as quantidades seriam

diferentes: equilíbrio caso a firma 2 for de baixo custo

Curva de Reação

da firma 1: q 1 *(q 2 )

q 2*

(c H

) q 2*

(c L

)

ver também a planilha

cournot_assimetrico.xls

Teoria da Informação Assimétrica

A teoria de mercados sob informação assimétrica foi

agraciada com três Prêmios Nobel em Economia (2001):

Seleção Adversa: George Akerlof (“mercado de limões”).

Sinalização: Michael Spence (mercado de trabalho).

Screening: Joseph Stiglitz (mercado de seguros).

A teoria de incentivos sob informação assimétrica obteve

mais dois Prêmios Nobel (1996) [ver paper na Pasta 72]:

James Mirrless (desenho da taxação ótima de renda).

William Vickrey (desenho de leilões).

Teoria de Agência vs. Assimetria de Informação

Teoria de Agência: analisa problemas devido a conflitos de

agente e principal, com informação assimétrica ou não.

“Common Agency”: vários principais. Ex.: firma é um agente

informado com vários principais: fisco, agência reguladora, etc.

Assimetria de Informação: o agente é a parte mais informada e

o principal é a parte menos informada.

Leilões na Internet

Leilões online surgiram na web em 1995. O site virou

uma empresa (AuctionWeb) que virou eBay em 1997.

Ver http://en.wikipedia.org/wiki/Ebay

Existem todos os tipos de leilões na internet.

O mais usado é o leilão inglês e suas variações (em ~ 85% dos

casos segundo Kambil & van Heck, “Making Markets”, 2002).

O leilão inglês é o mais antigo de todos (desde ~500 A.C.) e

muito usado para objetos de arte.

O leilão de 2º lance é um dos formatos usados pelo eBay (proxy

bidding system), mas com uma pequena variação: o vencedor

paga o segundo maior bid mais um incremento de valor fixo.

O leilão holandês data de ~1870, usado em mercado de flores e

tem sido usado na internet com ajuda de um “auction clock”.

O “relógio” vai marcando preços decrescentes ao longo do tempo

até que alguém para o relógio. No caso tradicional, oral, o

leiloeiro vai reduzindo o preço até alguém dizer “é meu!”.

Leilão de Telecomunicações (FCC)

Um caso famoso foi o leilão de um espectro de telecom.

da FCC (US Federal Communication Commision) em

1994/1995 que gerou uma receita de 7,7 bilhões de US$.

Licenças para oferecer uma gama de serviços wireless tais

como serviços p/ celulares, pagers, transmissão de dados, etc.

O leilão foi desenhado por três especialistas em teoria

dos jogos (Milgrom, Wilson e McAfee) para venda

simultânea de várias licenças em várias áreas dos EUA.

O formato foi de preços abertos ascendentes, mas p/ múltiplas

licenças. Cada participante podia dar lances nas áreas que

quisessem, a cada rodada. O leilão só terminava quando em

uma rodada nenhuma área recebesse novos bids.

Houveram 112 rodadas que levaram 4 meses. Resultado foi

considerado um sucesso pelo governo.

Esse formato previne o “winner´s curse” (que ocorreria se

fosse leilão selado), que poderia levar as firmas a dar lances

muito conservadores, e dava flexibilidade às firmas que

queriam uma combinação de licenças p/ serem mais agressivas.

Estratégias do Comprador: Winner’s Curse

Maldição do vencedor (“winners’ curse”): firmas pagam

mais do que vale o bem. Uma firma só ganha o leilão se

sua avaliação for a mais alta dentre todas as jogadoras.

Assim, mesmo que em média as suas avaliações (e seus lances)

não superestimem os valores dos ativos, as firmas só ganham

quando as suas avaliações são as mais otimistas do leilão.

Condicional a ser o vencedor, paga-se mais que a avaliação

média (ou melhor, do bid médio) dos participantes do leilão.

Capen & Clapp & Campbell, 1971: isso ocorreu em leilões de

áreas exploratórias no Golfo do México americano nos anos 60.

Com o tempo, as firmas aprendem a se comportar de forma

estratégica, antecipando o “winner’s curse” e dando lances

mais conservadores. Em equilíbrio esse problema é descartado.

De novo, a firma no leilão de 1º lance tem de raciocinar qual o

lance ótimo, dado que ela tem a maior valoração do leilão.

“Dinheiro deixado sobre a mesa” no leilão de 1º lance:

diferença entre o lance vencedor e o lance do 2º colocado.

Leilão Ótimo para o Leiloeiro

Com um número reduzido de pretendentes ao bem em leilão, o

leiloeiro poderia obter um valor muito abaixo de V θ .

Elepodeatéterum preço de reserva abaixo do qual ele não

vende o bem, pois teria utilidade negativa.

Qual o leilão ótimo, o de segundo lance ou o de primeiro lance?

Surpresa: em geral ambos dão a mesma receita esperada ao leiloeiro!

Isso é referido como sendo a equivalência de receita entre os dois leilões.

Demonstração usa o princípio da revelação para restringir a busca.

Ex.: Dutta (1999, cap.23) caso extremo com dois compradores.

No leilão de primeiro lance ele obtém o seguinte ENB:

O tipo de menor valoração µ oferta o seu próprio valor e o tipo de

maior valor θ joga uma estratégia mista atribuindo uma distribuição de

probabilidades a todos os lances entre µ e (θ + µ)/2 (equilíbrio único).

No caso analisado, cada jogador tem 50% de chance de ser de cada tipo,

e logo pode ocorrer que ambos os dois jogadores sejam do tipo θ (ou µ).

Ele chega a conclusão que ambos os leilões dão a mesma receita esperada

Definição: Estratégias simétricas de equilíbrio são quando todos

os jogadores jogam a mesma função, b i (θ) = b j (θ) = b(θ), embora

cada um possa ter um tipo diferente (e dar lances diferentes).

Receita e Número de Competidores: Exemplo

O resultado clássico de que a receita esperada do leiloeiro

aumenta com o n o de compradores nos 4 formatos vistos é

ilustrado com o seguinte exemplo p/ leilão de 2º lance:

Seja um leilão de 2º lance com só dois competidores, sendo que

cada um tem uma valoração privada de que o bem vale $ 10 ou

$ 20 com 50% de chances cada um. Qual a receita esperada?

Note que existem 4 possibilidades, cada uma com 25% de

chances: [10; 10]; [10; 20]; [20; 10]; [20; 20].

Como é ótimo para cada um dar um lance igual a seu valor, a

receita do leiloeiro é: R n = 2 = ¾ . 10 + ¼ . 20 = $ 12,5.

Considere agora o caso de três competidores. Teremos 2 3 = 8

possibilidades com probabilidade 1/8 cada uma: [10; 10; 10];

[10; 10; 20]; [10; 20; 10]; [10; 20; 20]; [20; 10; 10]; [20; 10; 20];

[20; 20; 10]; [20; 20; 20]. A receita do leiloeiro será nesse caso:

R n = 3 = ½ . 10 + ½ . 20 = $ 15. Como R n = 3 > R n = 2 ⇒ a receita

aumentou com o número de competidores. Note que o 3º

competidor não tinha valoração maior que os dois anteriores.

Equivalência de Receita

Um resultado clássico da teoria de leilões é a equivalência

de receita (revenue equivalence) entre diversos formatos

se cada “bidder” segue a estratégia equilíbrio de Nash.

Se os jogadores têm valores independentes, são neutros ao

risco, sem restrição orçamentária e usam estratég. simétricas,

então todos os formatos de leilão razoáveis (1 o lance, 2 o lance,

inglês, holandês) levam a mesma receita esperada p/ o leiloeiro!

Não significa que exista só um equilíbrio de Nash. No leilão

selado de 1º lance, por ex., existem múltiplos equilíbrios, mas eles

levam ao mesmo resultado esperado para o leiloeiro.

No leilão de 1º lance o vencedor paga um preço menor do que sua

avaliação, mas ganha o leilão quem atribui o maior valor ao bem.

Esses resultados clássicos não valem em situações tais como o

leilão de bem de valor comum; com jogadores avessos ao risco;

em mercados de múltiplos itens (exceto vendas individuais), etc.

Corolário: A receita esperada do vendedor aumenta com o n o

de compradores nos 4 formatos mencionados.

Equivalência de Receita: Exemplo

Para ilustrar o conceito de equivalência de receita,

seja um leilão de valor privado com apenas dois

interessados, cujos valores privados são v 1

e v 2

.

Os valores privados são conhecimento apenas de cada um,

mas é conhecimento comum que os valores privados têm

distribuição de prob. uniforme entre os valores 0 e 1000.

O objeto pode ser leiloado em leilão selado de 1º ou de 2º

lance. Mostre que em equilíbrio (EBN), a receita esperada

do leiloeiro em ambos os leilões é de 1000/3.

OBS: no caso do leilão de 1º lance considere apenas o EBN

simétrico simples, i. é, bids com a mesma proporção do seu

valor: b 1 = k v 1 e b 2 = k v 2 , onde a proporção k é a mesma.

No leilão de 1º lance, o vencedor também é que deu o maior

lance b i , mas paga o seu próprio lance (e não o 2º maior bid).

Note que, para a distrib. uniforme entre 0 e 1000, a densidade

de probabilidade é 1/1000 e a acumulada Prob[v < x] = x/1000.

Equivalência de Receita: Leilão 2º Lance

No caso do leilão de 2º lance, vimos que b i = v i éEBN.

Nesse caso, a receita esperada do leiloeiro é o valor esperado

do 2º maior lance. Provaremos que b i = v i é igual a 1000/3.

Note que o valor esperado da segunda maior valoração,

condicional a conhecer o valor v 1 é:

Prob[v 2

≥ v 1

] v 1

+ Prob[v 2

Equivalência de Receita: Leilão 1º Lance

Para calcular a receita do leiloeiro, procede-se de forma

similar a anterior. Temos duas distribuições (p/ v 1 e v 2 ):

Primeiro se condiciona em relação a uma delas e depois se

considera a outra. Antes iniciamos com valor esperado do bid,

condicional a conhecer o valor v 1 (ficava uma função de v 1 ) e

depois integrava em relação aos possíveis valores de v 1 . Pode-se

fazer da mesma forma ou invertendo a ordem. Vamos inverter

essa ordem e iniciar por v 2 e depois integrar em relação a v 2 :

1000⎛

v2

⎞ 1

∫0

⎜Prob[v1 ≤ v

2] + Prob[v1 > v

2] E[b

1

| v1 > v

2] dv

2

⎟

⎝

⎠1000

1000⎛

v2 v2 ⎛ v2 ⎞⎛ v2

+ 1000 ⎞⎞

1 1000

= ∫ ⎜ + 1 dv

0

2

=

1000 2

⎜ −

1000

⎟⎜ ⎟

2×

2

⎟

⎝ ⎝ ⎠⎝ ⎠⎠1000 3

A explicação é similar ao caso anterior (leilão de 2º lance), mas

usando o fato de que já foi mostrado que o ENB é jogar a metade da

sua valoração (por isso apareceu v 2 /2 quando o jog. 2 ganha). Note

que se v 1 > v 2 , então v 1 é um número equiprovável entre v 2 e 1000,

cuja média é (v 2 +1000)/2. Como o EBN é v 1 /2, então fica (v 2 +1000)/4.

Leilão Selado de Primeiro Lance

No leilão selado de primeiro lance, o maior bid b 1 éo

vencedor do leilão, recebe o bem e paga seu bid b 1 .

Para o jogador i, com valor privado x, seu payoff π i é:

π i = x − b i se b i > max j ≠ i b j ; ou π i = 0 se b i < max j ≠ i b j

As estratégias dos jogadores são os valores de bid que

são funções dos tipos, b i (θ). Considere apenas estratégias

simétricas de equilíbrio, i. é, todos os jogadores jogam a

mesma função de seu tipo, b i (θ) = b j (θ) = b(θ).

Proposição: O único equilíbrio em estratégias simétricas

(EBN) num leilão de primeiro lance é (p/ todos jogad.):

b(v) = E[v 2 | v 2 < v] = E[segundo maior tipo | maior tipo = v]

Onde v 2 é o maior valor dos outros N − 1 valores independentes.

Ex.: Valores v com distribuição uniforme [0, 1] tem a solução para o

bid do EBN: b(v) = [(N − 1)/N] v. Demonstração a seguir.

Leilão Selado de 1º Lance: Exemplo

Para ver o último resultado, seguirei McMillan (1992).

Seja o valor privado do jogador 1, v 1 . Então:

b 1 = k v 1 e b j = k v j para j = 2, 3, ... N.

O jogador 1 ganha o leilão se v j ≤ b 1 /k, para todo j = 2, 3, ... N.

Como as valorações são independentes, a probab. de vitória é:

Pr[v 2 ≤ b 1 /k, v 3 ≤ b 1 /k, ..., v N ≤ b 1 /k] = Pr[v 2 ≤ b 1 /k] x Pr[v 3 ≤

b 1 /k] ... x Pr[v N ≤ b 1 /k].

Como as distribuições são uniformes [0, 1], Pr[v j ≤ b 1 /k] = b 1 /k.

Assim, a expressão anterior fica:

Pr[v 2 ≤ b 1 /k, v 3 ≤ b 1 /k, ..., v N ≤ b 1 /k] = (b 1 /k) N – 1 . O payoff

esperado do jogador 1 é: (v 1 –b 1 )(b 1 /k) N – 1 .

O jogador 1 quer maximizar o payoff esperado escolhendo b 1 .

Logo, usaremos a CPO (deriva o payoff esperado e iguala a 0):

0 = [v 1 (N – 1) (b 1 ) N – 2 /k N – 1 ] – [N (b 1 /k) N – 1 ] ⇒ b 1 = v 1 (N – 1)/N □

Ou seja, o k ótimo para o equilíbrio simétrico é (N – 1)/N.

Note que se N → ∞ ⇒ b 1 (v) → v. Maior competição, maior receita.

Teoria dos Jogos - IAG - A Escola de NegÃ³cios da PUC-Rio

Teoria dos Jogos - IAG - A Escola de NegÃ³cios da PUC-Rio ... View more Teoria dos Jogos - IAG - A Escola de NegÃ³cios da PUC-Rio

Delete template?

Save as template ?

Teoria dos Jogos - IAG - A Escola de NegÃ³cios da PUC-Rio Teoria dos Jogos - IAG - A Escola de NegÃ³cios da PUC-Rio