04.06.2013 Views

10. Giochi con informazione asimmetrica - utenti

10. Giochi con informazione asimmetrica - utenti

10. Giochi con informazione asimmetrica - utenti

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>10.</strong> <strong>Giochi</strong> <strong>con</strong> <strong>informazione</strong> <strong>asimmetrica</strong><br />

<strong>10.</strong>1. Informazione <strong>asimmetrica</strong> ed <strong>informazione</strong> incompleta<br />

L’analisi dei giochi svolta sinora presuppone che tutta l’<strong>informazione</strong><br />

sulle regole del gioco sia <strong>con</strong>oscenza comune dei giocatori.<br />

Ora le situazioni della vita reale, in particolare quelle di tipo<br />

e<strong>con</strong>omico, presentano spesso asimmetria di <strong>informazione</strong>. Per esempio,<br />

• l’attitudine di un decisore ad assumersi dei rischi può non essere<br />

nota agli altri decisori;<br />

• la classe di rischio di un individuo che vuole stipulare<br />

un’assicurazione sulla vita può non essere nota alla compagnia<br />

assicuratrice;<br />

• le azioni di cui dispone un decisore, anche se note a tutti gli altri<br />

attori della situazione, possono non essere facilmente osservabili;<br />

• alcuni esiti reali, come l’entità del danno subito da un assicurato<br />

per un furto, possono essere osservabili dall’assicurato ma non da<br />

altri.<br />

Certamente un gioco <strong>con</strong> <strong>informazione</strong> imperfetta può presentare<br />

asimmetria informativa. Ciò si verifica, ad esempio, nel semplice gioco<br />

di carte (di Myerson), etichettato G3 in 2.11.. Peraltro spesso, come negli<br />

esempi citati in precedenza, manca qualche elemento perché la<br />

situazione possa essere modellata come gioco, sia pure <strong>con</strong> <strong>informazione</strong><br />

imperfetta. Si parla allora di situazione, anzi, <strong>con</strong> abuso di linguaggio, di<br />

gioco <strong>con</strong> <strong>informazione</strong> incompleta 1 .<br />

Occorre segnalare che le due nozioni di “<strong>informazione</strong> <strong>asimmetrica</strong>” e<br />

di “<strong>informazione</strong> incompleta” sono diverse. Nessuna delle due implica<br />

l’altra. Per esempio, il gioco G3 ha <strong>informazione</strong> completa (cioè è un<br />

vero gioco!) e <strong>asimmetrica</strong>. E non è difficile (pensaci sopra!) dare un<br />

esempio di una situazione che presenta <strong>informazione</strong> incompleta (per<br />

essere modellata come gioco) ma simmetrica.<br />

Nel caso che l’<strong>informazione</strong> presente in una situazione interattiva sia<br />

insufficiente per poterla modellare come gioco, Harsanyi ha suggerito<br />

1 A rigore non si dovrebbe parlare di gioco se manca qualche elemento richiesto dalla<br />

definizione di gioco. Per sanare questa discrasia linguistica, qualche autore (ad<br />

esempio, Osborne, opera citata) elimina dal suo vocabolario la locuzione “gioco <strong>con</strong><br />

<strong>informazione</strong> incompleta”.<br />

1


un’idea (“dottrina di Harsanyi”), per completare l’<strong>informazione</strong><br />

mancante, che permette talvolta di modellare la situazione come gioco<br />

<strong>con</strong> <strong>informazione</strong> imperfetta.<br />

Prima di discutere la trasformazione di Harsanyi è opportuno illustrare<br />

alcuni aspetti salienti delle situazioni <strong>con</strong> <strong>informazione</strong> <strong>asimmetrica</strong> e<br />

ridiscutere il <strong>con</strong>cetto di soluzione di un gioco dinamico <strong>con</strong><br />

<strong>informazione</strong> imperfetta.<br />

[Gli esempi presentati nei paragrafi <strong>10.</strong>3., <strong>10.</strong>4. e <strong>10.</strong>6. sono tratti da<br />

[DS]. La fonte originale per gli esempi in <strong>10.</strong>3. e <strong>10.</strong>4. è un noto lavoro<br />

di Michael Spence sulla segnalazione per il mercato del lavoro (Job<br />

Market Signaling, Quarterly Journal of E<strong>con</strong>omics, 87, 1973).]<br />

<strong>10.</strong>2. Trasmissione e manipolazione dell’<strong>informazione</strong><br />

Consideriamo una ipotetica situazione interattiva <strong>con</strong> due individui<br />

razionali, i e j, e <strong>con</strong> asimmetria di <strong>informazione</strong>: supponiamo che i sia<br />

in possesso di informazioni private che j ignora.<br />

All’individuo i, più informato 2 , può <strong>con</strong>venire una di queste scelte<br />

strategiche:<br />

a. Nas<strong>con</strong>dere il suo surplus di <strong>informazione</strong> oppure rivelarlo in<br />

modo ingannevole;<br />

b. Rivelare in modo veritiero una quantità scelta del suo surplus<br />

informativo.<br />

All’individuo j, meno informato, può <strong>con</strong>venire una di queste scelte<br />

strategiche:<br />

i. Analizzare l’<strong>informazione</strong> cercando di filtrare il vero dal falso.<br />

[Un esempio tipico è quello di un datore di lavoro che vuole<br />

scoprire le capacità di un potenziale impiegato o il livello di<br />

impegno di un impiegato effettivo.]<br />

ii. Rimanere ignorante: se j non è in grado di comprendere il<br />

significato di una mossa strategica di i, j può così immunizzarsi<br />

<strong>con</strong>tro gli impegni e le minacce di i.<br />

L’idea di base che regola le situazioni interattive in cui l’<strong>informazione</strong><br />

è <strong>asimmetrica</strong> e gli interessi dei decisori sono discordanti, è che “le<br />

azioni parlano più delle parole”. Ossia, anche se la situazione ammette<br />

2 Se la situazione può essere modellata come gioco in forma estesa, allora dire che i è<br />

più informato di j significa che i “vede” una partizione informativa globale “più fine”<br />

di quello che vede j (ossia i, ma non j, è in grado di distinguere i nodi di un qualche<br />

insieme di informazioni di j). Peraltro è difficile formalizzare una tale idea, come è<br />

stato tentato, ma in modo poco produttivo, da qualche autore.<br />

2


comunicazione tra i e j, j osserva le azioni di i ed ignora le eventuali<br />

affermazioni di i ed i, <strong>con</strong>scio di questo fatto, utilizza le sue azioni<br />

(anche) per il loro significato informativo.<br />

Se, per esemplificare, la situazione di i (il decisore più informato) può<br />

essere o buona o cattiva, i cercherà di scegliere un’azione che induca j a<br />

credere che la sua situazione è buona. Si dice allora che i usa la sua<br />

azione come segnale e l’uso di un segnale è chiamato segnalazione.<br />

In particolare, se la situazione di i è in realtà cattiva e j può<br />

ragionevolmente ritenere che essa sia cattiva, allora i può cercare di<br />

<strong>con</strong>fondere j <strong>con</strong> la scelta di una strategia che sembra indicare che la sua<br />

situazione è buona. Un tale schema di segnalazione è chiamato “signal<br />

jamming” ed implica, di regola, l’uso di una strategia di comportamento,<br />

poiché la casualità delle scelte propria delle strategie randomizzate rende<br />

<strong>con</strong>fuso il processo deduttivo.<br />

Quanto al giocatore meno informato, j, egli cercherà di usare strategie<br />

che riducano il suo svantaggio informativo. Si parla di screening<br />

(“vaglio”) per riferirsi all’uso da parte di j (il giocatore meno informato)<br />

di una strategia che induca i a rivelare il suo surplus di <strong>informazione</strong>.<br />

Il vaglio dell’<strong>informazione</strong> può richiedere l’uso di sottili stratagemmi<br />

(“mezzi di vaglio”) oppure l’applicazione di uno schema di incentivi.<br />

<strong>10.</strong>3. Rischio morale ed incentivi nel modello Principale-Agente<br />

Sia P (=principale) il titolare di una ditta, in cerca di un agente, A, che<br />

organizzi un progetto. L’esito del progetto è incerto e la probabilità di<br />

successo è correlata al livello di impegno di A.<br />

Supponiamo, per semplicità, che i livelli di impegno di A siano due soli:<br />

standard ed alto e che entrambi i decisori, P ed A, siano neutrali rispetto<br />

al rischio in denaro.<br />

Supponiamo inoltre che i seguenti dati siano <strong>con</strong>oscenza comune di P e<br />

di A:<br />

• se il progetto ha successo esso darà a P un ricavo lordo di 60˙000€;<br />

• la probabilità di successo del progetto è 0.6 se il livello di impegno di<br />

A è standard, ma sale a 0.8 se l’impegno di A è di alto livello.<br />

Un impegno di alto livello comporta però un costo soggettivo (per<br />

esempio, egli può dover dedicare il suo tempo al progetto anche nei<br />

giorni festivi). P offre ad A 10˙000€ per l’impegno di livello standard,<br />

ma A chiede a P un extra di 5˙000€ per l’impegno di alto livello.<br />

Senza l’impegno extra, P ha un profitto atteso di<br />

(60˙000 · 0.6) € = 36˙000€<br />

3


e deve dare 10˙000€ ad A, <strong>con</strong> un profitto netto atteso di 26˙000€.<br />

Con l’impegno extra di A, il profitto netto atteso diviene<br />

(60˙000 · 0.8) € - 15˙000€ = 33˙000€ .<br />

A P <strong>con</strong>viene perciò pagare ad A i 5˙000€ extra per ottenere l’impegno<br />

di alto livello.<br />

Come si può realizzare un tale <strong>con</strong>tratto? Il <strong>con</strong>tratto deve specificare<br />

che A ottiene un compenso base di 10˙000€ più un compenso extra di<br />

5˙000€ se il suo impegno è di alto livello. Tuttavia sorge un problema di<br />

rischio morale 3 . Con un tale <strong>con</strong>tratto, l’agente A può semplicemente<br />

incassare i 5˙000€ extra e lavorare <strong>con</strong> l’impegno di routine. Gran parte<br />

del lavoro è di tipo <strong>con</strong>cettuale ed egli può svolgerlo a casa di sera o nei<br />

fine settimana. Egli può sempre dire di aver fatto ciò e P non ha modo di<br />

verificarlo. Se il progetto fallisce, A può attribuire ciò alla cattiva sorte<br />

(anche <strong>con</strong> l’impegno extra c’è una probabilità del 20% di fallimento).<br />

Perciò se il livello di impegno non può venire osservato (né verificato<br />

da un giudice in caso di <strong>con</strong>troversia legale) il principale deve cautelarsi<br />

inserendo nel <strong>con</strong>tratto una clausola che può essere verificata.<br />

Nell’esempio in esame, l’unico evento che può essere osservato è il<br />

successo o il fallimento del progetto. Poiché il successo è correlato<br />

probabilisticamente all’impegno, esso dà un’<strong>informazione</strong>, anche se<br />

imperfetta, sull’impegno e ciò può servire per costruire un <strong>con</strong>tratto che<br />

serva a motivare l’impegno.<br />

Consideriamo un pacchetto retributivo, <strong>con</strong>sistente di un salario base,<br />

s, e di un bonus, b, che è pagato se e solo se il progetto ha successo.<br />

Allora il guadagno atteso di A sarà (s + 0.6b) se usa l’impegno di routine<br />

e sarà (s + 0.8b) se usa l’impegno di alto livello. Il guadagno extra di A<br />

per il maggiore impegno è (s + 0.8b) - (s + 0.6b) = 0.2b. Perché<br />

l’impegno extra valga la pena per A, deve essere vero che 0.2b ≥ 5˙000€<br />

ossia che b ≥ 25˙000€. Così un bonus abbastanza alto (per il successo)<br />

3 Il termine “rischio morale” proviene dalla matematica delle assicurazioni. Un<br />

cliente assicurato può far lievitare la probabilità di danno, per esempio furto o<br />

incendio, <strong>con</strong> un comportamento meno prudente dell’usuale, legato al fatto che si<br />

sente protetto dall’assicurazione.<br />

Più in generale, ogni problema di interazione strategica in cui il comportamento di<br />

una persona non è osservabile <strong>con</strong>figura un problema di rischio morale.<br />

In un <strong>con</strong>testo assicurativo, la compagnia assicuratrice cerca di <strong>con</strong>trollare il rischio<br />

morale richiedendo che l’assicurato <strong>con</strong>servi una parte del rischio, mediante l’uso di<br />

una franchigia e/o di uno scoperto. Ciò agisce come lo schema di incentivi di cui<br />

parliamo nell’esempio.<br />

4


crea nell’agente un incentivo sufficiente a provocare l’impegno extra. La<br />

diseguaglianza<br />

(<strong>10.</strong>3.1) 0.2b ≥ 5˙000€<br />

è una <strong>con</strong>dizione di compatibilità dell’incentivo sul pacchetto retributivo.<br />

C’è un’altra <strong>con</strong>dizione. Il pacchetto retributivo globale deve essere<br />

abbastanza alto per indurre A a lavorare per P. Se la <strong>con</strong>dizione di<br />

compatibilità dell’incentivo è soddisfatta l’agente compirà lo sforzo di<br />

alto livello, se lavora per P, e il suo guadagno atteso sarà (s + 0.8b). Ora<br />

egli (A) chiede almeno 15˙000€ per lavorare per P <strong>con</strong> un impegno di<br />

alto livello. Perciò l’offerta di P deve soddisfare la <strong>con</strong>dizione di<br />

partecipazione<br />

(<strong>10.</strong>3.2) s + 0.8b ≥ 15˙000€ .<br />

Il principale vuole però massimizzare il suo proprio profitto e perciò<br />

cerca di mantenere il più basso possibile il compenso totale di A<br />

(compatibilmente coi vincoli (<strong>10.</strong>3.1) e (<strong>10.</strong>3.2)).<br />

Volendo tenere al livello minimo possibile di 15˙000€ il compenso<br />

totale di A, P dovrebbe scegliere<br />

s = 15˙000€ - 0.8b .<br />

Ma poiché, per la (<strong>10.</strong>3.1), b deve essere almeno 25˙000€, il salario s<br />

non dovrebbe superare<br />

15˙000€ - 0.8 · 25˙000€ = -5˙000€ .<br />

Che senso ha un valore s < 0? In una prima interpretazione può essere<br />

visto come una quantità di denaro che A deve mettere nel progetto. Una<br />

se<strong>con</strong>da possibilità è che A non metta alcun suo capitale nel progetto, ma<br />

venga multato se il progetto fallisce. In molti casi nessuna delle due<br />

alternative è praticabile (A può non avere denaro da investire e la<br />

legislazione può proibire l’applicazione di penalità.).<br />

Supponendo allora che il salario base debba essere non negativo (s ≥ 0) e<br />

ponendo al livello più basso possibile sia il salario base che il bonus<br />

(ossia s = 0€ e b = 25˙000€) si ottiene<br />

0€ + 0.8 · 25˙000€ = 20˙000€ .<br />

Dunque il principale è forzato a superare, di 5˙000€, la <strong>con</strong>dizione di<br />

partecipazione. Il surplus di 5˙000€ è un costo extra dovuto al problema<br />

di osservazione 4 . Un tale tipo di costo extra esiste, in generale, nei<br />

4 Se l’impegno di A può essere verificato direttamente, allora a P <strong>con</strong>viene stipulare<br />

il <strong>con</strong>tratto <strong>con</strong> salario base di 10˙000€ e <strong>con</strong> compenso aggiuntivo di 5˙000€ per<br />

l’extra impegno.<br />

5


problemi <strong>con</strong> asimmetria informativa ed è il giocatore meno informato<br />

che deve pagarlo. Ora vogliamo verificare se, nel problema in esame, è<br />

<strong>con</strong>veniente per il principale pagare tale costo extra. Pagando il costo<br />

extra, il profitto netto atteso del principale è<br />

60˙000€ · 0.8 - 20˙000€ = 28˙000€ .<br />

Con l’impegno di routine di A, P deve pagare ad A solo il compenso<br />

base di 10˙000€ e la probabilità di successo del progetto è 0.6, per cui il<br />

profitto netto atteso di P è<br />

60˙000€ · 0.6 - 10˙000€ = 26˙000€ .<br />

Perciò, anche col costo extra generato dall’asimmetria informativa, P<br />

ottiene un profitto netto atteso un po’ più elevato usando lo schema del<br />

<strong>con</strong>tratto <strong>con</strong> incentivi.<br />

Naturalmente non è sempre così poiché la <strong>con</strong>clusione dipende, in<br />

ciascun caso, dai dati numerici del problema.<br />

<strong>10.</strong>4. Vaglio dell’<strong>informazione</strong> per la separazione dei tipi<br />

Il direttore di un importante complesso industriale vuole assumere per<br />

un impegnativo progetto pluriennale laureati in matematica o fisica o<br />

ingegneria che abbiano le capacità logiche e le <strong>con</strong>oscenze matematiche<br />

necessarie per un lavoro scientifico molto complesso.<br />

Egli ritiene che i curricula dei candidati non costituiscano un’attestazione<br />

credibile delle loro capacità: occorre un’evidenza oggettiva. Come mezzi<br />

di “screening” egli pensa allora di utilizzare i corsi molto impegnativi di<br />

un master, che l’industria stessa supporta parzialmente presso la vicina e<br />

prestigiosa università di XYZ, nell’idea che le scelte di corsi di studio da<br />

parte dei candidati possano costituire un’evidenza credibile delle loro<br />

qualità.<br />

Per semplificare il discorso supponiamo che ci siano due soli tipi di<br />

candidati (in relazione alle qualità richieste dal datore di lavoro): A =<br />

abile e B = medio. Il principale è disposto a pagare 30˙000€ all’anno ad<br />

un tipo A e 20˙000€ ad un tipo B. Poiché non può osservare<br />

direttamente il tipo del candidato, egli cerca un meccanismo efficiente<br />

per distinguere tra di essi.<br />

Supponiamo che i due tipi differiscano nella loro tolleranza<br />

nell’affrontare un corso. Ciascuno deve spendere denaro e sacrificare<br />

tempo per affrontare un corso impegnativo, ma tale costo è più lieve per<br />

un tipo A che per un tipo B. Supponiamo che i tipi A valutino il costo di<br />

ciascuno di tali corsi come equivalente, in denaro, a 1˙200€ annuali di<br />

6


salario, mentre i tipi B lo valutino come equivalente a 1˙800€ annuali di<br />

salario.<br />

Ci chiediamo se il datore di lavoro può utilizzare questa differenza per<br />

riuscire a vagliare i candidati e separare i tipi A dai tipi B.<br />

L’idea giusta può essere quella di determinare un numero (naturale) n<br />

tale che chi accetta di sostenere n (o più) corsi impegnativi è catalogato<br />

come tipo A e pagato 30˙000€ l’anno, mentre chi non accetta un tale<br />

impegno è catalogato come tipo B e pagato 20˙000€. L’alternativa per<br />

ciascun candidato è allora tra accettare un numero n ≥ n di corsi che lo<br />

evidenzino come tipo A o rinunciare accettando di rivelarsi come tipo B.<br />

Lo schema usato dal datore di lavoro deve essere tale da non<br />

incoraggiare i tipi B a seguire n corsi e tale da non scoraggiare i tipi A<br />

dal seguirli. Un valore giusto di n si ottiene imponendo che ciascun tipo<br />

abbia interesse a rivelarsi qual è.<br />

Perché ad un vero tipo A <strong>con</strong>venga rivelarsi per tale, il numero n dei<br />

corsi seguiti deve soddisfare la <strong>con</strong>dizione<br />

(<strong>10.</strong>4.1) 30˙000 - 1˙200 · n ≥ 20˙000<br />

che comporta la <strong>con</strong>dizione n ≤ 8.<br />

Perché un vero tipo B preferisca rivelarsi per tale (piuttosto che incorrere<br />

nel costo extra che comporta per lui il tentativo di spacciarsi per un tipo<br />

A), n deve soddisfare la <strong>con</strong>dizione<br />

(<strong>10.</strong>4.2) 20˙000 ≥ 30˙000 - 1˙800 ·n<br />

che comporta la <strong>con</strong>dizione n ≥ 6.<br />

È la differenza del costo (per seguire un corso impegnativo) tra i due tipi<br />

che fa sì che le due <strong>con</strong>dizioni di compatibilità (<strong>10.</strong>4.1) e (<strong>10.</strong>4.2)<br />

costituiscano per il principale uno schema atto a generare la separazione<br />

dei tipi.<br />

Si noti che nella realtà l’istruzione può anche far aumentare la<br />

produttività di un impiegato e trasformare un tipo B in tipo A. Tuttavia,<br />

nel nostro scenario semplificato la richiesta di seguire n corsi<br />

impegnativi serve solo a scopo di vaglio ed i tipi A ne devono sopportare<br />

il costo extra dovuto all’asimmetria dell’<strong>informazione</strong>.<br />

Supponendo di usare il numero minimo di corsi necessario per ottenere<br />

la separazione, e cioè n = n = 6, il costo per il tipo A ha un equivalente<br />

monetario di 6 · 1˙200€ = 7˙200€.<br />

Si dice che c’è un effetto esterno negativo inflitto dai tipi B ai tipi A:<br />

infatti tale costo non esisterebbe se la popolazione dei candidati<br />

<strong>con</strong>sistesse solo di tipi A oppure se il tipo di una persona potesse essere<br />

verificato direttamente.<br />

7


Ci si può chiedere se per un tipo A può risultare preferibile non<br />

impegnarsi affatto per la separazione dei tipi, piuttosto che sopportare il<br />

costo. Con la separazione dei tipi, un tipo A ottiene un guadagno netto di<br />

30˙000€ -7˙200€ = 22˙800€<br />

ed un tipo B ottiene 20˙000€.<br />

Cosa accade se i due tipi non vengono separati? Se i datori di lavoro non<br />

usano mezzi di screening, essi devono scegliere a caso tra i richiedenti e<br />

pagare a tutti lo stesso salario. Si parla allora di <strong>con</strong>globazione (pooling)<br />

dei tipi. Con la <strong>con</strong>globazione dei tipi, in un mercato competitivo per il<br />

lavoro, il salario comune sarà la media di quanto valgono i tipi per il<br />

datore di lavoro e tale media dipende dalla popolazione dei tipi nella<br />

popolazione dei richiedenti. Per esempio, se il 20% dei richiedenti è di<br />

tipo A e l’80% è di tipo B, allora il salario comune <strong>con</strong> la <strong>con</strong>globazione<br />

sarà<br />

30˙000€ · 0.2 + 20˙000€ · 0.8 = 22˙000€ .<br />

Allora i tipi A preferiranno la situazione <strong>con</strong> la separazione dei tipi,<br />

poiché essa comporta 22˙800€ anziché 22˙000€.<br />

Ma se la proporzione è 50% - 50%, allora il salario comune sotto pooling<br />

sarà di 25˙000€ ed i tipi A preferiranno la <strong>con</strong>globazione. I tipi B<br />

preferiranno sempre la <strong>con</strong>globazione, poiché la presenza di tipi A nella<br />

popolazione degli agenti implica che il salario comune eccederà sempre<br />

quello che percepis<strong>con</strong>o i tipi B in regime di separazione (nel nostro<br />

esempio 20˙000€).<br />

Tuttavia, anche se entrambi i tipi preferis<strong>con</strong>o la <strong>con</strong>globazione, la<br />

situazione può non essere stabile. Supponiamo che le proporzioni nella<br />

popolazione dei possibili agenti siano 50% - 50% (tipi A e tipi B) e che<br />

la situazione iniziale presenti <strong>con</strong>globazione in cui entrambi i tipi<br />

preferis<strong>con</strong>o 25˙000€.<br />

Un imprenditore può annunciare che pagherà 26˙500€ a chi sosterrà un<br />

corso tosto. I tipi A troveranno ciò proficuo (rispetto alla situazione<br />

iniziale) poiché il loro costo per un corso è di 1˙200€ mentre l’aumento<br />

di salario è di 1˙500€, mentre i tipi B non lo troveranno proficuo perché<br />

il loro costo per un corso, 1˙800€, eccede l’aumento di salario. Poiché<br />

questo particolare imprenditore attrae selettivamente i tipi A, ciascuno<br />

dei quali vale 30˙000€ ma che paga 26˙500€, egli trae vantaggio dal<br />

deviare dal pacchetto salariale della <strong>con</strong>globazione.<br />

Ma tale deviazione innesca un processo che porta al collasso della<br />

precedente situazione di pooling. Siccome i tipi A si accalcano a lavorare<br />

per lui, il parco agenti disponibile per gli altri imprenditori diviene di<br />

8


qualità media inferiore e può non valere il salario di 25˙000€. Se tale<br />

salario viene abbassato, allora la differenza rispetto ai 26˙500€ offerti<br />

dall’imprenditore deviante, può raggiungere un livello tale che anche i<br />

tipi B trovano <strong>con</strong>veniente affrontare un corso tosto. Ma allora il<br />

deviante può alzare la sua richiesta a 2 corsi, accrescendo il differenziale<br />

di salario ma in modo tale che i tipi B non abbiano interesse ad agire<br />

come i tipi A. Altri imprenditori, che anch’essi desiderano attirare dei<br />

tipi A, devono usare delle strategie analoghe se li vogliono attrarre.<br />

Questo processo <strong>con</strong>tinua finchè il mercato raggiunge l’equilibrio<br />

separante descritto in precedenza.<br />

Nell’esempio, la richiesta di un corso tosto è usato come meccanismo<br />

di screening da parte del datore di lavoro. C’è però anche la possibilità<br />

che un lavoratore compia la stessa azione come segnale. In effetti, ci<br />

sono molti parallelismi tra segnalazione e screening, benchè l’equilibrio<br />

finale possa differire in dipendenza dell’ordine delle mosse.<br />

<strong>10.</strong>5. Estensione della nozione di equilibrio perfetto nei sottogiochi al<br />

caso di giochi in forma estesa <strong>con</strong> <strong>informazione</strong> imperfetta.<br />

Equilibri bayesiani perfetti<br />

Finora il problema della risoluzione di un gioco in forma estesa <strong>con</strong><br />

<strong>informazione</strong> imperfetta è stato toccato solo di sfuggita. L’unica idea a<br />

nostra disposizione fino a questo momento è quella di cercare gli<br />

equilibri di Nash della forma normale del gioco stesso. Così abbiamo<br />

fatto, ad esempio, per risolvere il gioco in forma estesa G3 del paragrafo<br />

2.11 (cfr. paragrafo 7.6 ed esercizio 7.7.3). Tuttavia, il successo di tale<br />

tentativo è dovuto al fatto, abbastanza eccezionale, che la forma normale<br />

del gioco G3 ha un unico equilibrio di Nash. Di regola, la forma normale<br />

di un gioco <strong>con</strong> mosse sequenziali ed <strong>informazione</strong> imperfetta ha una<br />

grande molteplicità di equilibri di Nash, sicchè il passaggio alla forma<br />

normale non è, in generale, il mezzo più adeguato per la risoluzione del<br />

gioco stesso. Occorre cioè ragionare direttamente sulla forma estesa del<br />

gioco. A tale scopo occorre ricordare quanto è stato accennato nel<br />

paragrafo 7.6 e cioè che nell’affrontare la risoluzione di un gioco in<br />

forma estesa <strong>con</strong> <strong>informazione</strong> imperfetta <strong>con</strong>viene utilizzare le strategie<br />

di comportamento anziché le strategie miste 5 , a patto che il gioco abbia<br />

5 Numerosi autori <strong>con</strong>siderano così ovvio l’uso delle strategie di comportamento nei<br />

giochi in forma estesa che col termine “strategie miste” indicano, in realtà, le<br />

strategie di comportamento.<br />

9


icordo perfetto (ciò che si verifica sempre negli esempi <strong>con</strong>siderati nel<br />

corso).<br />

In effetti le strategie di comportamento sono più maneggevoli delle<br />

strategie miste e l’insieme degli equilibri di Nash in strategie di<br />

comportamento è, in genere, più piccolo (nel senso dell’inclusione)<br />

dell’insieme degli equilibri di Nash in strategie miste, in forza del fatto<br />

che una stessa strategia di comportamento può essere generata da più<br />

strategie miste.<br />

Ciò premesso e <strong>con</strong>venendo che nel seguito di questo capitolo col<br />

termine generico di strategia ci riferiremo ad una strategia di<br />

comportamento, l’idea successiva che viene alla mente è quella di<br />

raffinare la nozione di equilibrio di Nash estendendo ai giochi in forma<br />

estesa <strong>con</strong> <strong>informazione</strong> imperfetta il procedimento di analisi a ritroso e<br />

la nozione di equilibrio perfetto nei sottogiochi.<br />

Ora l’essenza dell’idea di perfezione nei sottogiochi nei giochi <strong>con</strong><br />

<strong>informazione</strong> perfetta è quella di sostituire sull’albero del gioco un<br />

sottogioco col profilo di pagamenti che risulta dall’uso di un equilibrio di<br />

Nash del sottogioco, che esclude scelte irrazionali in ogni nodo del<br />

sottogioco stesso; se il sottogioco ha un solo equilibrio di Nash esso è<br />

necessariamente perfetto nel senso suddetto..<br />

In qualche caso tale idea funziona anche nei giochi <strong>con</strong> <strong>informazione</strong><br />

imperfetta, come nel seguente<br />

Esempio 1 (Fudenberg e Tirole). Consideriamo il gioco astratto<br />

rappresentato in forma estesa dall’albero disegnato di seguito:<br />

10


Tentiamo l’analisi a ritroso standard. Nel nodo prefinale d II preferisce<br />

l’azione R', mentre nel nodo prefinale e ella preferisce l’azione L'. Ma<br />

siccome i nodi d ed e appartengono allo stesso insieme di informazioni<br />

ed ella deve operare un’unica scelta tra L' ed R', non ne ricaviamo nulla.<br />

Se però risaliamo all’indietro l’albero vediamo che il sottogioco che ha<br />

radice nel nodo c è il gioco a somma zero <strong>con</strong> mosse simultanee<br />

che ha un unico equilibrio di Nash in cui ciascuno dei due giocatori<br />

sceglie <strong>con</strong> la stessa probabilità ciascuna delle sue due strategie pure,<br />

<strong>con</strong> pagamenti (0, 0). Sostituendo il sottogioco <strong>con</strong> radice in c col vettore<br />

di pagamenti (0, 0) si ottiene il gioco<br />

che ha l’equilibrio perfetto nei sottogiochi (r, L) <strong>con</strong> pagamenti (3, 1). In<br />

definitiva il gioco di partenza ha un unico equilibrio perfetto nei<br />

sottogiochi in cui I usa la strategia r, 1<br />

[ l ']<br />

+<br />

2 1<br />

⎛<br />

⎞<br />

[ r ']<br />

⎝<br />

⎜<br />

2 ⎠<br />

⎟ e II usa la<br />

strategia L, 1<br />

[ L ']<br />

+<br />

2 1<br />

2 R'<br />

⎛<br />

⎞<br />

[ ]<br />

⎝<br />

⎜<br />

⎠<br />

⎟ .<br />

L’idea di utilizzare la perfezione nei sottogiochi risulta però del tutto<br />

inefficace in quei giochi, in forma estesa e <strong>con</strong> <strong>informazione</strong> imperfetta,<br />

che non possiedono sottogiochi propri. In tali casi si utilizza la nozione<br />

di equilibrio bayesiano perfetto (o quella analoga di equilibrio<br />

sequenziale), che differisce in modo sostanziale dalle nozioni di<br />

equilibrio utilizzate in precedenza perché è una coppia costituita da un<br />

profilo di strategie e da un “sistema di credenze”.<br />

11


Tale nozione di equilibrio è costruita sulla base delle richieste che ora<br />

formuliamo.<br />

• Richiesta 1 (Credenze) In ciascun suo insieme di informazioni, il<br />

giocatore che ivi è chiamato a muovere deve avere delle credenze su<br />

quale nodo dell’insieme sia stato effettivamente raggiunto nello<br />

sviluppo del gioco.<br />

Una credenza (belief) relativa ad un insieme di informazioni γ è<br />

dunque una distribuzione di probabilità (a posteriori) sui nodi di γ 6 ed un<br />

sistema di credenze è una famiglia di tante distribuzioni di probabilità<br />

quanti sono gli insiemi di credenze.<br />

Noi supporremo sempre nel seguito che se viene giocato un profilo di<br />

strategie σ, il sistema di credenze µ dei giocatori sia <strong>con</strong>oscenza comune<br />

dei giocatori.<br />

• Richiesta 2 (Razionalità sequenziale) Date le loro credenze, le<br />

strategie scelte dai giocatori devono essere sequenzialmente<br />

razionali. Ossia, partendo da un qualsiasi insieme di informazioni<br />

dell’albero, il profilo di strategie <strong>con</strong>tinua ad essere un profilo di<br />

strategie di equilibrio, dato il sistema di credenze.<br />

• Richiesta 3 (Consistenza debole) Le credenze dei giocatori devono<br />

essere debolmente <strong>con</strong>sistenti <strong>con</strong> le strategie, nel senso che esse<br />

devono essere ottenute dalle strategie e dalle azioni osservate<br />

mediante l’uso del teorema di Bayes, ogni qualvoltta risulti possibile<br />

applicarlo.<br />

Ciò premesso, definiamo Equilibrio Bayesiano Perfetto (EBP) una<br />

coppia (σ, µ), dove σ è un profilo di strategie di comportamento e µ un<br />

sistema di credenze per il gioco, tali che risultino soddisfatte le richieste<br />

1, 2, 3. Ossia in ogni insieme di informazioni il profilo di strategie σ<br />

deve indicare scelte ottimali date le credenze, e il sistema di credenze µ<br />

deve essere debolmente <strong>con</strong>sistente <strong>con</strong> σ.<br />

Si noti che la ricerca delle strategie ottimali e delle credenze è<br />

simultanea, come se si trattasse della risoluzione di un sistema di<br />

equazioni.<br />

L’esistenza di almeno un EBP in ogni gioco finito in forma estesa è<br />

assicurata da un risultato (in realtà più forte) ottenuto da Kreps e Wilson,<br />

da cui discende anche la seguente<br />

6 Ovviamente se γ è un singoletto, allora l’unico nodo di γ sarebbe scelto <strong>con</strong><br />

probabilità 1, qualora γ fosse effettivamente raggiunto.<br />

12


Proposizione. Se (σ, µ) è un equilibrio bayesiano perfetto di un gioco in<br />

forma estesa <strong>con</strong> ricordo perfetto, allora σ è un equilibrio di Nash (in<br />

strategie di comportamento).<br />

La nozione di EBP lascia irrisolto il problema di come un giocatore<br />

debba aggiornare le sue credenze in un suo insieme di informazioni γ<br />

(<strong>con</strong> due o più nodi) che sia fuori dal cammino di equilibrio. Infatti se i<br />

giocatori seguono fedelmente il profilo di strategie σ, la probabilità che<br />

venga raggiunto γ è zero ed allora non si può applicare la regola di<br />

Bayes. In un tale insieme di informazioni γ ogni credenza è allora<br />

ammissibile. Ciò implica che in γ il giocatore (cui γ appartiene) può<br />

scegliere qualsiasi azione a sua disposizione, a patto peraltro di<br />

comportarsi razionalmente rispetto a qualche credenza.<br />

È possibile raffinare la nozione di EBP in modo da prendere in<br />

<strong>con</strong>siderazione il problema ora segnalato, ma noi semplicemente lo<br />

ignoreremo e, all’occorrenza, ci regoleremo in modo empirico.<br />

Esempio 2 (Il cavallo di Selten 7 ). Consideriamo il seguente gioco in<br />

forma estesa <strong>con</strong> tre giocatori I, II e III, nel quale, per evidenziare la<br />

motivazione del nome attribuito a questo gioco rappresentiamo l’albero<br />

<strong>con</strong> la radice a posta in alto (l’albero assume allora la forma di un<br />

cavallo stilizzato).<br />

7 Reinhard Selten ha ottenuto il premio Nobel 1994 per le scienze e<strong>con</strong>omiche<br />

assieme a John F. Nash ed a John Harsanyi.<br />

13


Come chi legge può verificare da sola/o i due profili di strategie pure<br />

(L, r2, l3) ed (R, r2, r3) sono equilibri di Nash. Per ciascuno di essi<br />

studiamo se è possibile associare al profilo di strategie un sistema di<br />

credenze µ, in modo tale che la coppia costituita dal profilo di strategie e<br />

dal sistema di credenze costituisca un EBP. Ovviamente si ha µ{a} = µ{b}<br />

= 1 mentre poi poniamo µ{c, d} = (p, 1 – p) <strong>con</strong> p ∈[0, 1] da determinare,<br />

se possibile.<br />

Cominciamo dal profilo (L, r2, l3). Se (p, 1 – p) è la credenza di III in<br />

{c, d} i pagamenti attesi derivanti dall’uso di (L, r2, l3) sono<br />

(5 – p, 5 – p, 4p) .<br />

Ora, osservando che il pagamento 5 – p del giocatore II è > 3 per ogni p<br />

∈[0, 1], è irrazionale che II usi r2 anziché l2 se I usa L e III usa l3, quale<br />

che sia il sistema di credenze µ, e dunque l’equilibrio di Nash (L, r2, l3)<br />

non genera alcun EBP.<br />

Consideriamo ora il profilo di strategie (R, r2, r3), che sappiamo essere<br />

un equilibrio di Nash, ed associamo ad esso un sistema di credenze µ <strong>con</strong><br />

µ{c, d} = (p, 1 – p) e p ∈[0, 1] da determinare.<br />

Tuttavia, nel caso attuale, l’insieme di informazioni {c, d} viene<br />

raggiunto <strong>con</strong> probabilità zero poiché è fuori dal percorso individuato dal<br />

profilo di strategie. Qualsiasi credenza µ{c, d} = (p, 1 – p) è allora<br />

ammissibile in tale insieme di informazioni, a patto che essa sia coerente<br />

<strong>con</strong> la scelta r3 di III in {c, d}. Allora ragioniamo così. Se il gioco (per<br />

esempio, per un errore di esecuzione di una mossa) raggiungesse<br />

l’insieme di informazioni {c, d} il giocatore III otterrebbe 4p scegliendo<br />

l3 e 2 – p scegliendo r3 e poiché 2 – p > 4p ⇔ 0 ≤ p < 2/5, ogni credenza<br />

(p, 1 – p) <strong>con</strong> 0 ≤ p < 2/5 è coerente <strong>con</strong> la scelta r3. Inoltre date tali<br />

credenze e data la scelta R di I in {a} ed r3 di III in {c, d} se II deviasse<br />

da r2 ad l2 otterrebbe un pagamento atteso di 2(1 – p) anziché di 3 ed I, se<br />

deviasse da R ad L, otterrebbe 1 – p anziché 3.<br />

In <strong>con</strong>clusione ogni coppia (s, µ) <strong>con</strong> s = (R, r2, r3) e µ = (1 ; 1; (p, 1 –<br />

p)) <strong>con</strong> p ∈ [0, 2/5[ costituisce un EBP. [Peraltro il fatto che un singolo<br />

equilibrio di Nash possa dar luogo ad infiniti EBP mostra i limiti della<br />

nozione di EBP.]<br />

Nel prossimo paragrafo utilizzeremo la nozione di EBP per la<br />

risoluzione di un gioco dinamico <strong>con</strong> <strong>informazione</strong> <strong>asimmetrica</strong>.<br />

L’esempio ci servirà anche per illustrare l’idea di Harsanyi per<br />

14


trasformare una situazione <strong>con</strong> <strong>informazione</strong> incompleta in un gioco <strong>con</strong><br />

<strong>informazione</strong> completa ma imperfetta.<br />

<strong>10.</strong>6. La trasformazione di Harsanyi. Equilibri separanti,<br />

<strong>con</strong>globanti, semiseparanti<br />

Traggo da [DS] il seguente<br />

Esempio. La vecchia e <strong>con</strong>solidata ditta ANTICA si trova sul mercato a<br />

produrre un certo bene in regime di monopolio. Ma ora essa deve<br />

<strong>con</strong>frontarsi <strong>con</strong> NOVA, una nuova ditta che vuole competere <strong>con</strong><br />

ANTICA per il mercato di quel bene. ANTICA deve decidere se<br />

affrontare una guerra dei prezzi.<br />

Alla fine il mercato di quel bene sarà dominato da una sola ditta e cioè<br />

da ANTICA se NOVA decide di non sfidarla, da NOVA se essa stessa<br />

sfida e ANTICA si ritira dal mercato, e dalla vincitrice del <strong>con</strong>flitto se<br />

NOVA sfida e ANTICA si batte <strong>con</strong> lei.<br />

ANTICA si trova in questa situazione: se NOVA ha una tecnologia più<br />

efficiente, allora ANTICA non può pensare di vincere la competizione e<br />

farebbe meglio a ritirarsi da quel mercato, lasciando il campo libero a<br />

NOVA. Diremo, in un tale caso, che NOVA è di tipo Forte mentre<br />

diremo in caso <strong>con</strong>trario che NOVA è di tipo Debole.<br />

In caso di <strong>con</strong>flitto effettivo, ANTICA s<strong>con</strong>figgerà una NOVA di tipo<br />

Debole, mentre una NOVA di tipo Forte s<strong>con</strong>figgerà ANTICA.<br />

Nella tabella che segue indichiamo i pagamenti a NOVA, presa come<br />

giocatore I, e ad ANTICA, presa come giocatore II, nel caso che NOVA<br />

sfidi. L’idea è che una NOVA di tipo Forte può ottenere un’utilità di 4 se<br />

è lasciata sola a dominare il mercato, mentre ANTICA può ottenere 3 e<br />

una nova di tipo Debole solo 2; ma un <strong>con</strong>flitto effettivo ha un costo di<br />

due utili per ciascuna.<br />

Tabella dei pagamenti (nel caso che NOVA sfidi)<br />

15


[Per esempio i pagamenti nella cella in basso a sinistra sono calcolati<br />

così: una NOVA Debole perde 2, che è il costo della lotta, e ANTICA<br />

ottiene 3 per la vittoria ma paga 2 per il costo della lotta e quindi ottiene<br />

il pagamento 1.]<br />

Le cose sarebbero semplici se ANTICA <strong>con</strong>oscesse il vero tipo di<br />

NOVA. Allora, nel caso di NOVA Debole, il gioco sarebbe<br />

che ha l’unico equilibrio perfetto nei sottogiochi (non sfida, lotta).<br />

E, nel caso di NOVA Forte, il gioco sarebbe<br />

<strong>con</strong> l’equilibrio perfetto nei sottogiochi (sfida, si ritira) e pagamenti (4, 0).<br />

Ma le cose non stanno così perché, mentre NOVA <strong>con</strong>osce il suo proprio<br />

tipo, ANTICA non <strong>con</strong>osce il vero tipo di NOVA, che potrebbe anche<br />

millantare un profilo superiore, pur essendo di tipo Debole, sperando di<br />

indurre ANTICA a ritirarsi e godere essa stessa dei profitti di una<br />

situazione di monopolio. ANTICA <strong>con</strong>osce però la situazione generale<br />

dell'industria e della tecnologia ed è in grado di formulare una <strong>con</strong>gettura<br />

sulla probabilità a priori che NOVA sia di tipo Debole. Indichiamo <strong>con</strong> d<br />

tale probabilità e supponiamo che essa sia <strong>con</strong>oscenza comune di I e di<br />

II. È proprio sull'ipotesi che le credenze a priori dei giocatori siano<br />

<strong>con</strong>oscenza comune degli stessi che fa perno la metodologia di Harsanyi<br />

per tradurre una situazione <strong>con</strong> <strong>informazione</strong> incompleta in un gioco <strong>con</strong><br />

16


<strong>informazione</strong> completa ma imperfetta. 8 Egli propone come mossa<br />

iniziale di un tale gioco una mossa della Fortuna 9 che, nel nostro<br />

esempio, sceglie <strong>con</strong> probabilità d il tipo Debole di NOVA e <strong>con</strong><br />

probabilità (1 - d) il tipo Forte di NOVA.<br />

ANTICA deve scegliere se lottare, senza <strong>con</strong>oscere il vero tipo della<br />

sfidante quando essa si presenta. A sua volta NOVA deve decidere se<br />

sfidare, sapendo che ANTICA attribuisce (a priori) probabilità d<br />

all’evento che NOVA sia di tipo Debole. Di fronte ad una sfida e senza<br />

ulteriori basi per l’<strong>informazione</strong>, ANTICA calcolerà il suo pagamento<br />

atteso derivante dallo s<strong>con</strong>tro come<br />

d · 1 + (1 - d) · (-2) = 3d – 2 .<br />

Se il pagamento (di II) è positivo, cioè se d > 2/3, ANTICA lotterà;<br />

altrimenti si ritirerà. Ciò ha un chiaro significato: se la credenza a priori<br />

di ANTICA è che verosimilmente NOVA è di tipo Debole, allora ha<br />

senso per ANTICA affrontarla.<br />

Ora supponiamo che NOVA possa fornire qualche segnale della propria<br />

forza: per esempio, esibendo prototipi di prodotti avanzati, benchè non<br />

abbia ancora la capacità di produrre grandi quantità allo stesso livello<br />

qualitativo. Chiamiamo tali attività esibizione. Se NOVA è davvero<br />

Forte, essa compie un’esibizione automaticamente e senza costo alcuno.<br />

Una NOVA Debole può cercare di camuffarsi da Forte mediante<br />

un’esibizione, ma tale comportamento implica un costo aggiuntivo.<br />

Ora sia c l’utilità che I attribuisce alla somma di denaro che I deve<br />

spendere per l’esibizione, quando è Debole. Supponiamo che anche il<br />

valore c, come quello di d, sia <strong>con</strong>oscenza comune di I e di II. 10<br />

8<br />

Per evitare l’abuso linguistico denunciato nel paragrafo <strong>10.</strong>1 alcuni autori usano la<br />

locuzione “gioco <strong>con</strong> <strong>informazione</strong> incompleta” per riferirsi al risultato finale della<br />

trasformazione di Harsanyi e cioè un gioco <strong>con</strong> <strong>informazione</strong> imperfetta in cui la<br />

Fortuna muove per prima e la sua scelta non è osservata da uno almeno dei giocatori.<br />

Con una tale interpretazione il gioco di carte G3 (di Myerson), descritto in 2.11., è un<br />

gioco <strong>con</strong> <strong>informazione</strong> incompleta. Myerson stesso però chiarisce così la sua<br />

interpretazione del termine “<strong>informazione</strong> incompleta”: il gioco G3 ha <strong>informazione</strong><br />

incompleta se I <strong>con</strong>osce il colore della carta (cioè ha un’<strong>informazione</strong> privata) ancora<br />

prima che siano rivelate a I e a II le regole del gioco: altrimenti il gioco G3 ha<br />

<strong>informazione</strong> imperfetta, ma completa.<br />

9<br />

Molti autori (i più) usano il termine “Natura”, anziché “Fortuna”, per indicare un<br />

fittizio “Giocatore Zero”.<br />

10<br />

La metodologia di Harsanyi non fornisce alcuna indicazione sul modo in cui I e II<br />

possono pervenire ad una valutazione comune di d e di c.<br />

17


L’albero del gioco, disegnato qui di seguito, ha alcune caratteristiche<br />

speciali che prendono in <strong>con</strong>to l’asimmetria dell’<strong>informazione</strong>. Primo, il<br />

tipo di NOVA è aleatorio; perciò il gioco inizia in un nodo (detto<br />

“storico”) in cui la Fortuna (o la Natura) fa tale scelta <strong>con</strong> probabilità d e<br />

1 - d. I nodi successivi, a e b, appartengono a NOVA, che, <strong>con</strong>oscendo il<br />

suo proprio tipo, deve decidere se sfidare e, nel caso che sia Debole, se<br />

cercare di imitare il tipo Forte <strong>con</strong> un’esibizione che ha costo c.<br />

Albero del gioco NOVA-ANTICA<br />

Poi, sul livello successivo dell’albero, arrivano gli insiemi di<br />

<strong>informazione</strong> di ANTICA. Quando sceglie, ANTICA non <strong>con</strong>osce per<br />

certo il vero tipo di NOVA, ma può osservare se c’è una esibizione. Se<br />

NOVA sfida senza esibizione, ANTICA ne intuisce che NOVA è di tipo<br />

Debole e perciò si ha un insieme di informazioni che ha un solo nodo<br />

(nel nodo α, ANTICA ovviamente lotta). C’è inoltre la coppia di nodi<br />

{ß, y} che costituisce un altro insieme di informazioni di ANTICA.<br />

Descritto il gioco, andiamo alla caccia degli EBP. Per semplificare<br />

l’analisi suddividiamo il lavoro nella ricerca degli equilibri che<br />

comportano separazione dei tipi di NOVA (detti equilibri separanti),<br />

<strong>con</strong>globazione dei tipi (equilibri <strong>con</strong>globanti) o una miscela delle due<br />

cose (equilibri semiseparanti). La natura dell’equilibrio dipende dalla<br />

probabilità d che NOVA sia debole e dal costo c dell’esibizione per un<br />

tipo debole. Cominciamo <strong>con</strong> la ricerca degli equilibri separanti.<br />

a) Equilibrio separante. Se il costo che il tipo debole di NOVA deve<br />

pagare per l’esibizione è per lei troppo alto, allora la presenza o meno di<br />

esibizione permette di separare i due tipi. Precisamente, se c > 2, il tipo<br />

18


debole di NOVA ottiene comunque un pagamento negativo se cerca di<br />

sfidare (il livello di riferimento per lo statu quo è c = 0) ed allora è<br />

irrazionale per lei sfidare. Quindi, se c > 2, ANTICA può inferire che<br />

una NOVA che usa l’esibizione è forte, <strong>con</strong> probabilità 1.<br />

Supposta allora soddisfatta la <strong>con</strong>dizione c > 2, si può <strong>con</strong>getturare<br />

che, in equilibrio,<br />

(i) NOVA sfida se è forte e non sfida se è debole;<br />

(ii) se ANTICA osserva una sfida <strong>con</strong> esibizione, essa ne deduce che,<br />

<strong>con</strong> probabilità 1, NOVA è forte e perciò essa si ritira; se<br />

ANTICA osserva una sfida senza esibizione, essa ne deduce che,<br />

<strong>con</strong> probabilità 1, NOVA è debole e perciò lotta.<br />

Detto in modo più formale, vogliamo provare che la coppia costituita dal<br />

profilo di strategie (pure)<br />

( σ{ a}<br />

, σ{ b}<br />

; τ{ α}<br />

, τ{ β,γ } ) = (non sfida, sfida; lotta, si ritira) 11<br />

e dal sistema di credenze a posteriori<br />

( µ { a}<br />

, µ { b}<br />

; µ { α}<br />

, µ { β,γ } ) = ( 1, 1; 1, ( 0; 1)<br />

)<br />

costituisce un EBP.<br />

( ) = (non sfida, sfida) di NOVA, ANTICA<br />

Data la strategia σ{ a}<br />

, σ{ b}<br />

inferisce correttamente che un’esibizione indica forza e che l’assenza di<br />

esibizione indica debolezza. Dai pagamenti notiamo che ANTICA<br />

preferisce lottare <strong>con</strong> una NOVA di tipo debole e preferisce ritirarsi <strong>con</strong><br />

una NOVA di tipo forte. Perciò la strategia di ANTICA τ α<br />

( { } , τ{ β,γ } ) =<br />

(lotta, si ritira) è risposta ottimale alla strategia (non sfida, sfida) di<br />

NOVA.<br />

Data la strategia τ α<br />

( { } , τ{ β,γ } ) = (lotta, si ritira) di ANTICA e dato il<br />

sistema di credenze µ, la strategia (non sfida, sfida) di NOVA è risposta<br />

ottimale a τ, dal momento che<br />

• una NOVA debole ottiene 0 se non sfida, -2 se sfida senza<br />

esibizione, 2 – c < 0 se sfida <strong>con</strong> esibizione;<br />

• una NOVA di tipo forte ha sempre interesse a sfidare.<br />

b) Equilibrio <strong>con</strong>globante. Se il costo dell’esibizione è “piccolo”, ci<br />

dobbiamo aspettare che un tipo debole di NOVA usi l’esibizione per<br />

11<br />

È il profilo di strategie di comportamento ( ( 0, 0, 1),<br />

( 1, 0);<br />

( 1, 0),<br />

( 0, 1)<br />

).<br />

19


camuffarsi da tipo forte. Perciò, se c < 2, andiamo alla caccia di un<br />

equilibrio <strong>con</strong>globante.<br />

Tuttavia c’è un ulteriore <strong>con</strong>dizione perché possa esistere un tale<br />

equilibrio e cioè che sia sufficientemente piccola la probabilità d che<br />

NOVA sia debole. Altrimenti, se è molto probabile che NOVA sia<br />

debole, ANTICA troverà ottimale <strong>con</strong>trare qualsiasi sfidante, ma allora<br />

per il tipo debole di NOVA non è più ottimale sfidare.<br />

Partiamo allora supponendo che sia c < 2 e cerchiamo di determinare un<br />

valore critico d * ∈ ]0, 1[ tale che se d < d * sono soddisfatte tutte le<br />

<strong>con</strong>dizioni perché esista un EBP <strong>con</strong>globante. Ossia pretendiamo che, in<br />

equilibrio, siano verificati i seguenti due punti:<br />

1. Entrambi i tipi di NOVA sfidano ed (anche) il tipo debole usa<br />

l’esibizione.<br />

2. ANTICA si ritira se appare una sfidante <strong>con</strong> esibizione, mentre<br />

accetta la sfida se appare una sfidante senza esibizione.<br />

Data la strategia di NOVA (al punto 1.), ANTICA non può dedurre<br />

alcunchè osservando l’esibizione, e la sua valutazione della probabilità<br />

che essa abbia di fronte una NOVA di tipo debole rimane d. Perciò il<br />

pagamento atteso di ANTICA derivante dallo s<strong>con</strong>tro è<br />

d · 1 + (1 - d) · (-2) = 3d – 2 .<br />

Se d < 2/3 tale pagamento atteso è negativo ed è ottimale per ANTICA<br />

ritirarsi <strong>con</strong> pagamento 0. Così un tipo debole di NOVA riesce a<br />

camuffarsi <strong>con</strong> successo.<br />

Supponiamo ora c < 2 e d < 2/3 (= d * ) e proviamo che la strategia di<br />

NOVA, indicata al punto 1. è risposta ottimale alla strategia di ANTICA,<br />

indicata al punto 2.. Infatti, in risposta alla strategia di ANTICA, una<br />

NOVA tipo debole ottiene 2 - c > 0 sfidando <strong>con</strong> esibizione, 0 non<br />

sfidando e -2 sfidando senza esibizione. Se poi NOVA è di tipo forte, per<br />

lei è sempre ottimale sfidare.<br />

Abbiamo quindi provato che, se c < 2 e d < 2/3, la coppia costituita dal<br />

profilo di strategie pure<br />

( σ{ a}<br />

, σ{ b}<br />

; τ{ α}<br />

, τ{ β,γ } ) = (sfida <strong>con</strong> esibizione, sfida; lotta, si ritira)<br />

e dal sistema di credenze a posteriori<br />

( µ { a}<br />

, µ { b}<br />

; µ { α}<br />

, µ { β,γ } ) = ( 1, 1; 1, ( d; 1 - d)<br />

)<br />

costituisce un EBP (<strong>con</strong>globante).<br />

c) Equilibrio semiseparante.<br />

Cerchiamo ora un equilibrio nel caso che sia c < 2 e d > 2/3.<br />

20


In tale caso l’equilibrio non può essere separante.<br />

Infatti, se la strategia di NOVA è di non sfidare se debole e di sfidare<br />

(<strong>con</strong> esibizione) se forte, allora ANTICA ne inferirebbe che una sfida<br />

<strong>con</strong> esibizione è l’evidenza di un tipo forte e dunque, in tal caso, si<br />

ritirerebbe. Ma allora un tipo debole di NOVA dovrebbe sfruttare tale<br />

credenza e sfidare <strong>con</strong> esibizione spacciandosi per forte, perché stavolta,<br />

<strong>con</strong> c < 2, NOVA debole otterrebbe un pagamento 2 - c positivo.<br />

Né ci può essere un equilibrio (completamente) <strong>con</strong>globante.<br />

Infatti, allorchè d > 2/3, la probabilità che NOVA sia di tipo debole è<br />

così alta che, se NOVA sfida <strong>con</strong> esibizione, è ottimale per ANTICA<br />

affrontare sempre la sfida, ed allora una NOVA di tipo debole ottiene (-2<br />

- c). In tale caso il tipo debole di NOVA non dovrebbe esibirsi (né<br />

comunque sfidare) e la <strong>con</strong>globazione non può reggere.<br />

L’analisi ora svolta mostra che, nel caso c < 2 e d > 2/3, non può essere<br />

ottimale per il tipo debole di NOVA non sfidare mai né può essere<br />

ottimale sfidare sempre. In altre parole l’equilibrio dovrà coinvolgere<br />

strategie “miste” 12 . Perciò cerchiamo un equilibrio in strategie miste in<br />

cui<br />

(i) un tipo debole di NOVA sfida <strong>con</strong> probabilità p;<br />

(ii) ANTICA trae le sue inferenze dalle osservazioni usando il<br />

teorema di Bayes, e risponde ad una sfida <strong>con</strong> esibizione<br />

accettando la sfida <strong>con</strong> probabilità q (e ritirandosi <strong>con</strong> probabilità<br />

(1 - q)) ed ad una sfida senza esibizione accettando la sfida <strong>con</strong><br />

probabilità 1.<br />

Vogliamo quindi determinare p ∈ ]0, 1[ e q ∈ ]0, 1[ compatibili <strong>con</strong> la<br />

richiesta di un equilibrio in strategie miste. Prima dobbiamo vedere come<br />

la regola di Bayes fornisce ad ANTICA le sue proprie inferenze<br />

osservando una sfida <strong>con</strong> esibizione.<br />

Nella tabella seguente riportiamo le probabilità delle varie combinazioni<br />

del “vero stato del mondo” (il vero tipo di NOVA) e dell’osservazione<br />

dell’esibizione.<br />

12 Qui col termine “strategia mista” vogliamo intendere una strategia di<br />

comportamento che non degenera in una strategia pura.<br />

21


Probabilità delle combinazioni (Tipo di NOVA, Esibizione sì/no)<br />

come vengono inferite da ANTICA nel caso c < 2 e d > 2/3.<br />

Perciò se ANTICA sa che c < 2 e d > 2/3 ed osserva una sfida <strong>con</strong><br />

esibizione, essa ricalcola la probabilità che NOVA sia di tipo debole,<br />

<strong>con</strong>dizionata dal fatto che ha osservato l’esibizione. In base al teorema di<br />

Bayes, tale probabilità è<br />

dp<br />

1 - d + dp .<br />

Analogamente la probabilità <strong>con</strong>dizionata (dall’esibizione) che NOVA<br />

sia forte è<br />

1 - d<br />

1 - d + dp .<br />

Allora, usando tali probabilità a posteriori, ANTICA ricalcola il suo<br />

proprio pagamento atteso nello s<strong>con</strong>tro come<br />

dp<br />

1 - d dp - 2( 1 - d)<br />

1 · + (-2) · =<br />

1 - d + dp 1 - d + dp 1 - d + dp .<br />

In equilibrio tale pagamento atteso deve risultare uguale al pagamento<br />

atteso che ANTICA ottiene ritirandosi, che vale 0. Perché valga tale<br />

uguaglianza deve essere<br />

1 - d<br />

da cui si ricava p = 2<br />

d<br />

dp - 2(1 - d) = 0<br />

(ricordiamo che d > 2/3 il che assicura che<br />

p ≤ 1).<br />

Allorchè d cresce da 2/3 fino ad 1, p cala da 1 a 0.<br />

Ciò significa (nel <strong>con</strong>testo del nostro problema) che, allorchè aumenta la<br />

probabilità che NOVA sia debole, una NOVA di tipo debole che<br />

22


andomizza assegna una probabilità minore all’azione di sfida <strong>con</strong><br />

esibizione (per cercare di camuffarsi da tipo forte) se ciò serve per<br />

evitare la risposta di s<strong>con</strong>tro da parte di ANTICA.<br />

Infine per determinare q ∈ ]0, 1[, la probabilità <strong>con</strong> cui ANTICA<br />

raccoglie un guanto di sfida, in equilibrio, imponiamo che siano uguali il<br />

pagamento atteso che una NOVA di tipo debole riceve sfidando <strong>con</strong><br />

esibizione, e cioè<br />

q(- 2 - c) + (1 - q)(2 - c) = 2 - c - 4q<br />

e il pagamento che essa ottiene senza sfidare e cioè 0.<br />

Risolvendo l’equazione 2 - c - 4q si ottiene<br />

2 - c<br />

q =<br />

4 .<br />

L’equilibrio bayesiano perfetto dato dalle strategie di comportamento<br />

( σ{ a}<br />

, σ{ b}<br />

) = ( ( 0, p, 1 - p),<br />

( 1, 0)<br />

) di I<br />

( τ{ α}<br />

, τ{ β,γ } ) = ( ( 1, 0),<br />

( q, 1 - q)<br />

) di II<br />

e dalle credenze indicate al punto (ii), è chiamato semiseparante: se<br />

NOVA sfida senza esibizione oppure se non sfida, essa si rivela come<br />

tipo debole, ma se essa sfida <strong>con</strong> esibizione ANTICA rimane incerta su<br />

quale sia il vero tipo di NOVA.<br />

Osservazioni.<br />

1) Usualmente una segnalazione viene fatta dal giocatore più informato<br />

allorchè la sua situazione è per lui positiva, per fornire l’<strong>informazione</strong> in<br />

modo credibile. Qui però si tratta di “signal jamming”: il giocatore I più<br />

informato, allorchè la situazione è per lui negativa, sceglie, <strong>con</strong><br />

probabilità p, un’azione che vorrebbe indurre II a credere che la<br />

situazione di I è buona. La randomizzazione usata dal tipo debole fa<br />

parte di un equilibrio (sul quale si suppone che <strong>con</strong>vergano i giocatori)<br />

nel quale diventa <strong>con</strong>fuso il processo mentale di ANTICA nel trarre le<br />

sue deduzioni dalle osservazioni.<br />

2) Nell’equilibrio semiseparante ora <strong>con</strong>siderato ANTICA risponde in un<br />

modo che dà al tipo debole di NOVA lo stesso pagamento atteso che<br />

NOVA ottiene senza sfidare. Ma ora il tipo forte di NOVA deve lottare<br />

<strong>con</strong> probabilità q > 0 e (poiché in caso di s<strong>con</strong>tro essa riceve pagamento<br />

2 anziché 4) il suo pagamento atteso cala da 4 a 4(1 - q) + 2q = 4 - 2q. In<br />

altre parole, il fatto che, per l’avversaria, NOVA possa essere di tipo<br />

debole esercita un effetto esterno negativo sul tipo forte.<br />

23


<strong>10.</strong>7. Esercizi<br />

1) Bobo è seduto nel posto più prestigioso del bar dello sport e sta<br />

pensando ai fatti suoi allorchè entra nel bar un attaccabrighe (A).<br />

A vorrebbe molestare Bobo per ottenere il suo posto, ma solo se<br />

Bobo è un fifone. Se Bobo è un duro, A preferisce lasciarlo in<br />

pace. A non sa se Bobo è un fifone o un duro, tuttavia egli valuta<br />

che <strong>con</strong> probabilità 1<br />

Bobo è un duro, e questa valutazione di A è<br />

3<br />

supposta <strong>con</strong>oscenza comune dei due. Se Bobo è un fifone ed A lo<br />

molesta, Bobo lascerà il posto, ma se Bobo è un duro ed A lo<br />

molesta, egli reagirà violentemente per <strong>con</strong>servare il suo posto al<br />

bar.<br />

Supponiamo che Bobo possa segnalare se è un duro o un fifone<br />

scegliendo di bere birra o di mangiare torta. Uomini duri non<br />

amano la torta ed i fifoni non amano la birra!<br />

Bobo ottiene 2 punti se A non lo molesta e zero in caso <strong>con</strong>trario,<br />

più un punto se evita di <strong>con</strong>sumare qualcosa che non gradisce. A<br />

ottiene un punto se indovina correttamente il tipo di Bobo (e zero<br />

in caso <strong>con</strong>trario).<br />

Disegna la forma estesa di questo gioco e trovane tutti gli equilibri<br />

di Nash.<br />

2) La vecchia e <strong>con</strong>solidata ditta I, dominante in un determinato<br />

mercato, deve ora <strong>con</strong>frontarsi <strong>con</strong> una nuova ditta II, desiderosa<br />

di entrare in competizione. La ditta I deve decidere se costruire<br />

una nuova fabbrica, e simultaneamente la ditta II deve decidere se<br />

entrare effettivamente in competizione <strong>con</strong> I. Supponiamo che la<br />

ditta II sia incerta se a I costruire una nuova fabbrica costi 1.5<br />

oppure 0, mentre quest’ultima <strong>con</strong>osce il costo a cui va in<strong>con</strong>tro.<br />

Tenuto <strong>con</strong>to di ciò supponiamo che i pagamenti per le due ditte,<br />

nel caso di “alto costo” e nel caso di “basso costo” siano quelli<br />

indicati nella figura seguente (C=costruire, NC=non costruire,<br />

E=entrare, NE=non entrare).<br />

24


Supponiamo ora che II assegni uguale probabilità, e cioè 1<br />

2 ,<br />

all’evento che la ditta I sia di tipo “alto costo” e rispettivamente di<br />

tipo “basso costo” e che questa valutazione di II sia <strong>con</strong>oscenza<br />

comune di entrambi.<br />

(i) Disegna l’albero del gioco <strong>con</strong> <strong>informazione</strong> imperfetta che<br />

rappresenta la trasformazione di Harsanyi.<br />

(ii) Scrivine la relativa forma normale e determina gli equilibri di<br />

Nash di tale gioco.<br />

3) Riprendiamo il gioco G3 del paragrafo 2.11 (cfr. anche 7.6).<br />

Mostra che esso ha un unico equilibrio bayesiano perfetto formato<br />

dal profilo di strategie di comportamento<br />

[ R],<br />

1<br />

3 R [ ] ⊕ 2<br />

3 C [ ] ; 2<br />

3 V [ ] ⊕ 1<br />

3 P<br />

⎛<br />

⎞<br />

[ ]<br />

⎝<br />

⎜<br />

⎠<br />

⎟<br />

e dal sistema di credenze<br />

µ { a}<br />

= 1 , µ { b}<br />

= 1 , µ { c, d}<br />

= (0.75 ; 0.25).<br />

25

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!