10. Giochi con informazione asimmetrica - utenti
10. Giochi con informazione asimmetrica - utenti
10. Giochi con informazione asimmetrica - utenti
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>10.</strong> <strong>Giochi</strong> <strong>con</strong> <strong>informazione</strong> <strong>asimmetrica</strong><br />
<strong>10.</strong>1. Informazione <strong>asimmetrica</strong> ed <strong>informazione</strong> incompleta<br />
L’analisi dei giochi svolta sinora presuppone che tutta l’<strong>informazione</strong><br />
sulle regole del gioco sia <strong>con</strong>oscenza comune dei giocatori.<br />
Ora le situazioni della vita reale, in particolare quelle di tipo<br />
e<strong>con</strong>omico, presentano spesso asimmetria di <strong>informazione</strong>. Per esempio,<br />
• l’attitudine di un decisore ad assumersi dei rischi può non essere<br />
nota agli altri decisori;<br />
• la classe di rischio di un individuo che vuole stipulare<br />
un’assicurazione sulla vita può non essere nota alla compagnia<br />
assicuratrice;<br />
• le azioni di cui dispone un decisore, anche se note a tutti gli altri<br />
attori della situazione, possono non essere facilmente osservabili;<br />
• alcuni esiti reali, come l’entità del danno subito da un assicurato<br />
per un furto, possono essere osservabili dall’assicurato ma non da<br />
altri.<br />
Certamente un gioco <strong>con</strong> <strong>informazione</strong> imperfetta può presentare<br />
asimmetria informativa. Ciò si verifica, ad esempio, nel semplice gioco<br />
di carte (di Myerson), etichettato G3 in 2.11.. Peraltro spesso, come negli<br />
esempi citati in precedenza, manca qualche elemento perché la<br />
situazione possa essere modellata come gioco, sia pure <strong>con</strong> <strong>informazione</strong><br />
imperfetta. Si parla allora di situazione, anzi, <strong>con</strong> abuso di linguaggio, di<br />
gioco <strong>con</strong> <strong>informazione</strong> incompleta 1 .<br />
Occorre segnalare che le due nozioni di “<strong>informazione</strong> <strong>asimmetrica</strong>” e<br />
di “<strong>informazione</strong> incompleta” sono diverse. Nessuna delle due implica<br />
l’altra. Per esempio, il gioco G3 ha <strong>informazione</strong> completa (cioè è un<br />
vero gioco!) e <strong>asimmetrica</strong>. E non è difficile (pensaci sopra!) dare un<br />
esempio di una situazione che presenta <strong>informazione</strong> incompleta (per<br />
essere modellata come gioco) ma simmetrica.<br />
Nel caso che l’<strong>informazione</strong> presente in una situazione interattiva sia<br />
insufficiente per poterla modellare come gioco, Harsanyi ha suggerito<br />
1 A rigore non si dovrebbe parlare di gioco se manca qualche elemento richiesto dalla<br />
definizione di gioco. Per sanare questa discrasia linguistica, qualche autore (ad<br />
esempio, Osborne, opera citata) elimina dal suo vocabolario la locuzione “gioco <strong>con</strong><br />
<strong>informazione</strong> incompleta”.<br />
1
un’idea (“dottrina di Harsanyi”), per completare l’<strong>informazione</strong><br />
mancante, che permette talvolta di modellare la situazione come gioco<br />
<strong>con</strong> <strong>informazione</strong> imperfetta.<br />
Prima di discutere la trasformazione di Harsanyi è opportuno illustrare<br />
alcuni aspetti salienti delle situazioni <strong>con</strong> <strong>informazione</strong> <strong>asimmetrica</strong> e<br />
ridiscutere il <strong>con</strong>cetto di soluzione di un gioco dinamico <strong>con</strong><br />
<strong>informazione</strong> imperfetta.<br />
[Gli esempi presentati nei paragrafi <strong>10.</strong>3., <strong>10.</strong>4. e <strong>10.</strong>6. sono tratti da<br />
[DS]. La fonte originale per gli esempi in <strong>10.</strong>3. e <strong>10.</strong>4. è un noto lavoro<br />
di Michael Spence sulla segnalazione per il mercato del lavoro (Job<br />
Market Signaling, Quarterly Journal of E<strong>con</strong>omics, 87, 1973).]<br />
<strong>10.</strong>2. Trasmissione e manipolazione dell’<strong>informazione</strong><br />
Consideriamo una ipotetica situazione interattiva <strong>con</strong> due individui<br />
razionali, i e j, e <strong>con</strong> asimmetria di <strong>informazione</strong>: supponiamo che i sia<br />
in possesso di informazioni private che j ignora.<br />
All’individuo i, più informato 2 , può <strong>con</strong>venire una di queste scelte<br />
strategiche:<br />
a. Nas<strong>con</strong>dere il suo surplus di <strong>informazione</strong> oppure rivelarlo in<br />
modo ingannevole;<br />
b. Rivelare in modo veritiero una quantità scelta del suo surplus<br />
informativo.<br />
All’individuo j, meno informato, può <strong>con</strong>venire una di queste scelte<br />
strategiche:<br />
i. Analizzare l’<strong>informazione</strong> cercando di filtrare il vero dal falso.<br />
[Un esempio tipico è quello di un datore di lavoro che vuole<br />
scoprire le capacità di un potenziale impiegato o il livello di<br />
impegno di un impiegato effettivo.]<br />
ii. Rimanere ignorante: se j non è in grado di comprendere il<br />
significato di una mossa strategica di i, j può così immunizzarsi<br />
<strong>con</strong>tro gli impegni e le minacce di i.<br />
L’idea di base che regola le situazioni interattive in cui l’<strong>informazione</strong><br />
è <strong>asimmetrica</strong> e gli interessi dei decisori sono discordanti, è che “le<br />
azioni parlano più delle parole”. Ossia, anche se la situazione ammette<br />
2 Se la situazione può essere modellata come gioco in forma estesa, allora dire che i è<br />
più informato di j significa che i “vede” una partizione informativa globale “più fine”<br />
di quello che vede j (ossia i, ma non j, è in grado di distinguere i nodi di un qualche<br />
insieme di informazioni di j). Peraltro è difficile formalizzare una tale idea, come è<br />
stato tentato, ma in modo poco produttivo, da qualche autore.<br />
2
comunicazione tra i e j, j osserva le azioni di i ed ignora le eventuali<br />
affermazioni di i ed i, <strong>con</strong>scio di questo fatto, utilizza le sue azioni<br />
(anche) per il loro significato informativo.<br />
Se, per esemplificare, la situazione di i (il decisore più informato) può<br />
essere o buona o cattiva, i cercherà di scegliere un’azione che induca j a<br />
credere che la sua situazione è buona. Si dice allora che i usa la sua<br />
azione come segnale e l’uso di un segnale è chiamato segnalazione.<br />
In particolare, se la situazione di i è in realtà cattiva e j può<br />
ragionevolmente ritenere che essa sia cattiva, allora i può cercare di<br />
<strong>con</strong>fondere j <strong>con</strong> la scelta di una strategia che sembra indicare che la sua<br />
situazione è buona. Un tale schema di segnalazione è chiamato “signal<br />
jamming” ed implica, di regola, l’uso di una strategia di comportamento,<br />
poiché la casualità delle scelte propria delle strategie randomizzate rende<br />
<strong>con</strong>fuso il processo deduttivo.<br />
Quanto al giocatore meno informato, j, egli cercherà di usare strategie<br />
che riducano il suo svantaggio informativo. Si parla di screening<br />
(“vaglio”) per riferirsi all’uso da parte di j (il giocatore meno informato)<br />
di una strategia che induca i a rivelare il suo surplus di <strong>informazione</strong>.<br />
Il vaglio dell’<strong>informazione</strong> può richiedere l’uso di sottili stratagemmi<br />
(“mezzi di vaglio”) oppure l’applicazione di uno schema di incentivi.<br />
<strong>10.</strong>3. Rischio morale ed incentivi nel modello Principale-Agente<br />
Sia P (=principale) il titolare di una ditta, in cerca di un agente, A, che<br />
organizzi un progetto. L’esito del progetto è incerto e la probabilità di<br />
successo è correlata al livello di impegno di A.<br />
Supponiamo, per semplicità, che i livelli di impegno di A siano due soli:<br />
standard ed alto e che entrambi i decisori, P ed A, siano neutrali rispetto<br />
al rischio in denaro.<br />
Supponiamo inoltre che i seguenti dati siano <strong>con</strong>oscenza comune di P e<br />
di A:<br />
• se il progetto ha successo esso darà a P un ricavo lordo di 60˙000€;<br />
• la probabilità di successo del progetto è 0.6 se il livello di impegno di<br />
A è standard, ma sale a 0.8 se l’impegno di A è di alto livello.<br />
Un impegno di alto livello comporta però un costo soggettivo (per<br />
esempio, egli può dover dedicare il suo tempo al progetto anche nei<br />
giorni festivi). P offre ad A 10˙000€ per l’impegno di livello standard,<br />
ma A chiede a P un extra di 5˙000€ per l’impegno di alto livello.<br />
Senza l’impegno extra, P ha un profitto atteso di<br />
(60˙000 · 0.6) € = 36˙000€<br />
3
e deve dare 10˙000€ ad A, <strong>con</strong> un profitto netto atteso di 26˙000€.<br />
Con l’impegno extra di A, il profitto netto atteso diviene<br />
(60˙000 · 0.8) € - 15˙000€ = 33˙000€ .<br />
A P <strong>con</strong>viene perciò pagare ad A i 5˙000€ extra per ottenere l’impegno<br />
di alto livello.<br />
Come si può realizzare un tale <strong>con</strong>tratto? Il <strong>con</strong>tratto deve specificare<br />
che A ottiene un compenso base di 10˙000€ più un compenso extra di<br />
5˙000€ se il suo impegno è di alto livello. Tuttavia sorge un problema di<br />
rischio morale 3 . Con un tale <strong>con</strong>tratto, l’agente A può semplicemente<br />
incassare i 5˙000€ extra e lavorare <strong>con</strong> l’impegno di routine. Gran parte<br />
del lavoro è di tipo <strong>con</strong>cettuale ed egli può svolgerlo a casa di sera o nei<br />
fine settimana. Egli può sempre dire di aver fatto ciò e P non ha modo di<br />
verificarlo. Se il progetto fallisce, A può attribuire ciò alla cattiva sorte<br />
(anche <strong>con</strong> l’impegno extra c’è una probabilità del 20% di fallimento).<br />
Perciò se il livello di impegno non può venire osservato (né verificato<br />
da un giudice in caso di <strong>con</strong>troversia legale) il principale deve cautelarsi<br />
inserendo nel <strong>con</strong>tratto una clausola che può essere verificata.<br />
Nell’esempio in esame, l’unico evento che può essere osservato è il<br />
successo o il fallimento del progetto. Poiché il successo è correlato<br />
probabilisticamente all’impegno, esso dà un’<strong>informazione</strong>, anche se<br />
imperfetta, sull’impegno e ciò può servire per costruire un <strong>con</strong>tratto che<br />
serva a motivare l’impegno.<br />
Consideriamo un pacchetto retributivo, <strong>con</strong>sistente di un salario base,<br />
s, e di un bonus, b, che è pagato se e solo se il progetto ha successo.<br />
Allora il guadagno atteso di A sarà (s + 0.6b) se usa l’impegno di routine<br />
e sarà (s + 0.8b) se usa l’impegno di alto livello. Il guadagno extra di A<br />
per il maggiore impegno è (s + 0.8b) - (s + 0.6b) = 0.2b. Perché<br />
l’impegno extra valga la pena per A, deve essere vero che 0.2b ≥ 5˙000€<br />
ossia che b ≥ 25˙000€. Così un bonus abbastanza alto (per il successo)<br />
3 Il termine “rischio morale” proviene dalla matematica delle assicurazioni. Un<br />
cliente assicurato può far lievitare la probabilità di danno, per esempio furto o<br />
incendio, <strong>con</strong> un comportamento meno prudente dell’usuale, legato al fatto che si<br />
sente protetto dall’assicurazione.<br />
Più in generale, ogni problema di interazione strategica in cui il comportamento di<br />
una persona non è osservabile <strong>con</strong>figura un problema di rischio morale.<br />
In un <strong>con</strong>testo assicurativo, la compagnia assicuratrice cerca di <strong>con</strong>trollare il rischio<br />
morale richiedendo che l’assicurato <strong>con</strong>servi una parte del rischio, mediante l’uso di<br />
una franchigia e/o di uno scoperto. Ciò agisce come lo schema di incentivi di cui<br />
parliamo nell’esempio.<br />
4
crea nell’agente un incentivo sufficiente a provocare l’impegno extra. La<br />
diseguaglianza<br />
(<strong>10.</strong>3.1) 0.2b ≥ 5˙000€<br />
è una <strong>con</strong>dizione di compatibilità dell’incentivo sul pacchetto retributivo.<br />
C’è un’altra <strong>con</strong>dizione. Il pacchetto retributivo globale deve essere<br />
abbastanza alto per indurre A a lavorare per P. Se la <strong>con</strong>dizione di<br />
compatibilità dell’incentivo è soddisfatta l’agente compirà lo sforzo di<br />
alto livello, se lavora per P, e il suo guadagno atteso sarà (s + 0.8b). Ora<br />
egli (A) chiede almeno 15˙000€ per lavorare per P <strong>con</strong> un impegno di<br />
alto livello. Perciò l’offerta di P deve soddisfare la <strong>con</strong>dizione di<br />
partecipazione<br />
(<strong>10.</strong>3.2) s + 0.8b ≥ 15˙000€ .<br />
Il principale vuole però massimizzare il suo proprio profitto e perciò<br />
cerca di mantenere il più basso possibile il compenso totale di A<br />
(compatibilmente coi vincoli (<strong>10.</strong>3.1) e (<strong>10.</strong>3.2)).<br />
Volendo tenere al livello minimo possibile di 15˙000€ il compenso<br />
totale di A, P dovrebbe scegliere<br />
s = 15˙000€ - 0.8b .<br />
Ma poiché, per la (<strong>10.</strong>3.1), b deve essere almeno 25˙000€, il salario s<br />
non dovrebbe superare<br />
15˙000€ - 0.8 · 25˙000€ = -5˙000€ .<br />
Che senso ha un valore s < 0? In una prima interpretazione può essere<br />
visto come una quantità di denaro che A deve mettere nel progetto. Una<br />
se<strong>con</strong>da possibilità è che A non metta alcun suo capitale nel progetto, ma<br />
venga multato se il progetto fallisce. In molti casi nessuna delle due<br />
alternative è praticabile (A può non avere denaro da investire e la<br />
legislazione può proibire l’applicazione di penalità.).<br />
Supponendo allora che il salario base debba essere non negativo (s ≥ 0) e<br />
ponendo al livello più basso possibile sia il salario base che il bonus<br />
(ossia s = 0€ e b = 25˙000€) si ottiene<br />
0€ + 0.8 · 25˙000€ = 20˙000€ .<br />
Dunque il principale è forzato a superare, di 5˙000€, la <strong>con</strong>dizione di<br />
partecipazione. Il surplus di 5˙000€ è un costo extra dovuto al problema<br />
di osservazione 4 . Un tale tipo di costo extra esiste, in generale, nei<br />
4 Se l’impegno di A può essere verificato direttamente, allora a P <strong>con</strong>viene stipulare<br />
il <strong>con</strong>tratto <strong>con</strong> salario base di 10˙000€ e <strong>con</strong> compenso aggiuntivo di 5˙000€ per<br />
l’extra impegno.<br />
5
problemi <strong>con</strong> asimmetria informativa ed è il giocatore meno informato<br />
che deve pagarlo. Ora vogliamo verificare se, nel problema in esame, è<br />
<strong>con</strong>veniente per il principale pagare tale costo extra. Pagando il costo<br />
extra, il profitto netto atteso del principale è<br />
60˙000€ · 0.8 - 20˙000€ = 28˙000€ .<br />
Con l’impegno di routine di A, P deve pagare ad A solo il compenso<br />
base di 10˙000€ e la probabilità di successo del progetto è 0.6, per cui il<br />
profitto netto atteso di P è<br />
60˙000€ · 0.6 - 10˙000€ = 26˙000€ .<br />
Perciò, anche col costo extra generato dall’asimmetria informativa, P<br />
ottiene un profitto netto atteso un po’ più elevato usando lo schema del<br />
<strong>con</strong>tratto <strong>con</strong> incentivi.<br />
Naturalmente non è sempre così poiché la <strong>con</strong>clusione dipende, in<br />
ciascun caso, dai dati numerici del problema.<br />
<strong>10.</strong>4. Vaglio dell’<strong>informazione</strong> per la separazione dei tipi<br />
Il direttore di un importante complesso industriale vuole assumere per<br />
un impegnativo progetto pluriennale laureati in matematica o fisica o<br />
ingegneria che abbiano le capacità logiche e le <strong>con</strong>oscenze matematiche<br />
necessarie per un lavoro scientifico molto complesso.<br />
Egli ritiene che i curricula dei candidati non costituiscano un’attestazione<br />
credibile delle loro capacità: occorre un’evidenza oggettiva. Come mezzi<br />
di “screening” egli pensa allora di utilizzare i corsi molto impegnativi di<br />
un master, che l’industria stessa supporta parzialmente presso la vicina e<br />
prestigiosa università di XYZ, nell’idea che le scelte di corsi di studio da<br />
parte dei candidati possano costituire un’evidenza credibile delle loro<br />
qualità.<br />
Per semplificare il discorso supponiamo che ci siano due soli tipi di<br />
candidati (in relazione alle qualità richieste dal datore di lavoro): A =<br />
abile e B = medio. Il principale è disposto a pagare 30˙000€ all’anno ad<br />
un tipo A e 20˙000€ ad un tipo B. Poiché non può osservare<br />
direttamente il tipo del candidato, egli cerca un meccanismo efficiente<br />
per distinguere tra di essi.<br />
Supponiamo che i due tipi differiscano nella loro tolleranza<br />
nell’affrontare un corso. Ciascuno deve spendere denaro e sacrificare<br />
tempo per affrontare un corso impegnativo, ma tale costo è più lieve per<br />
un tipo A che per un tipo B. Supponiamo che i tipi A valutino il costo di<br />
ciascuno di tali corsi come equivalente, in denaro, a 1˙200€ annuali di<br />
6
salario, mentre i tipi B lo valutino come equivalente a 1˙800€ annuali di<br />
salario.<br />
Ci chiediamo se il datore di lavoro può utilizzare questa differenza per<br />
riuscire a vagliare i candidati e separare i tipi A dai tipi B.<br />
L’idea giusta può essere quella di determinare un numero (naturale) n<br />
tale che chi accetta di sostenere n (o più) corsi impegnativi è catalogato<br />
come tipo A e pagato 30˙000€ l’anno, mentre chi non accetta un tale<br />
impegno è catalogato come tipo B e pagato 20˙000€. L’alternativa per<br />
ciascun candidato è allora tra accettare un numero n ≥ n di corsi che lo<br />
evidenzino come tipo A o rinunciare accettando di rivelarsi come tipo B.<br />
Lo schema usato dal datore di lavoro deve essere tale da non<br />
incoraggiare i tipi B a seguire n corsi e tale da non scoraggiare i tipi A<br />
dal seguirli. Un valore giusto di n si ottiene imponendo che ciascun tipo<br />
abbia interesse a rivelarsi qual è.<br />
Perché ad un vero tipo A <strong>con</strong>venga rivelarsi per tale, il numero n dei<br />
corsi seguiti deve soddisfare la <strong>con</strong>dizione<br />
(<strong>10.</strong>4.1) 30˙000 - 1˙200 · n ≥ 20˙000<br />
che comporta la <strong>con</strong>dizione n ≤ 8.<br />
Perché un vero tipo B preferisca rivelarsi per tale (piuttosto che incorrere<br />
nel costo extra che comporta per lui il tentativo di spacciarsi per un tipo<br />
A), n deve soddisfare la <strong>con</strong>dizione<br />
(<strong>10.</strong>4.2) 20˙000 ≥ 30˙000 - 1˙800 ·n<br />
che comporta la <strong>con</strong>dizione n ≥ 6.<br />
È la differenza del costo (per seguire un corso impegnativo) tra i due tipi<br />
che fa sì che le due <strong>con</strong>dizioni di compatibilità (<strong>10.</strong>4.1) e (<strong>10.</strong>4.2)<br />
costituiscano per il principale uno schema atto a generare la separazione<br />
dei tipi.<br />
Si noti che nella realtà l’istruzione può anche far aumentare la<br />
produttività di un impiegato e trasformare un tipo B in tipo A. Tuttavia,<br />
nel nostro scenario semplificato la richiesta di seguire n corsi<br />
impegnativi serve solo a scopo di vaglio ed i tipi A ne devono sopportare<br />
il costo extra dovuto all’asimmetria dell’<strong>informazione</strong>.<br />
Supponendo di usare il numero minimo di corsi necessario per ottenere<br />
la separazione, e cioè n = n = 6, il costo per il tipo A ha un equivalente<br />
monetario di 6 · 1˙200€ = 7˙200€.<br />
Si dice che c’è un effetto esterno negativo inflitto dai tipi B ai tipi A:<br />
infatti tale costo non esisterebbe se la popolazione dei candidati<br />
<strong>con</strong>sistesse solo di tipi A oppure se il tipo di una persona potesse essere<br />
verificato direttamente.<br />
7
Ci si può chiedere se per un tipo A può risultare preferibile non<br />
impegnarsi affatto per la separazione dei tipi, piuttosto che sopportare il<br />
costo. Con la separazione dei tipi, un tipo A ottiene un guadagno netto di<br />
30˙000€ -7˙200€ = 22˙800€<br />
ed un tipo B ottiene 20˙000€.<br />
Cosa accade se i due tipi non vengono separati? Se i datori di lavoro non<br />
usano mezzi di screening, essi devono scegliere a caso tra i richiedenti e<br />
pagare a tutti lo stesso salario. Si parla allora di <strong>con</strong>globazione (pooling)<br />
dei tipi. Con la <strong>con</strong>globazione dei tipi, in un mercato competitivo per il<br />
lavoro, il salario comune sarà la media di quanto valgono i tipi per il<br />
datore di lavoro e tale media dipende dalla popolazione dei tipi nella<br />
popolazione dei richiedenti. Per esempio, se il 20% dei richiedenti è di<br />
tipo A e l’80% è di tipo B, allora il salario comune <strong>con</strong> la <strong>con</strong>globazione<br />
sarà<br />
30˙000€ · 0.2 + 20˙000€ · 0.8 = 22˙000€ .<br />
Allora i tipi A preferiranno la situazione <strong>con</strong> la separazione dei tipi,<br />
poiché essa comporta 22˙800€ anziché 22˙000€.<br />
Ma se la proporzione è 50% - 50%, allora il salario comune sotto pooling<br />
sarà di 25˙000€ ed i tipi A preferiranno la <strong>con</strong>globazione. I tipi B<br />
preferiranno sempre la <strong>con</strong>globazione, poiché la presenza di tipi A nella<br />
popolazione degli agenti implica che il salario comune eccederà sempre<br />
quello che percepis<strong>con</strong>o i tipi B in regime di separazione (nel nostro<br />
esempio 20˙000€).<br />
Tuttavia, anche se entrambi i tipi preferis<strong>con</strong>o la <strong>con</strong>globazione, la<br />
situazione può non essere stabile. Supponiamo che le proporzioni nella<br />
popolazione dei possibili agenti siano 50% - 50% (tipi A e tipi B) e che<br />
la situazione iniziale presenti <strong>con</strong>globazione in cui entrambi i tipi<br />
preferis<strong>con</strong>o 25˙000€.<br />
Un imprenditore può annunciare che pagherà 26˙500€ a chi sosterrà un<br />
corso tosto. I tipi A troveranno ciò proficuo (rispetto alla situazione<br />
iniziale) poiché il loro costo per un corso è di 1˙200€ mentre l’aumento<br />
di salario è di 1˙500€, mentre i tipi B non lo troveranno proficuo perché<br />
il loro costo per un corso, 1˙800€, eccede l’aumento di salario. Poiché<br />
questo particolare imprenditore attrae selettivamente i tipi A, ciascuno<br />
dei quali vale 30˙000€ ma che paga 26˙500€, egli trae vantaggio dal<br />
deviare dal pacchetto salariale della <strong>con</strong>globazione.<br />
Ma tale deviazione innesca un processo che porta al collasso della<br />
precedente situazione di pooling. Siccome i tipi A si accalcano a lavorare<br />
per lui, il parco agenti disponibile per gli altri imprenditori diviene di<br />
8
qualità media inferiore e può non valere il salario di 25˙000€. Se tale<br />
salario viene abbassato, allora la differenza rispetto ai 26˙500€ offerti<br />
dall’imprenditore deviante, può raggiungere un livello tale che anche i<br />
tipi B trovano <strong>con</strong>veniente affrontare un corso tosto. Ma allora il<br />
deviante può alzare la sua richiesta a 2 corsi, accrescendo il differenziale<br />
di salario ma in modo tale che i tipi B non abbiano interesse ad agire<br />
come i tipi A. Altri imprenditori, che anch’essi desiderano attirare dei<br />
tipi A, devono usare delle strategie analoghe se li vogliono attrarre.<br />
Questo processo <strong>con</strong>tinua finchè il mercato raggiunge l’equilibrio<br />
separante descritto in precedenza.<br />
Nell’esempio, la richiesta di un corso tosto è usato come meccanismo<br />
di screening da parte del datore di lavoro. C’è però anche la possibilità<br />
che un lavoratore compia la stessa azione come segnale. In effetti, ci<br />
sono molti parallelismi tra segnalazione e screening, benchè l’equilibrio<br />
finale possa differire in dipendenza dell’ordine delle mosse.<br />
<strong>10.</strong>5. Estensione della nozione di equilibrio perfetto nei sottogiochi al<br />
caso di giochi in forma estesa <strong>con</strong> <strong>informazione</strong> imperfetta.<br />
Equilibri bayesiani perfetti<br />
Finora il problema della risoluzione di un gioco in forma estesa <strong>con</strong><br />
<strong>informazione</strong> imperfetta è stato toccato solo di sfuggita. L’unica idea a<br />
nostra disposizione fino a questo momento è quella di cercare gli<br />
equilibri di Nash della forma normale del gioco stesso. Così abbiamo<br />
fatto, ad esempio, per risolvere il gioco in forma estesa G3 del paragrafo<br />
2.11 (cfr. paragrafo 7.6 ed esercizio 7.7.3). Tuttavia, il successo di tale<br />
tentativo è dovuto al fatto, abbastanza eccezionale, che la forma normale<br />
del gioco G3 ha un unico equilibrio di Nash. Di regola, la forma normale<br />
di un gioco <strong>con</strong> mosse sequenziali ed <strong>informazione</strong> imperfetta ha una<br />
grande molteplicità di equilibri di Nash, sicchè il passaggio alla forma<br />
normale non è, in generale, il mezzo più adeguato per la risoluzione del<br />
gioco stesso. Occorre cioè ragionare direttamente sulla forma estesa del<br />
gioco. A tale scopo occorre ricordare quanto è stato accennato nel<br />
paragrafo 7.6 e cioè che nell’affrontare la risoluzione di un gioco in<br />
forma estesa <strong>con</strong> <strong>informazione</strong> imperfetta <strong>con</strong>viene utilizzare le strategie<br />
di comportamento anziché le strategie miste 5 , a patto che il gioco abbia<br />
5 Numerosi autori <strong>con</strong>siderano così ovvio l’uso delle strategie di comportamento nei<br />
giochi in forma estesa che col termine “strategie miste” indicano, in realtà, le<br />
strategie di comportamento.<br />
9
icordo perfetto (ciò che si verifica sempre negli esempi <strong>con</strong>siderati nel<br />
corso).<br />
In effetti le strategie di comportamento sono più maneggevoli delle<br />
strategie miste e l’insieme degli equilibri di Nash in strategie di<br />
comportamento è, in genere, più piccolo (nel senso dell’inclusione)<br />
dell’insieme degli equilibri di Nash in strategie miste, in forza del fatto<br />
che una stessa strategia di comportamento può essere generata da più<br />
strategie miste.<br />
Ciò premesso e <strong>con</strong>venendo che nel seguito di questo capitolo col<br />
termine generico di strategia ci riferiremo ad una strategia di<br />
comportamento, l’idea successiva che viene alla mente è quella di<br />
raffinare la nozione di equilibrio di Nash estendendo ai giochi in forma<br />
estesa <strong>con</strong> <strong>informazione</strong> imperfetta il procedimento di analisi a ritroso e<br />
la nozione di equilibrio perfetto nei sottogiochi.<br />
Ora l’essenza dell’idea di perfezione nei sottogiochi nei giochi <strong>con</strong><br />
<strong>informazione</strong> perfetta è quella di sostituire sull’albero del gioco un<br />
sottogioco col profilo di pagamenti che risulta dall’uso di un equilibrio di<br />
Nash del sottogioco, che esclude scelte irrazionali in ogni nodo del<br />
sottogioco stesso; se il sottogioco ha un solo equilibrio di Nash esso è<br />
necessariamente perfetto nel senso suddetto..<br />
In qualche caso tale idea funziona anche nei giochi <strong>con</strong> <strong>informazione</strong><br />
imperfetta, come nel seguente<br />
Esempio 1 (Fudenberg e Tirole). Consideriamo il gioco astratto<br />
rappresentato in forma estesa dall’albero disegnato di seguito:<br />
10
Tentiamo l’analisi a ritroso standard. Nel nodo prefinale d II preferisce<br />
l’azione R', mentre nel nodo prefinale e ella preferisce l’azione L'. Ma<br />
siccome i nodi d ed e appartengono allo stesso insieme di informazioni<br />
ed ella deve operare un’unica scelta tra L' ed R', non ne ricaviamo nulla.<br />
Se però risaliamo all’indietro l’albero vediamo che il sottogioco che ha<br />
radice nel nodo c è il gioco a somma zero <strong>con</strong> mosse simultanee<br />
che ha un unico equilibrio di Nash in cui ciascuno dei due giocatori<br />
sceglie <strong>con</strong> la stessa probabilità ciascuna delle sue due strategie pure,<br />
<strong>con</strong> pagamenti (0, 0). Sostituendo il sottogioco <strong>con</strong> radice in c col vettore<br />
di pagamenti (0, 0) si ottiene il gioco<br />
che ha l’equilibrio perfetto nei sottogiochi (r, L) <strong>con</strong> pagamenti (3, 1). In<br />
definitiva il gioco di partenza ha un unico equilibrio perfetto nei<br />
sottogiochi in cui I usa la strategia r, 1<br />
[ l ']<br />
+<br />
2 1<br />
⎛<br />
⎞<br />
[ r ']<br />
⎝<br />
⎜<br />
2 ⎠<br />
⎟ e II usa la<br />
strategia L, 1<br />
[ L ']<br />
+<br />
2 1<br />
2 R'<br />
⎛<br />
⎞<br />
[ ]<br />
⎝<br />
⎜<br />
⎠<br />
⎟ .<br />
L’idea di utilizzare la perfezione nei sottogiochi risulta però del tutto<br />
inefficace in quei giochi, in forma estesa e <strong>con</strong> <strong>informazione</strong> imperfetta,<br />
che non possiedono sottogiochi propri. In tali casi si utilizza la nozione<br />
di equilibrio bayesiano perfetto (o quella analoga di equilibrio<br />
sequenziale), che differisce in modo sostanziale dalle nozioni di<br />
equilibrio utilizzate in precedenza perché è una coppia costituita da un<br />
profilo di strategie e da un “sistema di credenze”.<br />
11
Tale nozione di equilibrio è costruita sulla base delle richieste che ora<br />
formuliamo.<br />
• Richiesta 1 (Credenze) In ciascun suo insieme di informazioni, il<br />
giocatore che ivi è chiamato a muovere deve avere delle credenze su<br />
quale nodo dell’insieme sia stato effettivamente raggiunto nello<br />
sviluppo del gioco.<br />
Una credenza (belief) relativa ad un insieme di informazioni γ è<br />
dunque una distribuzione di probabilità (a posteriori) sui nodi di γ 6 ed un<br />
sistema di credenze è una famiglia di tante distribuzioni di probabilità<br />
quanti sono gli insiemi di credenze.<br />
Noi supporremo sempre nel seguito che se viene giocato un profilo di<br />
strategie σ, il sistema di credenze µ dei giocatori sia <strong>con</strong>oscenza comune<br />
dei giocatori.<br />
• Richiesta 2 (Razionalità sequenziale) Date le loro credenze, le<br />
strategie scelte dai giocatori devono essere sequenzialmente<br />
razionali. Ossia, partendo da un qualsiasi insieme di informazioni<br />
dell’albero, il profilo di strategie <strong>con</strong>tinua ad essere un profilo di<br />
strategie di equilibrio, dato il sistema di credenze.<br />
• Richiesta 3 (Consistenza debole) Le credenze dei giocatori devono<br />
essere debolmente <strong>con</strong>sistenti <strong>con</strong> le strategie, nel senso che esse<br />
devono essere ottenute dalle strategie e dalle azioni osservate<br />
mediante l’uso del teorema di Bayes, ogni qualvoltta risulti possibile<br />
applicarlo.<br />
Ciò premesso, definiamo Equilibrio Bayesiano Perfetto (EBP) una<br />
coppia (σ, µ), dove σ è un profilo di strategie di comportamento e µ un<br />
sistema di credenze per il gioco, tali che risultino soddisfatte le richieste<br />
1, 2, 3. Ossia in ogni insieme di informazioni il profilo di strategie σ<br />
deve indicare scelte ottimali date le credenze, e il sistema di credenze µ<br />
deve essere debolmente <strong>con</strong>sistente <strong>con</strong> σ.<br />
Si noti che la ricerca delle strategie ottimali e delle credenze è<br />
simultanea, come se si trattasse della risoluzione di un sistema di<br />
equazioni.<br />
L’esistenza di almeno un EBP in ogni gioco finito in forma estesa è<br />
assicurata da un risultato (in realtà più forte) ottenuto da Kreps e Wilson,<br />
da cui discende anche la seguente<br />
6 Ovviamente se γ è un singoletto, allora l’unico nodo di γ sarebbe scelto <strong>con</strong><br />
probabilità 1, qualora γ fosse effettivamente raggiunto.<br />
12
Proposizione. Se (σ, µ) è un equilibrio bayesiano perfetto di un gioco in<br />
forma estesa <strong>con</strong> ricordo perfetto, allora σ è un equilibrio di Nash (in<br />
strategie di comportamento).<br />
La nozione di EBP lascia irrisolto il problema di come un giocatore<br />
debba aggiornare le sue credenze in un suo insieme di informazioni γ<br />
(<strong>con</strong> due o più nodi) che sia fuori dal cammino di equilibrio. Infatti se i<br />
giocatori seguono fedelmente il profilo di strategie σ, la probabilità che<br />
venga raggiunto γ è zero ed allora non si può applicare la regola di<br />
Bayes. In un tale insieme di informazioni γ ogni credenza è allora<br />
ammissibile. Ciò implica che in γ il giocatore (cui γ appartiene) può<br />
scegliere qualsiasi azione a sua disposizione, a patto peraltro di<br />
comportarsi razionalmente rispetto a qualche credenza.<br />
È possibile raffinare la nozione di EBP in modo da prendere in<br />
<strong>con</strong>siderazione il problema ora segnalato, ma noi semplicemente lo<br />
ignoreremo e, all’occorrenza, ci regoleremo in modo empirico.<br />
Esempio 2 (Il cavallo di Selten 7 ). Consideriamo il seguente gioco in<br />
forma estesa <strong>con</strong> tre giocatori I, II e III, nel quale, per evidenziare la<br />
motivazione del nome attribuito a questo gioco rappresentiamo l’albero<br />
<strong>con</strong> la radice a posta in alto (l’albero assume allora la forma di un<br />
cavallo stilizzato).<br />
7 Reinhard Selten ha ottenuto il premio Nobel 1994 per le scienze e<strong>con</strong>omiche<br />
assieme a John F. Nash ed a John Harsanyi.<br />
13
Come chi legge può verificare da sola/o i due profili di strategie pure<br />
(L, r2, l3) ed (R, r2, r3) sono equilibri di Nash. Per ciascuno di essi<br />
studiamo se è possibile associare al profilo di strategie un sistema di<br />
credenze µ, in modo tale che la coppia costituita dal profilo di strategie e<br />
dal sistema di credenze costituisca un EBP. Ovviamente si ha µ{a} = µ{b}<br />
= 1 mentre poi poniamo µ{c, d} = (p, 1 – p) <strong>con</strong> p ∈[0, 1] da determinare,<br />
se possibile.<br />
Cominciamo dal profilo (L, r2, l3). Se (p, 1 – p) è la credenza di III in<br />
{c, d} i pagamenti attesi derivanti dall’uso di (L, r2, l3) sono<br />
(5 – p, 5 – p, 4p) .<br />
Ora, osservando che il pagamento 5 – p del giocatore II è > 3 per ogni p<br />
∈[0, 1], è irrazionale che II usi r2 anziché l2 se I usa L e III usa l3, quale<br />
che sia il sistema di credenze µ, e dunque l’equilibrio di Nash (L, r2, l3)<br />
non genera alcun EBP.<br />
Consideriamo ora il profilo di strategie (R, r2, r3), che sappiamo essere<br />
un equilibrio di Nash, ed associamo ad esso un sistema di credenze µ <strong>con</strong><br />
µ{c, d} = (p, 1 – p) e p ∈[0, 1] da determinare.<br />
Tuttavia, nel caso attuale, l’insieme di informazioni {c, d} viene<br />
raggiunto <strong>con</strong> probabilità zero poiché è fuori dal percorso individuato dal<br />
profilo di strategie. Qualsiasi credenza µ{c, d} = (p, 1 – p) è allora<br />
ammissibile in tale insieme di informazioni, a patto che essa sia coerente<br />
<strong>con</strong> la scelta r3 di III in {c, d}. Allora ragioniamo così. Se il gioco (per<br />
esempio, per un errore di esecuzione di una mossa) raggiungesse<br />
l’insieme di informazioni {c, d} il giocatore III otterrebbe 4p scegliendo<br />
l3 e 2 – p scegliendo r3 e poiché 2 – p > 4p ⇔ 0 ≤ p < 2/5, ogni credenza<br />
(p, 1 – p) <strong>con</strong> 0 ≤ p < 2/5 è coerente <strong>con</strong> la scelta r3. Inoltre date tali<br />
credenze e data la scelta R di I in {a} ed r3 di III in {c, d} se II deviasse<br />
da r2 ad l2 otterrebbe un pagamento atteso di 2(1 – p) anziché di 3 ed I, se<br />
deviasse da R ad L, otterrebbe 1 – p anziché 3.<br />
In <strong>con</strong>clusione ogni coppia (s, µ) <strong>con</strong> s = (R, r2, r3) e µ = (1 ; 1; (p, 1 –<br />
p)) <strong>con</strong> p ∈ [0, 2/5[ costituisce un EBP. [Peraltro il fatto che un singolo<br />
equilibrio di Nash possa dar luogo ad infiniti EBP mostra i limiti della<br />
nozione di EBP.]<br />
Nel prossimo paragrafo utilizzeremo la nozione di EBP per la<br />
risoluzione di un gioco dinamico <strong>con</strong> <strong>informazione</strong> <strong>asimmetrica</strong>.<br />
L’esempio ci servirà anche per illustrare l’idea di Harsanyi per<br />
14
trasformare una situazione <strong>con</strong> <strong>informazione</strong> incompleta in un gioco <strong>con</strong><br />
<strong>informazione</strong> completa ma imperfetta.<br />
<strong>10.</strong>6. La trasformazione di Harsanyi. Equilibri separanti,<br />
<strong>con</strong>globanti, semiseparanti<br />
Traggo da [DS] il seguente<br />
Esempio. La vecchia e <strong>con</strong>solidata ditta ANTICA si trova sul mercato a<br />
produrre un certo bene in regime di monopolio. Ma ora essa deve<br />
<strong>con</strong>frontarsi <strong>con</strong> NOVA, una nuova ditta che vuole competere <strong>con</strong><br />
ANTICA per il mercato di quel bene. ANTICA deve decidere se<br />
affrontare una guerra dei prezzi.<br />
Alla fine il mercato di quel bene sarà dominato da una sola ditta e cioè<br />
da ANTICA se NOVA decide di non sfidarla, da NOVA se essa stessa<br />
sfida e ANTICA si ritira dal mercato, e dalla vincitrice del <strong>con</strong>flitto se<br />
NOVA sfida e ANTICA si batte <strong>con</strong> lei.<br />
ANTICA si trova in questa situazione: se NOVA ha una tecnologia più<br />
efficiente, allora ANTICA non può pensare di vincere la competizione e<br />
farebbe meglio a ritirarsi da quel mercato, lasciando il campo libero a<br />
NOVA. Diremo, in un tale caso, che NOVA è di tipo Forte mentre<br />
diremo in caso <strong>con</strong>trario che NOVA è di tipo Debole.<br />
In caso di <strong>con</strong>flitto effettivo, ANTICA s<strong>con</strong>figgerà una NOVA di tipo<br />
Debole, mentre una NOVA di tipo Forte s<strong>con</strong>figgerà ANTICA.<br />
Nella tabella che segue indichiamo i pagamenti a NOVA, presa come<br />
giocatore I, e ad ANTICA, presa come giocatore II, nel caso che NOVA<br />
sfidi. L’idea è che una NOVA di tipo Forte può ottenere un’utilità di 4 se<br />
è lasciata sola a dominare il mercato, mentre ANTICA può ottenere 3 e<br />
una nova di tipo Debole solo 2; ma un <strong>con</strong>flitto effettivo ha un costo di<br />
due utili per ciascuna.<br />
Tabella dei pagamenti (nel caso che NOVA sfidi)<br />
15
[Per esempio i pagamenti nella cella in basso a sinistra sono calcolati<br />
così: una NOVA Debole perde 2, che è il costo della lotta, e ANTICA<br />
ottiene 3 per la vittoria ma paga 2 per il costo della lotta e quindi ottiene<br />
il pagamento 1.]<br />
Le cose sarebbero semplici se ANTICA <strong>con</strong>oscesse il vero tipo di<br />
NOVA. Allora, nel caso di NOVA Debole, il gioco sarebbe<br />
che ha l’unico equilibrio perfetto nei sottogiochi (non sfida, lotta).<br />
E, nel caso di NOVA Forte, il gioco sarebbe<br />
<strong>con</strong> l’equilibrio perfetto nei sottogiochi (sfida, si ritira) e pagamenti (4, 0).<br />
Ma le cose non stanno così perché, mentre NOVA <strong>con</strong>osce il suo proprio<br />
tipo, ANTICA non <strong>con</strong>osce il vero tipo di NOVA, che potrebbe anche<br />
millantare un profilo superiore, pur essendo di tipo Debole, sperando di<br />
indurre ANTICA a ritirarsi e godere essa stessa dei profitti di una<br />
situazione di monopolio. ANTICA <strong>con</strong>osce però la situazione generale<br />
dell'industria e della tecnologia ed è in grado di formulare una <strong>con</strong>gettura<br />
sulla probabilità a priori che NOVA sia di tipo Debole. Indichiamo <strong>con</strong> d<br />
tale probabilità e supponiamo che essa sia <strong>con</strong>oscenza comune di I e di<br />
II. È proprio sull'ipotesi che le credenze a priori dei giocatori siano<br />
<strong>con</strong>oscenza comune degli stessi che fa perno la metodologia di Harsanyi<br />
per tradurre una situazione <strong>con</strong> <strong>informazione</strong> incompleta in un gioco <strong>con</strong><br />
16
<strong>informazione</strong> completa ma imperfetta. 8 Egli propone come mossa<br />
iniziale di un tale gioco una mossa della Fortuna 9 che, nel nostro<br />
esempio, sceglie <strong>con</strong> probabilità d il tipo Debole di NOVA e <strong>con</strong><br />
probabilità (1 - d) il tipo Forte di NOVA.<br />
ANTICA deve scegliere se lottare, senza <strong>con</strong>oscere il vero tipo della<br />
sfidante quando essa si presenta. A sua volta NOVA deve decidere se<br />
sfidare, sapendo che ANTICA attribuisce (a priori) probabilità d<br />
all’evento che NOVA sia di tipo Debole. Di fronte ad una sfida e senza<br />
ulteriori basi per l’<strong>informazione</strong>, ANTICA calcolerà il suo pagamento<br />
atteso derivante dallo s<strong>con</strong>tro come<br />
d · 1 + (1 - d) · (-2) = 3d – 2 .<br />
Se il pagamento (di II) è positivo, cioè se d > 2/3, ANTICA lotterà;<br />
altrimenti si ritirerà. Ciò ha un chiaro significato: se la credenza a priori<br />
di ANTICA è che verosimilmente NOVA è di tipo Debole, allora ha<br />
senso per ANTICA affrontarla.<br />
Ora supponiamo che NOVA possa fornire qualche segnale della propria<br />
forza: per esempio, esibendo prototipi di prodotti avanzati, benchè non<br />
abbia ancora la capacità di produrre grandi quantità allo stesso livello<br />
qualitativo. Chiamiamo tali attività esibizione. Se NOVA è davvero<br />
Forte, essa compie un’esibizione automaticamente e senza costo alcuno.<br />
Una NOVA Debole può cercare di camuffarsi da Forte mediante<br />
un’esibizione, ma tale comportamento implica un costo aggiuntivo.<br />
Ora sia c l’utilità che I attribuisce alla somma di denaro che I deve<br />
spendere per l’esibizione, quando è Debole. Supponiamo che anche il<br />
valore c, come quello di d, sia <strong>con</strong>oscenza comune di I e di II. 10<br />
8<br />
Per evitare l’abuso linguistico denunciato nel paragrafo <strong>10.</strong>1 alcuni autori usano la<br />
locuzione “gioco <strong>con</strong> <strong>informazione</strong> incompleta” per riferirsi al risultato finale della<br />
trasformazione di Harsanyi e cioè un gioco <strong>con</strong> <strong>informazione</strong> imperfetta in cui la<br />
Fortuna muove per prima e la sua scelta non è osservata da uno almeno dei giocatori.<br />
Con una tale interpretazione il gioco di carte G3 (di Myerson), descritto in 2.11., è un<br />
gioco <strong>con</strong> <strong>informazione</strong> incompleta. Myerson stesso però chiarisce così la sua<br />
interpretazione del termine “<strong>informazione</strong> incompleta”: il gioco G3 ha <strong>informazione</strong><br />
incompleta se I <strong>con</strong>osce il colore della carta (cioè ha un’<strong>informazione</strong> privata) ancora<br />
prima che siano rivelate a I e a II le regole del gioco: altrimenti il gioco G3 ha<br />
<strong>informazione</strong> imperfetta, ma completa.<br />
9<br />
Molti autori (i più) usano il termine “Natura”, anziché “Fortuna”, per indicare un<br />
fittizio “Giocatore Zero”.<br />
10<br />
La metodologia di Harsanyi non fornisce alcuna indicazione sul modo in cui I e II<br />
possono pervenire ad una valutazione comune di d e di c.<br />
17
L’albero del gioco, disegnato qui di seguito, ha alcune caratteristiche<br />
speciali che prendono in <strong>con</strong>to l’asimmetria dell’<strong>informazione</strong>. Primo, il<br />
tipo di NOVA è aleatorio; perciò il gioco inizia in un nodo (detto<br />
“storico”) in cui la Fortuna (o la Natura) fa tale scelta <strong>con</strong> probabilità d e<br />
1 - d. I nodi successivi, a e b, appartengono a NOVA, che, <strong>con</strong>oscendo il<br />
suo proprio tipo, deve decidere se sfidare e, nel caso che sia Debole, se<br />
cercare di imitare il tipo Forte <strong>con</strong> un’esibizione che ha costo c.<br />
Albero del gioco NOVA-ANTICA<br />
Poi, sul livello successivo dell’albero, arrivano gli insiemi di<br />
<strong>informazione</strong> di ANTICA. Quando sceglie, ANTICA non <strong>con</strong>osce per<br />
certo il vero tipo di NOVA, ma può osservare se c’è una esibizione. Se<br />
NOVA sfida senza esibizione, ANTICA ne intuisce che NOVA è di tipo<br />
Debole e perciò si ha un insieme di informazioni che ha un solo nodo<br />
(nel nodo α, ANTICA ovviamente lotta). C’è inoltre la coppia di nodi<br />
{ß, y} che costituisce un altro insieme di informazioni di ANTICA.<br />
Descritto il gioco, andiamo alla caccia degli EBP. Per semplificare<br />
l’analisi suddividiamo il lavoro nella ricerca degli equilibri che<br />
comportano separazione dei tipi di NOVA (detti equilibri separanti),<br />
<strong>con</strong>globazione dei tipi (equilibri <strong>con</strong>globanti) o una miscela delle due<br />
cose (equilibri semiseparanti). La natura dell’equilibrio dipende dalla<br />
probabilità d che NOVA sia debole e dal costo c dell’esibizione per un<br />
tipo debole. Cominciamo <strong>con</strong> la ricerca degli equilibri separanti.<br />
a) Equilibrio separante. Se il costo che il tipo debole di NOVA deve<br />
pagare per l’esibizione è per lei troppo alto, allora la presenza o meno di<br />
esibizione permette di separare i due tipi. Precisamente, se c > 2, il tipo<br />
18
debole di NOVA ottiene comunque un pagamento negativo se cerca di<br />
sfidare (il livello di riferimento per lo statu quo è c = 0) ed allora è<br />
irrazionale per lei sfidare. Quindi, se c > 2, ANTICA può inferire che<br />
una NOVA che usa l’esibizione è forte, <strong>con</strong> probabilità 1.<br />
Supposta allora soddisfatta la <strong>con</strong>dizione c > 2, si può <strong>con</strong>getturare<br />
che, in equilibrio,<br />
(i) NOVA sfida se è forte e non sfida se è debole;<br />
(ii) se ANTICA osserva una sfida <strong>con</strong> esibizione, essa ne deduce che,<br />
<strong>con</strong> probabilità 1, NOVA è forte e perciò essa si ritira; se<br />
ANTICA osserva una sfida senza esibizione, essa ne deduce che,<br />
<strong>con</strong> probabilità 1, NOVA è debole e perciò lotta.<br />
Detto in modo più formale, vogliamo provare che la coppia costituita dal<br />
profilo di strategie (pure)<br />
( σ{ a}<br />
, σ{ b}<br />
; τ{ α}<br />
, τ{ β,γ } ) = (non sfida, sfida; lotta, si ritira) 11<br />
e dal sistema di credenze a posteriori<br />
( µ { a}<br />
, µ { b}<br />
; µ { α}<br />
, µ { β,γ } ) = ( 1, 1; 1, ( 0; 1)<br />
)<br />
costituisce un EBP.<br />
( ) = (non sfida, sfida) di NOVA, ANTICA<br />
Data la strategia σ{ a}<br />
, σ{ b}<br />
inferisce correttamente che un’esibizione indica forza e che l’assenza di<br />
esibizione indica debolezza. Dai pagamenti notiamo che ANTICA<br />
preferisce lottare <strong>con</strong> una NOVA di tipo debole e preferisce ritirarsi <strong>con</strong><br />
una NOVA di tipo forte. Perciò la strategia di ANTICA τ α<br />
( { } , τ{ β,γ } ) =<br />
(lotta, si ritira) è risposta ottimale alla strategia (non sfida, sfida) di<br />
NOVA.<br />
Data la strategia τ α<br />
( { } , τ{ β,γ } ) = (lotta, si ritira) di ANTICA e dato il<br />
sistema di credenze µ, la strategia (non sfida, sfida) di NOVA è risposta<br />
ottimale a τ, dal momento che<br />
• una NOVA debole ottiene 0 se non sfida, -2 se sfida senza<br />
esibizione, 2 – c < 0 se sfida <strong>con</strong> esibizione;<br />
• una NOVA di tipo forte ha sempre interesse a sfidare.<br />
b) Equilibrio <strong>con</strong>globante. Se il costo dell’esibizione è “piccolo”, ci<br />
dobbiamo aspettare che un tipo debole di NOVA usi l’esibizione per<br />
11<br />
È il profilo di strategie di comportamento ( ( 0, 0, 1),<br />
( 1, 0);<br />
( 1, 0),<br />
( 0, 1)<br />
).<br />
19
camuffarsi da tipo forte. Perciò, se c < 2, andiamo alla caccia di un<br />
equilibrio <strong>con</strong>globante.<br />
Tuttavia c’è un ulteriore <strong>con</strong>dizione perché possa esistere un tale<br />
equilibrio e cioè che sia sufficientemente piccola la probabilità d che<br />
NOVA sia debole. Altrimenti, se è molto probabile che NOVA sia<br />
debole, ANTICA troverà ottimale <strong>con</strong>trare qualsiasi sfidante, ma allora<br />
per il tipo debole di NOVA non è più ottimale sfidare.<br />
Partiamo allora supponendo che sia c < 2 e cerchiamo di determinare un<br />
valore critico d * ∈ ]0, 1[ tale che se d < d * sono soddisfatte tutte le<br />
<strong>con</strong>dizioni perché esista un EBP <strong>con</strong>globante. Ossia pretendiamo che, in<br />
equilibrio, siano verificati i seguenti due punti:<br />
1. Entrambi i tipi di NOVA sfidano ed (anche) il tipo debole usa<br />
l’esibizione.<br />
2. ANTICA si ritira se appare una sfidante <strong>con</strong> esibizione, mentre<br />
accetta la sfida se appare una sfidante senza esibizione.<br />
Data la strategia di NOVA (al punto 1.), ANTICA non può dedurre<br />
alcunchè osservando l’esibizione, e la sua valutazione della probabilità<br />
che essa abbia di fronte una NOVA di tipo debole rimane d. Perciò il<br />
pagamento atteso di ANTICA derivante dallo s<strong>con</strong>tro è<br />
d · 1 + (1 - d) · (-2) = 3d – 2 .<br />
Se d < 2/3 tale pagamento atteso è negativo ed è ottimale per ANTICA<br />
ritirarsi <strong>con</strong> pagamento 0. Così un tipo debole di NOVA riesce a<br />
camuffarsi <strong>con</strong> successo.<br />
Supponiamo ora c < 2 e d < 2/3 (= d * ) e proviamo che la strategia di<br />
NOVA, indicata al punto 1. è risposta ottimale alla strategia di ANTICA,<br />
indicata al punto 2.. Infatti, in risposta alla strategia di ANTICA, una<br />
NOVA tipo debole ottiene 2 - c > 0 sfidando <strong>con</strong> esibizione, 0 non<br />
sfidando e -2 sfidando senza esibizione. Se poi NOVA è di tipo forte, per<br />
lei è sempre ottimale sfidare.<br />
Abbiamo quindi provato che, se c < 2 e d < 2/3, la coppia costituita dal<br />
profilo di strategie pure<br />
( σ{ a}<br />
, σ{ b}<br />
; τ{ α}<br />
, τ{ β,γ } ) = (sfida <strong>con</strong> esibizione, sfida; lotta, si ritira)<br />
e dal sistema di credenze a posteriori<br />
( µ { a}<br />
, µ { b}<br />
; µ { α}<br />
, µ { β,γ } ) = ( 1, 1; 1, ( d; 1 - d)<br />
)<br />
costituisce un EBP (<strong>con</strong>globante).<br />
c) Equilibrio semiseparante.<br />
Cerchiamo ora un equilibrio nel caso che sia c < 2 e d > 2/3.<br />
20
In tale caso l’equilibrio non può essere separante.<br />
Infatti, se la strategia di NOVA è di non sfidare se debole e di sfidare<br />
(<strong>con</strong> esibizione) se forte, allora ANTICA ne inferirebbe che una sfida<br />
<strong>con</strong> esibizione è l’evidenza di un tipo forte e dunque, in tal caso, si<br />
ritirerebbe. Ma allora un tipo debole di NOVA dovrebbe sfruttare tale<br />
credenza e sfidare <strong>con</strong> esibizione spacciandosi per forte, perché stavolta,<br />
<strong>con</strong> c < 2, NOVA debole otterrebbe un pagamento 2 - c positivo.<br />
Né ci può essere un equilibrio (completamente) <strong>con</strong>globante.<br />
Infatti, allorchè d > 2/3, la probabilità che NOVA sia di tipo debole è<br />
così alta che, se NOVA sfida <strong>con</strong> esibizione, è ottimale per ANTICA<br />
affrontare sempre la sfida, ed allora una NOVA di tipo debole ottiene (-2<br />
- c). In tale caso il tipo debole di NOVA non dovrebbe esibirsi (né<br />
comunque sfidare) e la <strong>con</strong>globazione non può reggere.<br />
L’analisi ora svolta mostra che, nel caso c < 2 e d > 2/3, non può essere<br />
ottimale per il tipo debole di NOVA non sfidare mai né può essere<br />
ottimale sfidare sempre. In altre parole l’equilibrio dovrà coinvolgere<br />
strategie “miste” 12 . Perciò cerchiamo un equilibrio in strategie miste in<br />
cui<br />
(i) un tipo debole di NOVA sfida <strong>con</strong> probabilità p;<br />
(ii) ANTICA trae le sue inferenze dalle osservazioni usando il<br />
teorema di Bayes, e risponde ad una sfida <strong>con</strong> esibizione<br />
accettando la sfida <strong>con</strong> probabilità q (e ritirandosi <strong>con</strong> probabilità<br />
(1 - q)) ed ad una sfida senza esibizione accettando la sfida <strong>con</strong><br />
probabilità 1.<br />
Vogliamo quindi determinare p ∈ ]0, 1[ e q ∈ ]0, 1[ compatibili <strong>con</strong> la<br />
richiesta di un equilibrio in strategie miste. Prima dobbiamo vedere come<br />
la regola di Bayes fornisce ad ANTICA le sue proprie inferenze<br />
osservando una sfida <strong>con</strong> esibizione.<br />
Nella tabella seguente riportiamo le probabilità delle varie combinazioni<br />
del “vero stato del mondo” (il vero tipo di NOVA) e dell’osservazione<br />
dell’esibizione.<br />
12 Qui col termine “strategia mista” vogliamo intendere una strategia di<br />
comportamento che non degenera in una strategia pura.<br />
21
Probabilità delle combinazioni (Tipo di NOVA, Esibizione sì/no)<br />
come vengono inferite da ANTICA nel caso c < 2 e d > 2/3.<br />
Perciò se ANTICA sa che c < 2 e d > 2/3 ed osserva una sfida <strong>con</strong><br />
esibizione, essa ricalcola la probabilità che NOVA sia di tipo debole,<br />
<strong>con</strong>dizionata dal fatto che ha osservato l’esibizione. In base al teorema di<br />
Bayes, tale probabilità è<br />
dp<br />
1 - d + dp .<br />
Analogamente la probabilità <strong>con</strong>dizionata (dall’esibizione) che NOVA<br />
sia forte è<br />
1 - d<br />
1 - d + dp .<br />
Allora, usando tali probabilità a posteriori, ANTICA ricalcola il suo<br />
proprio pagamento atteso nello s<strong>con</strong>tro come<br />
dp<br />
1 - d dp - 2( 1 - d)<br />
1 · + (-2) · =<br />
1 - d + dp 1 - d + dp 1 - d + dp .<br />
In equilibrio tale pagamento atteso deve risultare uguale al pagamento<br />
atteso che ANTICA ottiene ritirandosi, che vale 0. Perché valga tale<br />
uguaglianza deve essere<br />
1 - d<br />
da cui si ricava p = 2<br />
d<br />
dp - 2(1 - d) = 0<br />
(ricordiamo che d > 2/3 il che assicura che<br />
p ≤ 1).<br />
Allorchè d cresce da 2/3 fino ad 1, p cala da 1 a 0.<br />
Ciò significa (nel <strong>con</strong>testo del nostro problema) che, allorchè aumenta la<br />
probabilità che NOVA sia debole, una NOVA di tipo debole che<br />
22
andomizza assegna una probabilità minore all’azione di sfida <strong>con</strong><br />
esibizione (per cercare di camuffarsi da tipo forte) se ciò serve per<br />
evitare la risposta di s<strong>con</strong>tro da parte di ANTICA.<br />
Infine per determinare q ∈ ]0, 1[, la probabilità <strong>con</strong> cui ANTICA<br />
raccoglie un guanto di sfida, in equilibrio, imponiamo che siano uguali il<br />
pagamento atteso che una NOVA di tipo debole riceve sfidando <strong>con</strong><br />
esibizione, e cioè<br />
q(- 2 - c) + (1 - q)(2 - c) = 2 - c - 4q<br />
e il pagamento che essa ottiene senza sfidare e cioè 0.<br />
Risolvendo l’equazione 2 - c - 4q si ottiene<br />
2 - c<br />
q =<br />
4 .<br />
L’equilibrio bayesiano perfetto dato dalle strategie di comportamento<br />
( σ{ a}<br />
, σ{ b}<br />
) = ( ( 0, p, 1 - p),<br />
( 1, 0)<br />
) di I<br />
( τ{ α}<br />
, τ{ β,γ } ) = ( ( 1, 0),<br />
( q, 1 - q)<br />
) di II<br />
e dalle credenze indicate al punto (ii), è chiamato semiseparante: se<br />
NOVA sfida senza esibizione oppure se non sfida, essa si rivela come<br />
tipo debole, ma se essa sfida <strong>con</strong> esibizione ANTICA rimane incerta su<br />
quale sia il vero tipo di NOVA.<br />
Osservazioni.<br />
1) Usualmente una segnalazione viene fatta dal giocatore più informato<br />
allorchè la sua situazione è per lui positiva, per fornire l’<strong>informazione</strong> in<br />
modo credibile. Qui però si tratta di “signal jamming”: il giocatore I più<br />
informato, allorchè la situazione è per lui negativa, sceglie, <strong>con</strong><br />
probabilità p, un’azione che vorrebbe indurre II a credere che la<br />
situazione di I è buona. La randomizzazione usata dal tipo debole fa<br />
parte di un equilibrio (sul quale si suppone che <strong>con</strong>vergano i giocatori)<br />
nel quale diventa <strong>con</strong>fuso il processo mentale di ANTICA nel trarre le<br />
sue deduzioni dalle osservazioni.<br />
2) Nell’equilibrio semiseparante ora <strong>con</strong>siderato ANTICA risponde in un<br />
modo che dà al tipo debole di NOVA lo stesso pagamento atteso che<br />
NOVA ottiene senza sfidare. Ma ora il tipo forte di NOVA deve lottare<br />
<strong>con</strong> probabilità q > 0 e (poiché in caso di s<strong>con</strong>tro essa riceve pagamento<br />
2 anziché 4) il suo pagamento atteso cala da 4 a 4(1 - q) + 2q = 4 - 2q. In<br />
altre parole, il fatto che, per l’avversaria, NOVA possa essere di tipo<br />
debole esercita un effetto esterno negativo sul tipo forte.<br />
23
<strong>10.</strong>7. Esercizi<br />
1) Bobo è seduto nel posto più prestigioso del bar dello sport e sta<br />
pensando ai fatti suoi allorchè entra nel bar un attaccabrighe (A).<br />
A vorrebbe molestare Bobo per ottenere il suo posto, ma solo se<br />
Bobo è un fifone. Se Bobo è un duro, A preferisce lasciarlo in<br />
pace. A non sa se Bobo è un fifone o un duro, tuttavia egli valuta<br />
che <strong>con</strong> probabilità 1<br />
Bobo è un duro, e questa valutazione di A è<br />
3<br />
supposta <strong>con</strong>oscenza comune dei due. Se Bobo è un fifone ed A lo<br />
molesta, Bobo lascerà il posto, ma se Bobo è un duro ed A lo<br />
molesta, egli reagirà violentemente per <strong>con</strong>servare il suo posto al<br />
bar.<br />
Supponiamo che Bobo possa segnalare se è un duro o un fifone<br />
scegliendo di bere birra o di mangiare torta. Uomini duri non<br />
amano la torta ed i fifoni non amano la birra!<br />
Bobo ottiene 2 punti se A non lo molesta e zero in caso <strong>con</strong>trario,<br />
più un punto se evita di <strong>con</strong>sumare qualcosa che non gradisce. A<br />
ottiene un punto se indovina correttamente il tipo di Bobo (e zero<br />
in caso <strong>con</strong>trario).<br />
Disegna la forma estesa di questo gioco e trovane tutti gli equilibri<br />
di Nash.<br />
2) La vecchia e <strong>con</strong>solidata ditta I, dominante in un determinato<br />
mercato, deve ora <strong>con</strong>frontarsi <strong>con</strong> una nuova ditta II, desiderosa<br />
di entrare in competizione. La ditta I deve decidere se costruire<br />
una nuova fabbrica, e simultaneamente la ditta II deve decidere se<br />
entrare effettivamente in competizione <strong>con</strong> I. Supponiamo che la<br />
ditta II sia incerta se a I costruire una nuova fabbrica costi 1.5<br />
oppure 0, mentre quest’ultima <strong>con</strong>osce il costo a cui va in<strong>con</strong>tro.<br />
Tenuto <strong>con</strong>to di ciò supponiamo che i pagamenti per le due ditte,<br />
nel caso di “alto costo” e nel caso di “basso costo” siano quelli<br />
indicati nella figura seguente (C=costruire, NC=non costruire,<br />
E=entrare, NE=non entrare).<br />
24
Supponiamo ora che II assegni uguale probabilità, e cioè 1<br />
2 ,<br />
all’evento che la ditta I sia di tipo “alto costo” e rispettivamente di<br />
tipo “basso costo” e che questa valutazione di II sia <strong>con</strong>oscenza<br />
comune di entrambi.<br />
(i) Disegna l’albero del gioco <strong>con</strong> <strong>informazione</strong> imperfetta che<br />
rappresenta la trasformazione di Harsanyi.<br />
(ii) Scrivine la relativa forma normale e determina gli equilibri di<br />
Nash di tale gioco.<br />
3) Riprendiamo il gioco G3 del paragrafo 2.11 (cfr. anche 7.6).<br />
Mostra che esso ha un unico equilibrio bayesiano perfetto formato<br />
dal profilo di strategie di comportamento<br />
[ R],<br />
1<br />
3 R [ ] ⊕ 2<br />
3 C [ ] ; 2<br />
3 V [ ] ⊕ 1<br />
3 P<br />
⎛<br />
⎞<br />
[ ]<br />
⎝<br />
⎜<br />
⎠<br />
⎟<br />
e dal sistema di credenze<br />
µ { a}<br />
= 1 , µ { b}<br />
= 1 , µ { c, d}<br />
= (0.75 ; 0.25).<br />
25