10. Giochi con informazione asimmetrica - utenti

10. Giochi con informazione asimmetrica 

10.1. Informazione asimmetrica ed informazione incompleta 

L’analisi dei giochi svolta sinora presuppone che tutta l’informazione 

sulle regole del gioco sia conoscenza comune dei giocatori. 

Ora le situazioni della vita reale, in particolare quelle di tipo 

economico, presentano spesso asimmetria di informazione. Per esempio, 

• l’attitudine di un decisore ad assumersi dei rischi può non essere 

nota agli altri decisori; 

• la classe di rischio di un individuo che vuole stipulare 

un’assicurazione sulla vita può non essere nota alla compagnia 

assicuratrice; 

• le azioni di cui dispone un decisore, anche se note a tutti gli altri 

attori della situazione, possono non essere facilmente osservabili; 

• alcuni esiti reali, come l’entità del danno subito da un assicurato 

per un furto, possono essere osservabili dall’assicurato ma non da 

altri. 

Certamente un gioco con informazione imperfetta può presentare 

asimmetria informativa. Ciò si verifica, ad esempio, nel semplice gioco 

di carte (di Myerson), etichettato G3 in 2.11.. Peraltro spesso, come negli 

esempi citati in precedenza, manca qualche elemento perché la 

situazione possa essere modellata come gioco, sia pure con informazione 

imperfetta. Si parla allora di situazione, anzi, con abuso di linguaggio, di 

gioco con informazione incompleta 1 . 

Occorre segnalare che le due nozioni di “informazione asimmetrica” e 

di “informazione incompleta” sono diverse. Nessuna delle due implica 

l’altra. Per esempio, il gioco G3 ha informazione completa (cioè è un 

vero gioco!) e asimmetrica. E non è difficile (pensaci sopra!) dare un 

esempio di una situazione che presenta informazione incompleta (per 

essere modellata come gioco) ma simmetrica. 

Nel caso che l’informazione presente in una situazione interattiva sia 

insufficiente per poterla modellare come gioco, Harsanyi ha suggerito 

1 A rigore non si dovrebbe parlare di gioco se manca qualche elemento richiesto dalla 

definizione di gioco. Per sanare questa discrasia linguistica, qualche autore (ad 

esempio, Osborne, opera citata) elimina dal suo vocabolario la locuzione “gioco con 

informazione incompleta”. 

1

un’idea (“dottrina di Harsanyi”), per completare l’informazione 

mancante, che permette talvolta di modellare la situazione come gioco 

con informazione imperfetta. 

Prima di discutere la trasformazione di Harsanyi è opportuno illustrare 

alcuni aspetti salienti delle situazioni con informazione asimmetrica e 

ridiscutere il concetto di soluzione di un gioco dinamico con 

informazione imperfetta. 

[Gli esempi presentati nei paragrafi 10.3., 10.4. e 10.6. sono tratti da 

[DS]. La fonte originale per gli esempi in 10.3. e 10.4. è un noto lavoro 

di Michael Spence sulla segnalazione per il mercato del lavoro (Job 

Market Signaling, Quarterly Journal of Economics, 87, 1973).] 

10.2. Trasmissione e manipolazione dell’informazione 

Consideriamo una ipotetica situazione interattiva con due individui 

razionali, i e j, e con asimmetria di informazione: supponiamo che i sia 

in possesso di informazioni private che j ignora. 

All’individuo i, più informato 2 , può convenire una di queste scelte 

strategiche: 

a. Nascondere il suo surplus di informazione oppure rivelarlo in 

modo ingannevole; 

b. Rivelare in modo veritiero una quantità scelta del suo surplus 

informativo. 

All’individuo j, meno informato, può convenire una di queste scelte 

strategiche: 

i. Analizzare l’informazione cercando di filtrare il vero dal falso. 

[Un esempio tipico è quello di un datore di lavoro che vuole 

scoprire le capacità di un potenziale impiegato o il livello di 

impegno di un impiegato effettivo.] 

ii. Rimanere ignorante: se j non è in grado di comprendere il 

significato di una mossa strategica di i, j può così immunizzarsi 

contro gli impegni e le minacce di i. 

L’idea di base che regola le situazioni interattive in cui l’informazione 

è asimmetrica e gli interessi dei decisori sono discordanti, è che “le 

azioni parlano più delle parole”. Ossia, anche se la situazione ammette 

2 Se la situazione può essere modellata come gioco in forma estesa, allora dire che i è 

più informato di j significa che i “vede” una partizione informativa globale “più fine” 

di quello che vede j (ossia i, ma non j, è in grado di distinguere i nodi di un qualche 

insieme di informazioni di j). Peraltro è difficile formalizzare una tale idea, come è 

stato tentato, ma in modo poco produttivo, da qualche autore. 

2

comunicazione tra i e j, j osserva le azioni di i ed ignora le eventuali 

affermazioni di i ed i, conscio di questo fatto, utilizza le sue azioni 

(anche) per il loro significato informativo. 

Se, per esemplificare, la situazione di i (il decisore più informato) può 

essere o buona o cattiva, i cercherà di scegliere un’azione che induca j a 

credere che la sua situazione è buona. Si dice allora che i usa la sua 

azione come segnale e l’uso di un segnale è chiamato segnalazione. 

In particolare, se la situazione di i è in realtà cattiva e j può 

ragionevolmente ritenere che essa sia cattiva, allora i può cercare di 

confondere j con la scelta di una strategia che sembra indicare che la sua 

situazione è buona. Un tale schema di segnalazione è chiamato “signal 

jamming” ed implica, di regola, l’uso di una strategia di comportamento, 

poiché la casualità delle scelte propria delle strategie randomizzate rende 

confuso il processo deduttivo. 

Quanto al giocatore meno informato, j, egli cercherà di usare strategie 

che riducano il suo svantaggio informativo. Si parla di screening 

(“vaglio”) per riferirsi all’uso da parte di j (il giocatore meno informato) 

di una strategia che induca i a rivelare il suo surplus di informazione. 

Il vaglio dell’informazione può richiedere l’uso di sottili stratagemmi 

(“mezzi di vaglio”) oppure l’applicazione di uno schema di incentivi. 

10.3. Rischio morale ed incentivi nel modello Principale-Agente 

Sia P (=principale) il titolare di una ditta, in cerca di un agente, A, che 

organizzi un progetto. L’esito del progetto è incerto e la probabilità di 

successo è correlata al livello di impegno di A. 

Supponiamo, per semplicità, che i livelli di impegno di A siano due soli: 

standard ed alto e che entrambi i decisori, P ed A, siano neutrali rispetto 

al rischio in denaro. 

Supponiamo inoltre che i seguenti dati siano conoscenza comune di P e 

di A: 

• se il progetto ha successo esso darà a P un ricavo lordo di 60˙000€; 

• la probabilità di successo del progetto è 0.6 se il livello di impegno di 

A è standard, ma sale a 0.8 se l’impegno di A è di alto livello. 

Un impegno di alto livello comporta però un costo soggettivo (per 

esempio, egli può dover dedicare il suo tempo al progetto anche nei 

giorni festivi). P offre ad A 10˙000€ per l’impegno di livello standard, 

ma A chiede a P un extra di 5˙000€ per l’impegno di alto livello. 

Senza l’impegno extra, P ha un profitto atteso di 

(60˙000 · 0.6) € = 36˙000€ 

3

e deve dare 10˙000€ ad A, con un profitto netto atteso di 26˙000€. 

Con l’impegno extra di A, il profitto netto atteso diviene 

(60˙000 · 0.8) € - 15˙000€ = 33˙000€ . 

A P conviene perciò pagare ad A i 5˙000€ extra per ottenere l’impegno 

di alto livello. 

Come si può realizzare un tale contratto? Il contratto deve specificare 

che A ottiene un compenso base di 10˙000€ più un compenso extra di 

5˙000€ se il suo impegno è di alto livello. Tuttavia sorge un problema di 

rischio morale 3 . Con un tale contratto, l’agente A può semplicemente 

incassare i 5˙000€ extra e lavorare con l’impegno di routine. Gran parte 

del lavoro è di tipo concettuale ed egli può svolgerlo a casa di sera o nei 

fine settimana. Egli può sempre dire di aver fatto ciò e P non ha modo di 

verificarlo. Se il progetto fallisce, A può attribuire ciò alla cattiva sorte 

(anche con l’impegno extra c’è una probabilità del 20% di fallimento). 

Perciò se il livello di impegno non può venire osservato (né verificato 

da un giudice in caso di controversia legale) il principale deve cautelarsi 

inserendo nel contratto una clausola che può essere verificata. 

Nell’esempio in esame, l’unico evento che può essere osservato è il 

successo o il fallimento del progetto. Poiché il successo è correlato 

probabilisticamente all’impegno, esso dà un’informazione, anche se 

imperfetta, sull’impegno e ciò può servire per costruire un contratto che 

serva a motivare l’impegno. 

Consideriamo un pacchetto retributivo, consistente di un salario base, 

s, e di un bonus, b, che è pagato se e solo se il progetto ha successo. 

Allora il guadagno atteso di A sarà (s + 0.6b) se usa l’impegno di routine 

e sarà (s + 0.8b) se usa l’impegno di alto livello. Il guadagno extra di A 

per il maggiore impegno è (s + 0.8b) - (s + 0.6b) = 0.2b. Perché 

l’impegno extra valga la pena per A, deve essere vero che 0.2b ≥ 5˙000€ 

ossia che b ≥ 25˙000€. Così un bonus abbastanza alto (per il successo) 

3 Il termine “rischio morale” proviene dalla matematica delle assicurazioni. Un 

cliente assicurato può far lievitare la probabilità di danno, per esempio furto o 

incendio, con un comportamento meno prudente dell’usuale, legato al fatto che si 

sente protetto dall’assicurazione. 

Più in generale, ogni problema di interazione strategica in cui il comportamento di 

una persona non è osservabile configura un problema di rischio morale. 

In un contesto assicurativo, la compagnia assicuratrice cerca di controllare il rischio 

morale richiedendo che l’assicurato conservi una parte del rischio, mediante l’uso di 

una franchigia e/o di uno scoperto. Ciò agisce come lo schema di incentivi di cui 

parliamo nell’esempio. 

4

crea nell’agente un incentivo sufficiente a provocare l’impegno extra. La 

diseguaglianza 

(10.3.1) 0.2b ≥ 5˙000€ 

è una condizione di compatibilità dell’incentivo sul pacchetto retributivo. 

C’è un’altra condizione. Il pacchetto retributivo globale deve essere 

abbastanza alto per indurre A a lavorare per P. Se la condizione di 

compatibilità dell’incentivo è soddisfatta l’agente compirà lo sforzo di 

alto livello, se lavora per P, e il suo guadagno atteso sarà (s + 0.8b). Ora 

egli (A) chiede almeno 15˙000€ per lavorare per P con un impegno di 

alto livello. Perciò l’offerta di P deve soddisfare la condizione di 

partecipazione 

(10.3.2) s + 0.8b ≥ 15˙000€ . 

Il principale vuole però massimizzare il suo proprio profitto e perciò 

cerca di mantenere il più basso possibile il compenso totale di A 

(compatibilmente coi vincoli (10.3.1) e (10.3.2)). 

Volendo tenere al livello minimo possibile di 15˙000€ il compenso 

totale di A, P dovrebbe scegliere 

s = 15˙000€ - 0.8b . 

Ma poiché, per la (10.3.1), b deve essere almeno 25˙000€, il salario s 

non dovrebbe superare 

15˙000€ - 0.8 · 25˙000€ = -5˙000€ . 

Che senso ha un valore s < 0? In una prima interpretazione può essere 

visto come una quantità di denaro che A deve mettere nel progetto. Una 

seconda possibilità è che A non metta alcun suo capitale nel progetto, ma 

venga multato se il progetto fallisce. In molti casi nessuna delle due 

alternative è praticabile (A può non avere denaro da investire e la 

legislazione può proibire l’applicazione di penalità.). 

Supponendo allora che il salario base debba essere non negativo (s ≥ 0) e 

ponendo al livello più basso possibile sia il salario base che il bonus 

(ossia s = 0€ e b = 25˙000€) si ottiene 

0€ + 0.8 · 25˙000€ = 20˙000€ . 

Dunque il principale è forzato a superare, di 5˙000€, la condizione di 

partecipazione. Il surplus di 5˙000€ è un costo extra dovuto al problema 

di osservazione 4 . Un tale tipo di costo extra esiste, in generale, nei 

4 Se l’impegno di A può essere verificato direttamente, allora a P conviene stipulare 

il contratto con salario base di 10˙000€ e con compenso aggiuntivo di 5˙000€ per 

l’extra impegno. 

5

problemi con asimmetria informativa ed è il giocatore meno informato 

che deve pagarlo. Ora vogliamo verificare se, nel problema in esame, è 

conveniente per il principale pagare tale costo extra. Pagando il costo 

extra, il profitto netto atteso del principale è 

60˙000€ · 0.8 - 20˙000€ = 28˙000€ . 

Con l’impegno di routine di A, P deve pagare ad A solo il compenso 

base di 10˙000€ e la probabilità di successo del progetto è 0.6, per cui il 

profitto netto atteso di P è 

60˙000€ · 0.6 - 10˙000€ = 26˙000€ . 

Perciò, anche col costo extra generato dall’asimmetria informativa, P 

ottiene un profitto netto atteso un po’ più elevato usando lo schema del 

contratto con incentivi. 

Naturalmente non è sempre così poiché la conclusione dipende, in 

ciascun caso, dai dati numerici del problema. 

10.4. Vaglio dell’informazione per la separazione dei tipi 

Il direttore di un importante complesso industriale vuole assumere per 

un impegnativo progetto pluriennale laureati in matematica o fisica o 

ingegneria che abbiano le capacità logiche e le conoscenze matematiche 

necessarie per un lavoro scientifico molto complesso. 

Egli ritiene che i curricula dei candidati non costituiscano un’attestazione 

credibile delle loro capacità: occorre un’evidenza oggettiva. Come mezzi 

di “screening” egli pensa allora di utilizzare i corsi molto impegnativi di 

un master, che l’industria stessa supporta parzialmente presso la vicina e 

prestigiosa università di XYZ, nell’idea che le scelte di corsi di studio da 

parte dei candidati possano costituire un’evidenza credibile delle loro 

qualità. 

Per semplificare il discorso supponiamo che ci siano due soli tipi di 

candidati (in relazione alle qualità richieste dal datore di lavoro): A = 

abile e B = medio. Il principale è disposto a pagare 30˙000€ all’anno ad 

un tipo A e 20˙000€ ad un tipo B. Poiché non può osservare 

direttamente il tipo del candidato, egli cerca un meccanismo efficiente 

per distinguere tra di essi. 

Supponiamo che i due tipi differiscano nella loro tolleranza 

nell’affrontare un corso. Ciascuno deve spendere denaro e sacrificare 

tempo per affrontare un corso impegnativo, ma tale costo è più lieve per 

un tipo A che per un tipo B. Supponiamo che i tipi A valutino il costo di 

ciascuno di tali corsi come equivalente, in denaro, a 1˙200€ annuali di 

6

salario, mentre i tipi B lo valutino come equivalente a 1˙800€ annuali di 

salario. 

Ci chiediamo se il datore di lavoro può utilizzare questa differenza per 

riuscire a vagliare i candidati e separare i tipi A dai tipi B. 

L’idea giusta può essere quella di determinare un numero (naturale) n 

tale che chi accetta di sostenere n (o più) corsi impegnativi è catalogato 

come tipo A e pagato 30˙000€ l’anno, mentre chi non accetta un tale 

impegno è catalogato come tipo B e pagato 20˙000€. L’alternativa per 

ciascun candidato è allora tra accettare un numero n ≥ n di corsi che lo 

evidenzino come tipo A o rinunciare accettando di rivelarsi come tipo B. 

Lo schema usato dal datore di lavoro deve essere tale da non 

incoraggiare i tipi B a seguire n corsi e tale da non scoraggiare i tipi A 

dal seguirli. Un valore giusto di n si ottiene imponendo che ciascun tipo 

abbia interesse a rivelarsi qual è. 

Perché ad un vero tipo A convenga rivelarsi per tale, il numero n dei 

corsi seguiti deve soddisfare la condizione 

(10.4.1) 30˙000 - 1˙200 · n ≥ 20˙000 

che comporta la condizione n ≤ 8. 

Perché un vero tipo B preferisca rivelarsi per tale (piuttosto che incorrere 

nel costo extra che comporta per lui il tentativo di spacciarsi per un tipo 

A), n deve soddisfare la condizione 

(10.4.2) 20˙000 ≥ 30˙000 - 1˙800 ·n 

che comporta la condizione n ≥ 6. 

È la differenza del costo (per seguire un corso impegnativo) tra i due tipi 

che fa sì che le due condizioni di compatibilità (10.4.1) e (10.4.2) 

costituiscano per il principale uno schema atto a generare la separazione 

dei tipi. 

Si noti che nella realtà l’istruzione può anche far aumentare la 

produttività di un impiegato e trasformare un tipo B in tipo A. Tuttavia, 

nel nostro scenario semplificato la richiesta di seguire n corsi 

impegnativi serve solo a scopo di vaglio ed i tipi A ne devono sopportare 

il costo extra dovuto all’asimmetria dell’informazione. 

Supponendo di usare il numero minimo di corsi necessario per ottenere 

la separazione, e cioè n = n = 6, il costo per il tipo A ha un equivalente 

monetario di 6 · 1˙200€ = 7˙200€. 

Si dice che c’è un effetto esterno negativo inflitto dai tipi B ai tipi A: 

infatti tale costo non esisterebbe se la popolazione dei candidati 

consistesse solo di tipi A oppure se il tipo di una persona potesse essere 

verificato direttamente. 

7

Ci si può chiedere se per un tipo A può risultare preferibile non 

impegnarsi affatto per la separazione dei tipi, piuttosto che sopportare il 

costo. Con la separazione dei tipi, un tipo A ottiene un guadagno netto di 

30˙000€ -7˙200€ = 22˙800€ 

ed un tipo B ottiene 20˙000€. 

Cosa accade se i due tipi non vengono separati? Se i datori di lavoro non 

usano mezzi di screening, essi devono scegliere a caso tra i richiedenti e 

pagare a tutti lo stesso salario. Si parla allora di conglobazione (pooling) 

dei tipi. Con la conglobazione dei tipi, in un mercato competitivo per il 

lavoro, il salario comune sarà la media di quanto valgono i tipi per il 

datore di lavoro e tale media dipende dalla popolazione dei tipi nella 

popolazione dei richiedenti. Per esempio, se il 20% dei richiedenti è di 

tipo A e l’80% è di tipo B, allora il salario comune con la conglobazione 

sarà 

30˙000€ · 0.2 + 20˙000€ · 0.8 = 22˙000€ . 

Allora i tipi A preferiranno la situazione con la separazione dei tipi, 

poiché essa comporta 22˙800€ anziché 22˙000€. 

Ma se la proporzione è 50% - 50%, allora il salario comune sotto pooling 

sarà di 25˙000€ ed i tipi A preferiranno la conglobazione. I tipi B 

preferiranno sempre la conglobazione, poiché la presenza di tipi A nella 

popolazione degli agenti implica che il salario comune eccederà sempre 

quello che percepiscono i tipi B in regime di separazione (nel nostro 

esempio 20˙000€). 

Tuttavia, anche se entrambi i tipi preferiscono la conglobazione, la 

situazione può non essere stabile. Supponiamo che le proporzioni nella 

popolazione dei possibili agenti siano 50% - 50% (tipi A e tipi B) e che 

la situazione iniziale presenti conglobazione in cui entrambi i tipi 

preferiscono 25˙000€. 

Un imprenditore può annunciare che pagherà 26˙500€ a chi sosterrà un 

corso tosto. I tipi A troveranno ciò proficuo (rispetto alla situazione 

iniziale) poiché il loro costo per un corso è di 1˙200€ mentre l’aumento 

di salario è di 1˙500€, mentre i tipi B non lo troveranno proficuo perché 

il loro costo per un corso, 1˙800€, eccede l’aumento di salario. Poiché 

questo particolare imprenditore attrae selettivamente i tipi A, ciascuno 

dei quali vale 30˙000€ ma che paga 26˙500€, egli trae vantaggio dal 

deviare dal pacchetto salariale della conglobazione. 

Ma tale deviazione innesca un processo che porta al collasso della 

precedente situazione di pooling. Siccome i tipi A si accalcano a lavorare 

per lui, il parco agenti disponibile per gli altri imprenditori diviene di 

8

qualità media inferiore e può non valere il salario di 25˙000€. Se tale 

salario viene abbassato, allora la differenza rispetto ai 26˙500€ offerti 

dall’imprenditore deviante, può raggiungere un livello tale che anche i 

tipi B trovano conveniente affrontare un corso tosto. Ma allora il 

deviante può alzare la sua richiesta a 2 corsi, accrescendo il differenziale 

di salario ma in modo tale che i tipi B non abbiano interesse ad agire 

come i tipi A. Altri imprenditori, che anch’essi desiderano attirare dei 

tipi A, devono usare delle strategie analoghe se li vogliono attrarre. 

Questo processo continua finchè il mercato raggiunge l’equilibrio 

separante descritto in precedenza. 

Nell’esempio, la richiesta di un corso tosto è usato come meccanismo 

di screening da parte del datore di lavoro. C’è però anche la possibilità 

che un lavoratore compia la stessa azione come segnale. In effetti, ci 

sono molti parallelismi tra segnalazione e screening, benchè l’equilibrio 

finale possa differire in dipendenza dell’ordine delle mosse. 

10.5. Estensione della nozione di equilibrio perfetto nei sottogiochi al 

caso di giochi in forma estesa con informazione imperfetta. 

Equilibri bayesiani perfetti 

Finora il problema della risoluzione di un gioco in forma estesa con 

informazione imperfetta è stato toccato solo di sfuggita. L’unica idea a 

nostra disposizione fino a questo momento è quella di cercare gli 

equilibri di Nash della forma normale del gioco stesso. Così abbiamo 

fatto, ad esempio, per risolvere il gioco in forma estesa G3 del paragrafo 

2.11 (cfr. paragrafo 7.6 ed esercizio 7.7.3). Tuttavia, il successo di tale 

tentativo è dovuto al fatto, abbastanza eccezionale, che la forma normale 

del gioco G3 ha un unico equilibrio di Nash. Di regola, la forma normale 

di un gioco con mosse sequenziali ed informazione imperfetta ha una 

grande molteplicità di equilibri di Nash, sicchè il passaggio alla forma 

normale non è, in generale, il mezzo più adeguato per la risoluzione del 

gioco stesso. Occorre cioè ragionare direttamente sulla forma estesa del 

gioco. A tale scopo occorre ricordare quanto è stato accennato nel 

paragrafo 7.6 e cioè che nell’affrontare la risoluzione di un gioco in 

forma estesa con informazione imperfetta conviene utilizzare le strategie 

di comportamento anziché le strategie miste 5 , a patto che il gioco abbia 

5 Numerosi autori considerano così ovvio l’uso delle strategie di comportamento nei 

giochi in forma estesa che col termine “strategie miste” indicano, in realtà, le 

strategie di comportamento. 

9

icordo perfetto (ciò che si verifica sempre negli esempi considerati nel 

corso). 

In effetti le strategie di comportamento sono più maneggevoli delle 

strategie miste e l’insieme degli equilibri di Nash in strategie di 

comportamento è, in genere, più piccolo (nel senso dell’inclusione) 

dell’insieme degli equilibri di Nash in strategie miste, in forza del fatto 

che una stessa strategia di comportamento può essere generata da più 

strategie miste. 

Ciò premesso e convenendo che nel seguito di questo capitolo col 

termine generico di strategia ci riferiremo ad una strategia di 

comportamento, l’idea successiva che viene alla mente è quella di 

raffinare la nozione di equilibrio di Nash estendendo ai giochi in forma 

estesa con informazione imperfetta il procedimento di analisi a ritroso e 

la nozione di equilibrio perfetto nei sottogiochi. 

Ora l’essenza dell’idea di perfezione nei sottogiochi nei giochi con 

informazione perfetta è quella di sostituire sull’albero del gioco un 

sottogioco col profilo di pagamenti che risulta dall’uso di un equilibrio di 

Nash del sottogioco, che esclude scelte irrazionali in ogni nodo del 

sottogioco stesso; se il sottogioco ha un solo equilibrio di Nash esso è 

necessariamente perfetto nel senso suddetto.. 

In qualche caso tale idea funziona anche nei giochi con informazione 

imperfetta, come nel seguente 

Esempio 1 (Fudenberg e Tirole). Consideriamo il gioco astratto 

rappresentato in forma estesa dall’albero disegnato di seguito: 

10

Tentiamo l’analisi a ritroso standard. Nel nodo prefinale d II preferisce 

l’azione R', mentre nel nodo prefinale e ella preferisce l’azione L'. Ma 

siccome i nodi d ed e appartengono allo stesso insieme di informazioni 

ed ella deve operare un’unica scelta tra L' ed R', non ne ricaviamo nulla. 

Se però risaliamo all’indietro l’albero vediamo che il sottogioco che ha 

radice nel nodo c è il gioco a somma zero con mosse simultanee 

che ha un unico equilibrio di Nash in cui ciascuno dei due giocatori 

sceglie con la stessa probabilità ciascuna delle sue due strategie pure, 

con pagamenti (0, 0). Sostituendo il sottogioco con radice in c col vettore 

di pagamenti (0, 0) si ottiene il gioco 

che ha l’equilibrio perfetto nei sottogiochi (r, L) con pagamenti (3, 1). In 

definitiva il gioco di partenza ha un unico equilibrio perfetto nei 

sottogiochi in cui I usa la strategia r, 1 

[ l '] 

+ 

2 1 

⎛ 

⎞ 

[ r '] 

⎝ 

⎜ 

2 ⎠ 

⎟ e II usa la 

strategia L, 1 

[ L '] 

+ 

2 1 

2 R' 

⎛ 

⎞ 

[ ] 

⎝ 

⎜ 

⎠ 

⎟ . 

L’idea di utilizzare la perfezione nei sottogiochi risulta però del tutto 

inefficace in quei giochi, in forma estesa e con informazione imperfetta, 

che non possiedono sottogiochi propri. In tali casi si utilizza la nozione 

di equilibrio bayesiano perfetto (o quella analoga di equilibrio 

sequenziale), che differisce in modo sostanziale dalle nozioni di 

equilibrio utilizzate in precedenza perché è una coppia costituita da un 

profilo di strategie e da un “sistema di credenze”. 

11

Tale nozione di equilibrio è costruita sulla base delle richieste che ora 

formuliamo. 

• Richiesta 1 (Credenze) In ciascun suo insieme di informazioni, il 

giocatore che ivi è chiamato a muovere deve avere delle credenze su 

quale nodo dell’insieme sia stato effettivamente raggiunto nello 

sviluppo del gioco. 

Una credenza (belief) relativa ad un insieme di informazioni γ è 

dunque una distribuzione di probabilità (a posteriori) sui nodi di γ 6 ed un 

sistema di credenze è una famiglia di tante distribuzioni di probabilità 

quanti sono gli insiemi di credenze. 

Noi supporremo sempre nel seguito che se viene giocato un profilo di 

strategie σ, il sistema di credenze µ dei giocatori sia conoscenza comune 

dei giocatori. 

• Richiesta 2 (Razionalità sequenziale) Date le loro credenze, le 

strategie scelte dai giocatori devono essere sequenzialmente 

razionali. Ossia, partendo da un qualsiasi insieme di informazioni 

dell’albero, il profilo di strategie continua ad essere un profilo di 

strategie di equilibrio, dato il sistema di credenze. 

• Richiesta 3 (Consistenza debole) Le credenze dei giocatori devono 

essere debolmente consistenti con le strategie, nel senso che esse 

devono essere ottenute dalle strategie e dalle azioni osservate 

mediante l’uso del teorema di Bayes, ogni qualvoltta risulti possibile 

applicarlo. 

Ciò premesso, definiamo Equilibrio Bayesiano Perfetto (EBP) una 

coppia (σ, µ), dove σ è un profilo di strategie di comportamento e µ un 

sistema di credenze per il gioco, tali che risultino soddisfatte le richieste 

1, 2, 3. Ossia in ogni insieme di informazioni il profilo di strategie σ 

deve indicare scelte ottimali date le credenze, e il sistema di credenze µ 

deve essere debolmente consistente con σ. 

Si noti che la ricerca delle strategie ottimali e delle credenze è 

simultanea, come se si trattasse della risoluzione di un sistema di 

equazioni. 

L’esistenza di almeno un EBP in ogni gioco finito in forma estesa è 

assicurata da un risultato (in realtà più forte) ottenuto da Kreps e Wilson, 

da cui discende anche la seguente 

6 Ovviamente se γ è un singoletto, allora l’unico nodo di γ sarebbe scelto con 

probabilità 1, qualora γ fosse effettivamente raggiunto. 

12

Proposizione. Se (σ, µ) è un equilibrio bayesiano perfetto di un gioco in 

forma estesa con ricordo perfetto, allora σ è un equilibrio di Nash (in 

strategie di comportamento). 

La nozione di EBP lascia irrisolto il problema di come un giocatore 

debba aggiornare le sue credenze in un suo insieme di informazioni γ 

(con due o più nodi) che sia fuori dal cammino di equilibrio. Infatti se i 

giocatori seguono fedelmente il profilo di strategie σ, la probabilità che 

venga raggiunto γ è zero ed allora non si può applicare la regola di 

Bayes. In un tale insieme di informazioni γ ogni credenza è allora 

ammissibile. Ciò implica che in γ il giocatore (cui γ appartiene) può 

scegliere qualsiasi azione a sua disposizione, a patto peraltro di 

comportarsi razionalmente rispetto a qualche credenza. 

È possibile raffinare la nozione di EBP in modo da prendere in 

considerazione il problema ora segnalato, ma noi semplicemente lo 

ignoreremo e, all’occorrenza, ci regoleremo in modo empirico. 

Esempio 2 (Il cavallo di Selten 7 ). Consideriamo il seguente gioco in 

forma estesa con tre giocatori I, II e III, nel quale, per evidenziare la 

motivazione del nome attribuito a questo gioco rappresentiamo l’albero 

con la radice a posta in alto (l’albero assume allora la forma di un 

cavallo stilizzato). 

7 Reinhard Selten ha ottenuto il premio Nobel 1994 per le scienze economiche 

assieme a John F. Nash ed a John Harsanyi. 

13

Come chi legge può verificare da sola/o i due profili di strategie pure 

(L, r2, l3) ed (R, r2, r3) sono equilibri di Nash. Per ciascuno di essi 

studiamo se è possibile associare al profilo di strategie un sistema di 

credenze µ, in modo tale che la coppia costituita dal profilo di strategie e 

dal sistema di credenze costituisca un EBP. Ovviamente si ha µ{a} = µ{b} 

= 1 mentre poi poniamo µ{c, d} = (p, 1 – p) con p ∈[0, 1] da determinare, 

se possibile. 

Cominciamo dal profilo (L, r2, l3). Se (p, 1 – p) è la credenza di III in 

{c, d} i pagamenti attesi derivanti dall’uso di (L, r2, l3) sono 

(5 – p, 5 – p, 4p) . 

Ora, osservando che il pagamento 5 – p del giocatore II è > 3 per ogni p 

∈[0, 1], è irrazionale che II usi r2 anziché l2 se I usa L e III usa l3, quale 

che sia il sistema di credenze µ, e dunque l’equilibrio di Nash (L, r2, l3) 

non genera alcun EBP. 

Consideriamo ora il profilo di strategie (R, r2, r3), che sappiamo essere 

un equilibrio di Nash, ed associamo ad esso un sistema di credenze µ con 

µ{c, d} = (p, 1 – p) e p ∈[0, 1] da determinare. 

Tuttavia, nel caso attuale, l’insieme di informazioni {c, d} viene 

raggiunto con probabilità zero poiché è fuori dal percorso individuato dal 

profilo di strategie. Qualsiasi credenza µ{c, d} = (p, 1 – p) è allora 

ammissibile in tale insieme di informazioni, a patto che essa sia coerente 

con la scelta r3 di III in {c, d}. Allora ragioniamo così. Se il gioco (per 

esempio, per un errore di esecuzione di una mossa) raggiungesse 

l’insieme di informazioni {c, d} il giocatore III otterrebbe 4p scegliendo 

l3 e 2 – p scegliendo r3 e poiché 2 – p > 4p ⇔ 0 ≤ p < 2/5, ogni credenza 

(p, 1 – p) con 0 ≤ p < 2/5 è coerente con la scelta r3. Inoltre date tali 

credenze e data la scelta R di I in {a} ed r3 di III in {c, d} se II deviasse 

da r2 ad l2 otterrebbe un pagamento atteso di 2(1 – p) anziché di 3 ed I, se 

deviasse da R ad L, otterrebbe 1 – p anziché 3. 

In conclusione ogni coppia (s, µ) con s = (R, r2, r3) e µ = (1 ; 1; (p, 1 – 

p)) con p ∈ [0, 2/5[ costituisce un EBP. [Peraltro il fatto che un singolo 

equilibrio di Nash possa dar luogo ad infiniti EBP mostra i limiti della 

nozione di EBP.] 

Nel prossimo paragrafo utilizzeremo la nozione di EBP per la 

risoluzione di un gioco dinamico con informazione asimmetrica. 

L’esempio ci servirà anche per illustrare l’idea di Harsanyi per 

14

trasformare una situazione con informazione incompleta in un gioco con 

informazione completa ma imperfetta. 

10.6. La trasformazione di Harsanyi. Equilibri separanti, 

conglobanti, semiseparanti 

Traggo da [DS] il seguente 

Esempio. La vecchia e consolidata ditta ANTICA si trova sul mercato a 

produrre un certo bene in regime di monopolio. Ma ora essa deve 

confrontarsi con NOVA, una nuova ditta che vuole competere con 

ANTICA per il mercato di quel bene. ANTICA deve decidere se 

affrontare una guerra dei prezzi. 

Alla fine il mercato di quel bene sarà dominato da una sola ditta e cioè 

da ANTICA se NOVA decide di non sfidarla, da NOVA se essa stessa 

sfida e ANTICA si ritira dal mercato, e dalla vincitrice del conflitto se 

NOVA sfida e ANTICA si batte con lei. 

ANTICA si trova in questa situazione: se NOVA ha una tecnologia più 

efficiente, allora ANTICA non può pensare di vincere la competizione e 

farebbe meglio a ritirarsi da quel mercato, lasciando il campo libero a 

NOVA. Diremo, in un tale caso, che NOVA è di tipo Forte mentre 

diremo in caso contrario che NOVA è di tipo Debole. 

In caso di conflitto effettivo, ANTICA sconfiggerà una NOVA di tipo 

Debole, mentre una NOVA di tipo Forte sconfiggerà ANTICA. 

Nella tabella che segue indichiamo i pagamenti a NOVA, presa come 

giocatore I, e ad ANTICA, presa come giocatore II, nel caso che NOVA 

sfidi. L’idea è che una NOVA di tipo Forte può ottenere un’utilità di 4 se 

è lasciata sola a dominare il mercato, mentre ANTICA può ottenere 3 e 

una nova di tipo Debole solo 2; ma un conflitto effettivo ha un costo di 

due utili per ciascuna. 

Tabella dei pagamenti (nel caso che NOVA sfidi) 

15

[Per esempio i pagamenti nella cella in basso a sinistra sono calcolati 

così: una NOVA Debole perde 2, che è il costo della lotta, e ANTICA 

ottiene 3 per la vittoria ma paga 2 per il costo della lotta e quindi ottiene 

il pagamento 1.] 

Le cose sarebbero semplici se ANTICA conoscesse il vero tipo di 

NOVA. Allora, nel caso di NOVA Debole, il gioco sarebbe 

che ha l’unico equilibrio perfetto nei sottogiochi (non sfida, lotta). 

E, nel caso di NOVA Forte, il gioco sarebbe 

con l’equilibrio perfetto nei sottogiochi (sfida, si ritira) e pagamenti (4, 0). 

Ma le cose non stanno così perché, mentre NOVA conosce il suo proprio 

tipo, ANTICA non conosce il vero tipo di NOVA, che potrebbe anche 

millantare un profilo superiore, pur essendo di tipo Debole, sperando di 

indurre ANTICA a ritirarsi e godere essa stessa dei profitti di una 

situazione di monopolio. ANTICA conosce però la situazione generale 

dell'industria e della tecnologia ed è in grado di formulare una congettura 

sulla probabilità a priori che NOVA sia di tipo Debole. Indichiamo con d 

tale probabilità e supponiamo che essa sia conoscenza comune di I e di 

II. È proprio sull'ipotesi che le credenze a priori dei giocatori siano 

conoscenza comune degli stessi che fa perno la metodologia di Harsanyi 

per tradurre una situazione con informazione incompleta in un gioco con 

16

informazione completa ma imperfetta. 8 Egli propone come mossa 

iniziale di un tale gioco una mossa della Fortuna 9 che, nel nostro 

esempio, sceglie con probabilità d il tipo Debole di NOVA e con 

probabilità (1 - d) il tipo Forte di NOVA. 

ANTICA deve scegliere se lottare, senza conoscere il vero tipo della 

sfidante quando essa si presenta. A sua volta NOVA deve decidere se 

sfidare, sapendo che ANTICA attribuisce (a priori) probabilità d 

all’evento che NOVA sia di tipo Debole. Di fronte ad una sfida e senza 

ulteriori basi per l’informazione, ANTICA calcolerà il suo pagamento 

atteso derivante dallo scontro come 

d · 1 + (1 - d) · (-2) = 3d – 2 . 

Se il pagamento (di II) è positivo, cioè se d > 2/3, ANTICA lotterà; 

altrimenti si ritirerà. Ciò ha un chiaro significato: se la credenza a priori 

di ANTICA è che verosimilmente NOVA è di tipo Debole, allora ha 

senso per ANTICA affrontarla. 

Ora supponiamo che NOVA possa fornire qualche segnale della propria 

forza: per esempio, esibendo prototipi di prodotti avanzati, benchè non 

abbia ancora la capacità di produrre grandi quantità allo stesso livello 

qualitativo. Chiamiamo tali attività esibizione. Se NOVA è davvero 

Forte, essa compie un’esibizione automaticamente e senza costo alcuno. 

Una NOVA Debole può cercare di camuffarsi da Forte mediante 

un’esibizione, ma tale comportamento implica un costo aggiuntivo. 

Ora sia c l’utilità che I attribuisce alla somma di denaro che I deve 

spendere per l’esibizione, quando è Debole. Supponiamo che anche il 

valore c, come quello di d, sia conoscenza comune di I e di II. 10 

8 

Per evitare l’abuso linguistico denunciato nel paragrafo 10.1 alcuni autori usano la 

locuzione “gioco con informazione incompleta” per riferirsi al risultato finale della 

trasformazione di Harsanyi e cioè un gioco con informazione imperfetta in cui la 

Fortuna muove per prima e la sua scelta non è osservata da uno almeno dei giocatori. 

Con una tale interpretazione il gioco di carte G3 (di Myerson), descritto in 2.11., è un 

gioco con informazione incompleta. Myerson stesso però chiarisce così la sua 

interpretazione del termine “informazione incompleta”: il gioco G3 ha informazione 

incompleta se I conosce il colore della carta (cioè ha un’informazione privata) ancora 

prima che siano rivelate a I e a II le regole del gioco: altrimenti il gioco G3 ha 

informazione imperfetta, ma completa. 

9 

Molti autori (i più) usano il termine “Natura”, anziché “Fortuna”, per indicare un 

fittizio “Giocatore Zero”. 

10 

La metodologia di Harsanyi non fornisce alcuna indicazione sul modo in cui I e II 

possono pervenire ad una valutazione comune di d e di c. 

17

L’albero del gioco, disegnato qui di seguito, ha alcune caratteristiche 

speciali che prendono in conto l’asimmetria dell’informazione. Primo, il 

tipo di NOVA è aleatorio; perciò il gioco inizia in un nodo (detto 

“storico”) in cui la Fortuna (o la Natura) fa tale scelta con probabilità d e 

1 - d. I nodi successivi, a e b, appartengono a NOVA, che, conoscendo il 

suo proprio tipo, deve decidere se sfidare e, nel caso che sia Debole, se 

cercare di imitare il tipo Forte con un’esibizione che ha costo c. 

Albero del gioco NOVA-ANTICA 

Poi, sul livello successivo dell’albero, arrivano gli insiemi di 

informazione di ANTICA. Quando sceglie, ANTICA non conosce per 

certo il vero tipo di NOVA, ma può osservare se c’è una esibizione. Se 

NOVA sfida senza esibizione, ANTICA ne intuisce che NOVA è di tipo 

Debole e perciò si ha un insieme di informazioni che ha un solo nodo 

(nel nodo α, ANTICA ovviamente lotta). C’è inoltre la coppia di nodi 

{ß, y} che costituisce un altro insieme di informazioni di ANTICA. 

Descritto il gioco, andiamo alla caccia degli EBP. Per semplificare 

l’analisi suddividiamo il lavoro nella ricerca degli equilibri che 

comportano separazione dei tipi di NOVA (detti equilibri separanti), 

conglobazione dei tipi (equilibri conglobanti) o una miscela delle due 

cose (equilibri semiseparanti). La natura dell’equilibrio dipende dalla 

probabilità d che NOVA sia debole e dal costo c dell’esibizione per un 

tipo debole. Cominciamo con la ricerca degli equilibri separanti. 

a) Equilibrio separante. Se il costo che il tipo debole di NOVA deve 

pagare per l’esibizione è per lei troppo alto, allora la presenza o meno di 

esibizione permette di separare i due tipi. Precisamente, se c > 2, il tipo 

18

debole di NOVA ottiene comunque un pagamento negativo se cerca di 

sfidare (il livello di riferimento per lo statu quo è c = 0) ed allora è 

irrazionale per lei sfidare. Quindi, se c > 2, ANTICA può inferire che 

una NOVA che usa l’esibizione è forte, con probabilità 1. 

Supposta allora soddisfatta la condizione c > 2, si può congetturare 

che, in equilibrio, 

(i) NOVA sfida se è forte e non sfida se è debole; 

(ii) se ANTICA osserva una sfida con esibizione, essa ne deduce che, 

con probabilità 1, NOVA è forte e perciò essa si ritira; se 

ANTICA osserva una sfida senza esibizione, essa ne deduce che, 

con probabilità 1, NOVA è debole e perciò lotta. 

Detto in modo più formale, vogliamo provare che la coppia costituita dal 

profilo di strategie (pure) 

( σ{ a} 

, σ{ b} 

; τ{ α} 

, τ{ β,γ } ) = (non sfida, sfida; lotta, si ritira) 11 

e dal sistema di credenze a posteriori 

( µ { a} 

, µ { b} 

; µ { α} 

, µ { β,γ } ) = ( 1, 1; 1, ( 0; 1) 

) 

costituisce un EBP. 

( ) = (non sfida, sfida) di NOVA, ANTICA 

Data la strategia σ{ a} 

, σ{ b} 

inferisce correttamente che un’esibizione indica forza e che l’assenza di 

esibizione indica debolezza. Dai pagamenti notiamo che ANTICA 

preferisce lottare con una NOVA di tipo debole e preferisce ritirarsi con 

una NOVA di tipo forte. Perciò la strategia di ANTICA τ α 

( { } , τ{ β,γ } ) = 

(lotta, si ritira) è risposta ottimale alla strategia (non sfida, sfida) di 

NOVA. 

Data la strategia τ α 

( { } , τ{ β,γ } ) = (lotta, si ritira) di ANTICA e dato il 

sistema di credenze µ, la strategia (non sfida, sfida) di NOVA è risposta 

ottimale a τ, dal momento che 

• una NOVA debole ottiene 0 se non sfida, -2 se sfida senza 

esibizione, 2 – c < 0 se sfida con esibizione; 

• una NOVA di tipo forte ha sempre interesse a sfidare. 

b) Equilibrio conglobante. Se il costo dell’esibizione è “piccolo”, ci 

dobbiamo aspettare che un tipo debole di NOVA usi l’esibizione per 

11 

È il profilo di strategie di comportamento ( ( 0, 0, 1), 

( 1, 0); 

( 1, 0), 

( 0, 1) 

). 

19

camuffarsi da tipo forte. Perciò, se c < 2, andiamo alla caccia di un 

equilibrio conglobante. 

Tuttavia c’è un ulteriore condizione perché possa esistere un tale 

equilibrio e cioè che sia sufficientemente piccola la probabilità d che 

NOVA sia debole. Altrimenti, se è molto probabile che NOVA sia 

debole, ANTICA troverà ottimale contrare qualsiasi sfidante, ma allora 

per il tipo debole di NOVA non è più ottimale sfidare. 

Partiamo allora supponendo che sia c < 2 e cerchiamo di determinare un 

valore critico d * ∈ ]0, 1[ tale che se d < d * sono soddisfatte tutte le 

condizioni perché esista un EBP conglobante. Ossia pretendiamo che, in 

equilibrio, siano verificati i seguenti due punti: 

1. Entrambi i tipi di NOVA sfidano ed (anche) il tipo debole usa 

l’esibizione. 

2. ANTICA si ritira se appare una sfidante con esibizione, mentre 

accetta la sfida se appare una sfidante senza esibizione. 

Data la strategia di NOVA (al punto 1.), ANTICA non può dedurre 

alcunchè osservando l’esibizione, e la sua valutazione della probabilità 

che essa abbia di fronte una NOVA di tipo debole rimane d. Perciò il 

pagamento atteso di ANTICA derivante dallo scontro è 

d · 1 + (1 - d) · (-2) = 3d – 2 . 

Se d < 2/3 tale pagamento atteso è negativo ed è ottimale per ANTICA 

ritirarsi con pagamento 0. Così un tipo debole di NOVA riesce a 

camuffarsi con successo. 

Supponiamo ora c < 2 e d < 2/3 (= d * ) e proviamo che la strategia di 

NOVA, indicata al punto 1. è risposta ottimale alla strategia di ANTICA, 

indicata al punto 2.. Infatti, in risposta alla strategia di ANTICA, una 

NOVA tipo debole ottiene 2 - c > 0 sfidando con esibizione, 0 non 

sfidando e -2 sfidando senza esibizione. Se poi NOVA è di tipo forte, per 

lei è sempre ottimale sfidare. 

Abbiamo quindi provato che, se c < 2 e d < 2/3, la coppia costituita dal 

profilo di strategie pure 

( σ{ a} 

, σ{ b} 

; τ{ α} 

, τ{ β,γ } ) = (sfida con esibizione, sfida; lotta, si ritira) 

e dal sistema di credenze a posteriori 

( µ { a} 

, µ { b} 

; µ { α} 

, µ { β,γ } ) = ( 1, 1; 1, ( d; 1 - d) 

) 

costituisce un EBP (conglobante). 

c) Equilibrio semiseparante. 

Cerchiamo ora un equilibrio nel caso che sia c < 2 e d > 2/3. 

20

In tale caso l’equilibrio non può essere separante. 

Infatti, se la strategia di NOVA è di non sfidare se debole e di sfidare 

(con esibizione) se forte, allora ANTICA ne inferirebbe che una sfida 

con esibizione è l’evidenza di un tipo forte e dunque, in tal caso, si 

ritirerebbe. Ma allora un tipo debole di NOVA dovrebbe sfruttare tale 

credenza e sfidare con esibizione spacciandosi per forte, perché stavolta, 

con c < 2, NOVA debole otterrebbe un pagamento 2 - c positivo. 

Né ci può essere un equilibrio (completamente) conglobante. 

Infatti, allorchè d > 2/3, la probabilità che NOVA sia di tipo debole è 

così alta che, se NOVA sfida con esibizione, è ottimale per ANTICA 

affrontare sempre la sfida, ed allora una NOVA di tipo debole ottiene (-2 

- c). In tale caso il tipo debole di NOVA non dovrebbe esibirsi (né 

comunque sfidare) e la conglobazione non può reggere. 

L’analisi ora svolta mostra che, nel caso c < 2 e d > 2/3, non può essere 

ottimale per il tipo debole di NOVA non sfidare mai né può essere 

ottimale sfidare sempre. In altre parole l’equilibrio dovrà coinvolgere 

strategie “miste” 12 . Perciò cerchiamo un equilibrio in strategie miste in 

cui 

(i) un tipo debole di NOVA sfida con probabilità p; 

(ii) ANTICA trae le sue inferenze dalle osservazioni usando il 

teorema di Bayes, e risponde ad una sfida con esibizione 

accettando la sfida con probabilità q (e ritirandosi con probabilità 

(1 - q)) ed ad una sfida senza esibizione accettando la sfida con 

probabilità 1. 

Vogliamo quindi determinare p ∈ ]0, 1[ e q ∈ ]0, 1[ compatibili con la 

richiesta di un equilibrio in strategie miste. Prima dobbiamo vedere come 

la regola di Bayes fornisce ad ANTICA le sue proprie inferenze 

osservando una sfida con esibizione. 

Nella tabella seguente riportiamo le probabilità delle varie combinazioni 

del “vero stato del mondo” (il vero tipo di NOVA) e dell’osservazione 

dell’esibizione. 

12 Qui col termine “strategia mista” vogliamo intendere una strategia di 

comportamento che non degenera in una strategia pura. 

21

Probabilità delle combinazioni (Tipo di NOVA, Esibizione sì/no) 

come vengono inferite da ANTICA nel caso c < 2 e d > 2/3. 

Perciò se ANTICA sa che c < 2 e d > 2/3 ed osserva una sfida con 

esibizione, essa ricalcola la probabilità che NOVA sia di tipo debole, 

condizionata dal fatto che ha osservato l’esibizione. In base al teorema di 

Bayes, tale probabilità è 

dp 

1 - d + dp . 

Analogamente la probabilità condizionata (dall’esibizione) che NOVA 

sia forte è 

1 - d 

1 - d + dp . 

Allora, usando tali probabilità a posteriori, ANTICA ricalcola il suo 

proprio pagamento atteso nello scontro come 

dp 

1 - d dp - 2( 1 - d) 

1 · + (-2) · = 

1 - d + dp 1 - d + dp 1 - d + dp . 

In equilibrio tale pagamento atteso deve risultare uguale al pagamento 

atteso che ANTICA ottiene ritirandosi, che vale 0. Perché valga tale 

uguaglianza deve essere 

1 - d 

da cui si ricava p = 2 

d 

dp - 2(1 - d) = 0 

(ricordiamo che d > 2/3 il che assicura che 

p ≤ 1). 

Allorchè d cresce da 2/3 fino ad 1, p cala da 1 a 0. 

Ciò significa (nel contesto del nostro problema) che, allorchè aumenta la 

probabilità che NOVA sia debole, una NOVA di tipo debole che 

22

andomizza assegna una probabilità minore all’azione di sfida con 

esibizione (per cercare di camuffarsi da tipo forte) se ciò serve per 

evitare la risposta di scontro da parte di ANTICA. 

Infine per determinare q ∈ ]0, 1[, la probabilità con cui ANTICA 

raccoglie un guanto di sfida, in equilibrio, imponiamo che siano uguali il 

pagamento atteso che una NOVA di tipo debole riceve sfidando con 

esibizione, e cioè 

q(- 2 - c) + (1 - q)(2 - c) = 2 - c - 4q 

e il pagamento che essa ottiene senza sfidare e cioè 0. 

Risolvendo l’equazione 2 - c - 4q si ottiene 

2 - c 

q = 

4 . 

L’equilibrio bayesiano perfetto dato dalle strategie di comportamento 

( σ{ a} 

, σ{ b} 

) = ( ( 0, p, 1 - p), 

( 1, 0) 

) di I 

( τ{ α} 

, τ{ β,γ } ) = ( ( 1, 0), 

( q, 1 - q) 

) di II 

e dalle credenze indicate al punto (ii), è chiamato semiseparante: se 

NOVA sfida senza esibizione oppure se non sfida, essa si rivela come 

tipo debole, ma se essa sfida con esibizione ANTICA rimane incerta su 

quale sia il vero tipo di NOVA. 

Osservazioni. 

1) Usualmente una segnalazione viene fatta dal giocatore più informato 

allorchè la sua situazione è per lui positiva, per fornire l’informazione in 

modo credibile. Qui però si tratta di “signal jamming”: il giocatore I più 

informato, allorchè la situazione è per lui negativa, sceglie, con 

probabilità p, un’azione che vorrebbe indurre II a credere che la 

situazione di I è buona. La randomizzazione usata dal tipo debole fa 

parte di un equilibrio (sul quale si suppone che convergano i giocatori) 

nel quale diventa confuso il processo mentale di ANTICA nel trarre le 

sue deduzioni dalle osservazioni. 

2) Nell’equilibrio semiseparante ora considerato ANTICA risponde in un 

modo che dà al tipo debole di NOVA lo stesso pagamento atteso che 

NOVA ottiene senza sfidare. Ma ora il tipo forte di NOVA deve lottare 

con probabilità q > 0 e (poiché in caso di scontro essa riceve pagamento 

2 anziché 4) il suo pagamento atteso cala da 4 a 4(1 - q) + 2q = 4 - 2q. In 

altre parole, il fatto che, per l’avversaria, NOVA possa essere di tipo 

debole esercita un effetto esterno negativo sul tipo forte. 

23

10.7. Esercizi 

1) Bobo è seduto nel posto più prestigioso del bar dello sport e sta 

pensando ai fatti suoi allorchè entra nel bar un attaccabrighe (A). 

A vorrebbe molestare Bobo per ottenere il suo posto, ma solo se 

Bobo è un fifone. Se Bobo è un duro, A preferisce lasciarlo in 

pace. A non sa se Bobo è un fifone o un duro, tuttavia egli valuta 

che con probabilità 1 

Bobo è un duro, e questa valutazione di A è 

3 

supposta conoscenza comune dei due. Se Bobo è un fifone ed A lo 

molesta, Bobo lascerà il posto, ma se Bobo è un duro ed A lo 

molesta, egli reagirà violentemente per conservare il suo posto al 

bar. 

Supponiamo che Bobo possa segnalare se è un duro o un fifone 

scegliendo di bere birra o di mangiare torta. Uomini duri non 

amano la torta ed i fifoni non amano la birra! 

Bobo ottiene 2 punti se A non lo molesta e zero in caso contrario, 

più un punto se evita di consumare qualcosa che non gradisce. A 

ottiene un punto se indovina correttamente il tipo di Bobo (e zero 

in caso contrario). 

Disegna la forma estesa di questo gioco e trovane tutti gli equilibri 

di Nash. 

2) La vecchia e consolidata ditta I, dominante in un determinato 

mercato, deve ora confrontarsi con una nuova ditta II, desiderosa 

di entrare in competizione. La ditta I deve decidere se costruire 

una nuova fabbrica, e simultaneamente la ditta II deve decidere se 

entrare effettivamente in competizione con I. Supponiamo che la 

ditta II sia incerta se a I costruire una nuova fabbrica costi 1.5 

oppure 0, mentre quest’ultima conosce il costo a cui va incontro. 

Tenuto conto di ciò supponiamo che i pagamenti per le due ditte, 

nel caso di “alto costo” e nel caso di “basso costo” siano quelli 

indicati nella figura seguente (C=costruire, NC=non costruire, 

E=entrare, NE=non entrare). 

24

Supponiamo ora che II assegni uguale probabilità, e cioè 1 

2 , 

all’evento che la ditta I sia di tipo “alto costo” e rispettivamente di 

tipo “basso costo” e che questa valutazione di II sia conoscenza 

comune di entrambi. 

(i) Disegna l’albero del gioco con informazione imperfetta che 

rappresenta la trasformazione di Harsanyi. 

(ii) Scrivine la relativa forma normale e determina gli equilibri di 

Nash di tale gioco. 

3) Riprendiamo il gioco G3 del paragrafo 2.11 (cfr. anche 7.6). 

Mostra che esso ha un unico equilibrio bayesiano perfetto formato 

dal profilo di strategie di comportamento 

[ R], 

1 

3 R [ ] ⊕ 2 

3 C [ ] ; 2 

3 V [ ] ⊕ 1 

3 P 

⎛ 

⎞ 

[ ] 

⎝ 

⎜ 

⎠ 

⎟ 

e dal sistema di credenze 

µ { a} 

= 1 , µ { b} 

= 1 , µ { c, d} 

= (0.75 ; 0.25). 

25

10. Giochi con informazione asimmetrica - utenti

Create successful ePaper yourself

Delete template?

Save as template?