appunti 1 - DIMA

Indice 

1 Giochi non cooperativi 5 

1.1 Teoria delle decisioni . . . . . . . . . . . . . . . . . . . . . . . 5 

1.2 Decisioni sotto stretta incertezza . . . . . . . . . . . . . . . . 8 

1.3 Decisioni intertemporali . . . . . . . . . . . . . . . . . . . . . 14 

1.4 Preferenze e funzioni di utilità . . . . . . . . . . . . . . . . . . 20 

1.5 Equilibri di Nash . . . . . . . . . . . . . . . . . . . . . . . . . 23 

1.6 Giochi in forma estesa I . . . . . . . . . . . . . . . . . . . . . 34 

1.7 Giochi in forma estesa II . . . . . . . . . . . . . . . . . . . . . 45 

1.8 Raffinamenti degli equilibri di Nash . . . . . . . . . . . . . . . 55 

1.9 Esempi di giochi con strategie dominate . . . . . . . . . . . . 61 

1.10 Evasione fiscale (Li-Calzi) . . . . . . . . . . . . . . . . . . . . 65 

1.11 Giochi con potenziale . . . . . . . . . . . . . . . . . . . . . . . 68 

1.12 Giochi di contrattazione . . . . . . . . . . . . . . . . . . . . . 71 

1.13 Corsa agli sportelli (gioco a due stadi) . . . . . . . . . . . . . 77 

1.14 Dilemma del prigioniero ripetuto n volte . . . . . . . . . . . . 81 

1.15 Giochi ripetuti e automi finiti . . . . . . . . . . . . . . . . . . 87 

2 Evolutionary Game Theory da Weibul 97 

2.1 Elementi della Teoria dei Giochi non cooperativi . . . . . . . . 97 

2.2 Criteri di stabilità evolutiva . . . . . . . . . . . . . . . . . . . 102 

2.3 Dinamica del replicatore . . . . . . . . . . . . . . . . . . . . . 115 

3

Capitolo 1 

Giochi non cooperativi 

1.1 Teoria delle decisioni 

Esempio 1.1 Roulette russa. 

Due persone della stessa età e della stessa salute hanno ciascuna una rivoltella. 

Il primo tizio ha 3 proiettili nel tamburo della pistola a 6 colpi. 

Il secondo tizio ha 1 proiettile nel tamburo della pistola a 6 colpi. 

Ciascuno sta per ruotare il tamburo, puntare la pistola alla propria testa e 

premere il grilletto. 

Questo è tutto ciò che sai. 

Puoi togliere 1 solo proiettile da una delle pistole prima che essi premano il 

grilletto. 

Da quale pistola toglieresti il proiettile? 

Cerchiamo di schematizzare il problema: 

ci sono 2 azioni: 

AZIONE 1: prendere 1 proiettile da quella che ne ha 3. 

AZIONE 2: prendere 1 proiettile da quella che ne ha 1. 

5

Vediamo di schematizzare con le probabilità dei possibili esiti: 

0 MORTI 1 MORTO 2 MORTI 

AZIONE 1 20/36 14/36 2/36 

AZIONE 2 1/2 1/2 0 

Consideriamo una funzione perdita o misura di utilità negativa 

v(0) = 0 

v(1) = −l 0 < l < 1 

v(2) = −1 

Se non amo il rischio: la perdita attesa dal’azione 1 (lotteria L1) sarà minore 

della perdita attesa dall’azione 2 (lotteria L2) 

L1 : 

L2 : 

0 1 2 MORTI 

20/36 14/36 2/36 PROBABILIT À 

0 1 2 MORTI 

1/2 1/2 0 PROBABILIT À 

6

Se non amo il rischio: 

εv(L2) < εv(L1) 

cioè 

v(0) · 1 1 

20 14 2 

+ v(1) · + v(2) · 0 < v(0) · + v(1) · + v(2) · 

2 2 36 36 36 

v(1) · 1 

2 

−l · 1 

2 

14 2 

< v(1) · + v(2) · 

36 36 

14 2 

< −l · − 

36 36 

2 · l > 1 

l > 1 

2 

quale interpretazione possiamo dare? 

Naturalmente preferiamo l’azione che limita il possibile numero di morti. 

Rischiare 2 morti è più di due volte “brutto” che rischiarne uno. 

2l > 1 , −2l < −1 , v(2) > 2v(1) 

e questo è in accordo con ciò che la gente pensa usualmente. 

In generale un singolo incidente che comporta più morti è considerato peggiore 

di più incidenti separati che conducono allo stesso numero di morti. 

Questo problema si può confrontare con un altro reale a cui si trovano di 

fronte i medici: le risorse mediche sono limitate e non è possibile trattare 

tutti i pazienti che hanno bisogno di cure. 

Consideriamo ad esempio un cardiologo che può curare solo 1 di 2 pazienti: 

7

senza trattamento il I ◦ ha 1 

2 

1 

2 

con il trattamento il I ◦ ha 1 

3 

per il II ◦ paziente: 

senza trattamento il II ◦ ha 1 

6 

con il trattamento il II ◦ guararà 

cosa sceglierà il medico? 

Il problema è esattamente quelo di prima. 

probabilità di morire subito 

probabilità di diventare vecchio 

probabilità di morire 

probabilità di morire 

1.2 Decisioni sotto stretta incertezza 

Possiamo dividere i problemi decisionali in 3 classi: 

1. DECISIONI CON CERTEZZA 

2. DECISIONI CON RISCHIO 

3. DECISIONI CON STRETTA INCERTEZZA 

Raccontiamo un esempio dovuto a Savage (1972): 

Tua moglie ha appena rotto 5 uova buone in un tegame quando tu arrivi per 

fare l’omelette. Esiste un sesto uovo non rotto davanti al tegame, può essere 

usato per l’omelette o per qualche cos’altro. 

Devi decidere cosa fare con questo, cioè hai 3 possibili azioni: 

8

1. ROMPERLO NEL TEGAME CHE CONTIENE GLI ALTRI 5 

2. ROMPERLO IN UN PIATTO PER ISPEZIONARLO 

3. BUTTARLO VIA SENZA ISPEZIONARLO 

Dipendendo dallo stato delle uova, queste 3 azioni avranno delle conseguenze 

BUONO: ϑ1 

STATI 

CATTIVO: ϑ2 

ROMPERE OMELETTE DI NESSUNA OMELETTE 

NEL TEGAME 6 UOVA E 6 UOVA BUONE 

α1 x11 DISTRUTTE 

ROMPERE OMELETTE DI OMELETTE DI 

NEL PIATTO 6 UOVA + 5 UOVA 

α2 1 PIATTO DA E 1 PIATTO DA 

LAVARE LAVARE 

x21 

BUTTARE OMELETTE DI OMELETTE DI 

VIA 5 UOVA E 1 5 UOVA 

x12 

x22 

α3 BUON UOVO x32 

DISTRUTTO 

x31 

Le conseguenze xij non sono numeri ma si può sempre associare un valore 

che “misura” xij cioè intendiamo per misura del valore 

“>” preferenza del decisore. 

v(xij) > v(xkl) ⇐⇒ xij > xkl 

I problemi decisionali sono stati classificati in accordo alle conoscenze del 

9

decisore sugli stati della natura. 

Le decisioni sotto stretta incertezza sono quelle per cui il decisore non può 

dire nulla circa il vero stato della natura. 

Non solo egli è ignorante del vero stato, ma non può quantificare la sua incertezza 

in alcun modo. 

Egli può solo dire che ciascun ϑj descrive un possibile stato del mondo e 

ϑ1, ϑ2, . . . , ϑn è una lista esaustiva delle possibilità. 

Come sceglie un decisore sotto stretta incertezza? 

Vediamo alcuni criteri: 

1. WALD’S MAX-MIN RETURN (1950) Con l’azione ai la peggior conseguenza 

possibile per il decisore è: 

si = min vij 

j = 1, . . . , n 

È chiamato livello di sicurezza di ai. 

Se interpretiamo vij come un valore finanziario, si può essere interpretato 

notando che ai garantisce al decisore un ritorno di almeno si. 

Il criterio del max-min ritorno suggerito suggerito da WALD è: scegliere 

l’azione ak: 

è un criterio molto pessimista. 

sk = max {min (vij)} 

i j 

2. HURCHIWICZ-INDICE DI OTTIMISMO/PESSIMISMO 

Definiamo il livello di ottimismo di ai come 

σi = max vij 

j = 1, . . . , n 

cioè il valore della miglior conseguenza che ai può dare. 

Il criterio del max-min ritorno è 

m m n 

σk = max {σi} = max {max (vij)} 

i = 1 i = 1 j = 1 

10

Questo è una critica al criterio pessimista di WALD: perché è più razionale 

essere pessimisti che ottimisti? 

Un vecchio proverbio dice: 

“IT IS BETTER TO BE SAFE THAN SORRY”. 

Il criterio di WALD è più prudente ma “NOTHING VENTURED, NO- 

THING GAINED”. 

HURCHIWICZ (1951) suggerì che poche persone sono così pessimiste 

o così ottimiste come questi estremi possono portare, suggerì così una 

strada di mezzo: sostenne che un decisore dovrebbe scegliere le azioni 

in accordo ad una media pesata dei livelli di sicurezza e di ottimismo 

αsi + (1 − α)σi con 0 ≤ α ≤ 1 

α è l’indice di ottimismo/pessimismo. 

HURCHIWICZ raccomanda per la regola di decisione di scegliere 

n 

ak : αsk + (1 − α)σk = max {αsi + (1 − α)σi} 

i = 1 

3. SAVAGE MIN-MAX REGRET 

Savage (1951) osservò che nell’usare i valori vij per guidare una scelta, 

il decisore confronta il valore della conseguenza di un’azione sotto uno 

stato di natura con i valori di tutte le altre conseguenze qualunque sia 

lo stato di natura. 

Savage definisce il RIMPIANTO di una conseguenza come: 

m 

rij = max {vij} − vij 

i = 1 

cioè è la differenza tra il valore che risulta dalla miglior azione dato ϑj 

e il valore che risulta da ai sempre in ϑj (stato del mondo). 

Ad ogni azione si deve assegnare l’indice 

n 

ρi = max {rij} = massimo rimpianto che deriva dall’azione ai 

j = 1 

11

Allora si deve scegliere un’azione che minimizza ρi cioè scegliere ak: 

m m n 

ρk = min {ρi} = min {max (rij)} 

i = 1 i = 1 j = 1 

4. LAPLACE (1825) osservò che “non sapere nulla circa gli stati della 

natura” è lo stesso che “tutti gli stati hanno uguale probabilità”. 

Se è scelta l’azione ai e tutti gli stati hanno uguale probabilità, allora 

il decisore ha valore atteso da queste conseguenze incerte: 

n 

 

1 

vij 

n 

j=1 

e dovrebbe cercare di massimizzare il suo valore atteso di questa scelta 

cioè scegliere ak: 

n m n 

1 

n vkj = max 

j = 1 i = 1 j = 1 

12 

1 

n vij

T ABLE 1 : ESEMP IO DI MILNOR 

ϑ1 ϑ2 ϑ3 ϑ4 si σi 

a1 2 2 0 1 0 2 5/4 

a2 1 1 1 1 1 1 1 

a3 0 4 0 0 0 4 1 

a4 1 3 0 0 0 3 1 

1 

j ( n )vij 

T ABLE 2 : RIMP IANT I P ER L ′ ESEMP IO DI MILNOR 

Esempio per il calcolo: 

ϑ1 ϑ2 ϑ3 ϑ4 ρi 

a1 0 2 1 0 2 

a2 1 3 0 0 3 

a3 2 0 1 1 2 

a4 1 1 1 1 1 

r22 = max{2, 1, 4, 3} − 1 = 4 − 1 = 3 

13

- CRITERIO DI LAPLACE: a1 

- CRITERIO DI WALD: a2 

- CRITERIO DI HURCHIWICZ: assegna gli indici 

rispettivamente ad 

2(1 − α), 1, 4(1 − α), 3(1 − α) 

a1, a2, a3, a4. 

In quanto αsk + (1 − α)σk = max{αsi + (1 − α)σi} 

0 ≤ α < 1 4(1 − α) > 2(1 − α) 

4(1 − α) > 3(1 − α) 

se α < 3/4 4(1 − α) > 1 

così il criterio di Hurchiwicz sceglie a3 per α < 3/4. 

- CRITERIO DI SAVAGE: a4 

Ogni criterio sceglie un’azione differente. 

SONO TUTTI BUONI CRITERI? 

1.3 Decisioni intertemporali 

Molti problemi decisionali hanno a che vedere con progetti in cui i costi e i 

benefici crescono con un certo numero di anni. 

Consideriamo solo casi in cui i costi e i benefici sono interamente monetari. 

Vediamo ad esempio il flusso di cassa (CASH-FLOW) dato nei 6 progetti 

della tavola seguente: 

14

ANNI A B C D E F 

0 -10 M -10 M -10 M -1 M -16 M -16 M 

1 +5 M +5 M +2 M +0.5 M +16 M +3.2 M 

2 +5 M +5 M +8 M +0.5 M +5 M +19.2 M 

3 0 +5 M +5 M +0.5 M 0 0 

4 0 +5 M +5 M +0.5 M 0 0 

Consideriamo solo 2 tipi di decisione: 

1) ACCETTARE O RIFIUTARE 

2) CLASSIFICARE 

Nel caso 1) ciascun progetto è considerato indipendente da tutti gli altri. 

Nel caso 2) tutti i progetti sono confrontati e classificati con l’intenzione di 

adottare un singolo progetto: il più favorevole. 

È importante includere un progetto nullo che rappresenta lo status quo. 

In questo contesto studieremo solo le decisioni di tipo 2) (“classificare”). 

Discutiamo qui 4 regole decisionali, regole che aiutano il decisore a classificare 

i progetti che coinvolgono costi e benefici temporali. 

La regola più semplice è confrontare progetti tenuto conto del tempo in cui 

chiudono in pareggio cioè tenendo conto del periodo di rimborso. 

Questo viene chiamato PAYBACK-METHOD (o METODO DI RIMBOR- 

SO). 

Lo indicheremo con PM. 

Il progetto A ha un periodo di rimborso di 2 anni, così anche B, C, D. 

15

Il progetto E ha un periodo di rimborso di 1 anno. 

Il progetto F ha un periodo di rimborso di 2 anni. 

Questo metodo considera il progetto E il più favorevole, ma non distingue 

tra i progetti A, B, C, D e F. 

Questo metodo contiene un certo numero di errori, vediamone alcuni: 

i) In nessun conto è tenuto il profitto totale dopo il rimborso (confronta 

A e B). 

ii) In nessun conto è tenuta la misura dell’investimento (confronta B e D). 

iii) In nessun conto è tenuta la distribuzione di entrata e uscita (reddito e 

spesa) confronta B e C. 

iv) Il periodo di rimborso non è chiaramente definito se il progetto coinvolge 

investimenti di più anni. 

ESEMPIO: 

INVESTIMENTI -10 M + 10 M +4 M -4 M +4 M 

ANNI 0 1 2 3 4 

Qual è il periodo di rimborso? 1 anno oppure 3 anni? 

Due parole in favore del metodo di rimborso (PM): 

1. 

È molto semplice da capire e usare. 

2. Minimizzando il periodo di rimborso si minimizza il rischio, infatti, 

essendo il futuro incerto, un decisore dovrebbe minimizzare il tempo in 

cui un investimento è in sospeso. 

Un altro metodo più opportuno di valutare lo “scorrere del tempo” è suggerito 

dal metodo ARR (=ACCOUNTING RATE OF RETURN = STIMA 

DELLA VELOCITÀ DEL GUADAGNO) 

ARR = 

PROFITTO MEDIO × ANNO DI 1 PROGETTO 

SPESA DEL CAPITALE 

16 

× 100%

Allora indicando ARR(A) per calcolare ARR del progetto A, si ottiene: 

ARR(A) = 

(5 + 5 − 10)/2 

10 

× 100% = 0% 

(5 + 5 + 5 + 5 − 10)/4 

ARR(B) = × 100% = 25% 

10 

(2 + 8 + 5 + 5 − 10)/4 

ARR(C) = × 100% = 25% 

10 

(0.5 + 0.5 + 0.5 + 0.5 − 1)/4 

ARR(D) = × 100% = 25% 

1 

(16 + 5 − 16)/2 

ARR(E) = × 100% = 15.6% 

16 

(3.2 + 19.2 − 16)/2 

ARR(F) = × 100% = 20% 

16 

Con questo metodo l’ordine di preferenza dei progetti è il seguente: 

B, C, D sono i migliori 

poi 

F, E, A. 

Diversamente dal metodo di rimborso PM il criterio ARR tiene conto del 

profitto necessario dopo che un progetto chiude in pareggio (esempio B è 

meglio di A). 

Inoltre è sempre ben definito. 

Tuttavia: 

i) non è presa in considerazione la misura dell’investimento (confronta B 

e D); 

ii) non è presa in considerazione la distribuzione dei beni in entrata e in 

uscita (confronta B e C). 

Né il metodo PM né il metodo ARR coinvolgono fattori di sconto. La 

maggior parte di noi preferirebbe avere 100 euro ora piuttosto che 100 euro 

tra un anno cioè in termini economici manifestiamo preferenze temporali sui 

consumi in periodi differenti. 

Supponiamo che 1 euro ora sia equivalente a (1+r) euro r>0 in un anno allora 

1 euro ricevuta in n anni è peggio di (1/(1 + r)) n euro ricevute ora. 

17

Usiamo questa idea per valutare la bontà di un progetto mediante il metodo: 

NPV=NET PRESENT VALUE=VALORE ATTUALE NETTO. 

Allora calcoliamo NPV(A), NPV(B), ecc. 

NPV(A) = −10M + 5 5 

M + M + 0 + 0 

1 + r (1 + r) 2 

NPV(B) = −10M + 5 

M + 

1 + r 

NPV(C) = −10M + 2 

M + 

1 + r 

5 

M + 

(1 + r) 2 

8 

M + 

(1 + r) 2 

5 

M + 

(1 + r) 3 

5 

M + 

(1 + r) 3 

5 

M 

(1 + r) 4 

5 

M 

(1 + r) 4 

NPV(D) = −1M + 0.5 0.5 0.5 0.5 

M + M + M + M 

1 + r (1 + r) 2 (1 + r) 3 (1 + r) 4 

NPV(E) = −16M + 16 5 

M + M + 0 + 0 

1 + r (1 + r) 2 

NPV(F) = −16M + 3.2 19.2 

M + M + 0 + 0 

1 + r (1 + r) 2 

In generale r è noto come TASSO DI SCONTO (=DISCOUNT RATE). 

Ci sono varie controvesie circa il valore numerico da assegnare ad r ma qui 

non ne parleremo, per il nostro problema assumeremo 

Quindi: 

r = 0.1 

NPV(A) = −1.322M 

NPV(B) = 5.850M 

NPV(C) = 5.601M 

NPV(D) = 0.585M 

NPV(E) = 2.678M 

NPV(F) = 2.777M 

Con questo metodo i progetti sono così ordinati come ordine di preferenze: 

18

1 ◦ B 

2 ◦ C 

3 ◦ F 

4 ◦ E 

5 ◦ D 

6 ◦ A 

Questo criterio non è soggetto a nessuna delle quattro critiche che erano state 

fatte per PM. 

Tuttavia ci chiediamo: il metodo NPV tiene conto del fattore r di sconto in 

maniera corretta? 

r è lo stesso ogni anno? 

Stabilire un valore appropriato al fattore di sconto per un particolare problema 

è sempre una questione controversa. 

Un metodo che supera, almeno in parte, questo problema è il criterio decisionale 

IRR=INTERNAL RATE OF RETURN = TASSO DI PROFITTO 

INTERNO. 

IRR è definito essere il valore di r tale che NPV di un progetto è zero. 

Per trovare IRR(A) dobbiamo risolvere 

−10M + 5M 5M 

+ = 0 

(1 + r) (1 + r) 2 

Pongo x = 1/(1 + r) e dividendo per 5M si ha: 

ed essendo x = 1/(1 + r) > 0 si ha 

−2 + x + x 2 = 0 ⇐⇒ x = 1 o x = −2 

1 

1 + r 

= 1 ⇐⇒ r = 0 

19

Allora 

IRR(A) = 0% 

In modo analogo si calcola IRR degli altri 5 progetti: 

IRR(A) = 0% 

IRR(B) = 35% 

IRR(C) = 32% 

IRR(D) = 35% 

IRR(E) = 25% 

IRR(F) = 20% 

Allora i progetti migliori sono B e D e i rimanenti nell’ordine: C, E, F, A. 

Osserviamo che IRR diversamente da NPV tiene conto della misura dell’investimento 

(confronta B e D). 

NPV classifica F sopra E. 

IRR classifica E sopra F. 

Si potrebbe discutere ancora a lungo su questa diversa classificazione (per 

approfondimenti cfr. S. French) ma fermiamoci qui: nessun metodo è completamente 

soddisfacente. . . . 

NPV sembra essere quello con meno inconvenienti ma potremmo discutere 

a lungo sulla sua applicabilità. 

1.4 Preferenze e funzioni di utilità 

Il modo più primitivo per descrivere delle preferenze è una relazione “≤” 

definita su un insieme Ω di esiti. 

Affinché la relazione sia un PREORDINE TOTALE è necessario che: 

∀ a, b, c ∈ Ω 

a ≤ b oppure b ≤ a (TOTALIT À) 

a ≤ b e b ≤ c =⇒ a ≤ c (TRANSITIVIT À) 

(segue la RIFLESSIVITÀ considerando b = a nella formula della totalità). 

20

La transitività è una richiesta razionale. 

La totalità ci assicura che un individuo può sempre esprimere una preferenza 

tra due esiti. 

Perché una persona razionale deve avere preferenze transitive? (ved. es. 

“money-pump”) 

La relazione di indifferenza è definita da: 

La relazione di stretta preferenza da: 

a ≤ b e b ≤ a ⇐⇒ a ∼ b 

a ≤ b e non a ∼ b ⇐⇒ a < b 

Il problema della decisione consiste nel trovare l’esito ω (ω ∈ S ⊂ Ω) che il 

decisore preferisce. 

(Notiamo che tale ω potrebbe non esistere, ad esempio se S è infinito. Esiste 

il numero più grande nell’intervallo (0,1)? Nel nostro contesto evitiamo simili 

casi). 

In molte situazioni può essere difficile esprimere le preferenze allora le funzioni 

di utilità sono l’espediente matematico per semplificare la situazione. 

Una funzione u : Ω −→ R è una funzione di utilità che rappresenta la 

relazione di preferenza “≤” se e solo se 

u(a) ≤ u(b) ⇐⇒ a ≤ b 

allora il problema di trovare il miglior ω ∈ S si riduce al più facile problema 

di trovare un valore di ω ∈ S per cui 

u(ω) = max u(S) 

s ∈ S 

21

PARADOSSO DI S. PIETROBURGO 

Consideriamo la lotteria illustrata in figura 

PREMIO $2 $4 $8 $16 . . . . . . . . . $2 k . . . . . . . . . 

SUCCESSIONE 

DI H TH TTH TTTH . . . . . . . . . T. . . TH . . . . . . . . . 

MONETE 

PROBABILIT À 

1 

2 

1 

4 

1 

8 

1 

16 

T = toss (croce) 

H = head (testa) 

. . . . . . . . . 

Si può realizzare lanciando una moneta ripetutamente finché non mostra 

testa (H). 

La tabella va interpretata così: 

leggendo la 1acolonna: vinco $2 se viene testa (H) al 1o lancio 

e ciò può avvenire con probabilità 1 

leggendo la 2 

2 

acolonna: vinco $4 se viene testa (H) al 2o lancio 

e ciò può avvenire con probabilità 1 

4 

ecc. 

Se la moneta mostra testa (H) al k-simo lancio vinco $2 k . 

Quanto sareste disposti a pagare per partecipare a questa lotteria? 

Supponiamo che ciascun lancio della moneta sia indipendente, le probabilità 

sono calcolate come indicato in tabella. 

Vediamo come esempio il caso k = 4 cioè la probabilità che esca testa al 4 ◦ 

lancio: 

22 

 

1 

2 

k 

. . . . . . . . .

1 

prob(TTTH) = prob(T) · prob(T) · prob(T) · prob(T) = 

2 

Il valore atteso in dollari nella lotteria di S. Pietroburgo è allora: 

ε(L) = 2 prob(H) + 4 prob(TH) + 8 prob(TTH) + · · · = 

2 × 1 1 1 

+ 4 × + 8 × + · · · = 1 + 1 + 1 + · · · = +∞ 

2 4 8 

4 

= 1 

16 

il che significa che il valore atteso in dollari della lotteria è infinito. 

Sareste quindi disposti a spendere il vostro intero patrimonio per comprare 

un biglietto per partecipare alla lotteria? 

Poca gente farebbe così soprattutto dopo aver notato che la probabilità di 

concludere con più di 8$ è solo 1 

8 . 

Non è sufficiente scegliere una lotteria che mi dà il più alto valore atteso in 

dollari per dire di aver fatto una scelta razionale, una teoria che dicesse ciò 

è insufficiente. 

Quindi: per valutare un investimento richiesto, il guadagno atteso non è il 

criterio che la gente adotta, il criterio è L’UTILITÀ ATTESA. 

1.5 Equilibri di Nash 

Definizione 1.2 GIOCO NON COOPERATIVO 

Un gioco non cooperativo a 2 giocatori è una quaterna Γ = (X, Y, f, g) dove 

X, Y sono gli insiemi delle strategie dei due giocatori, f, g sono le funzioni di 

utilità dei due giocatori 

f, g : X × Y −→ R 

Definizione 1.3 EQUILIBRIO DI NASH 

Diremo che una coppia di strategie (x, y) ∈ X × Y è un equilibrio di Nash se 

f(x, y) ≥ f(x, y) ∀ x ∈ X 

g(x, y) ≥ g(x, y) ∀ y ∈ Y 

Riprendiamo alcuni esempi già noti in lezioni precedenti: 

23

Esempio 1.4 MORRA CINESE 

II 

I 

non esistono equilibri di Nash. 

S C F 

S 0 0 -1 1 1 -1 

C 1 -1 0 0 -1 1 

F -1 1 1 -1 0 0 

S = sasso 

C = carta 

F = forbice 

Esempio 1.5 DILEMMA DEL PRIGIONIERO 

II 

I 

C NC 

C -8 -8 0 -10 

NC -10 0 -1 -1 

Due persone sono accusate di aver commesso un grave crimine 

24

• se ambedue confessano subiscono la pena di 8 anni di galera. 

• se non confessano non ci sono prove sufficienti a stabilire chi ha commesso 

il crimine, ma il giudice li condanna per un reato minore: 1 anno 

di galera. 

• se uno confessa la partecipazione di entrambi, per una legge speciale, è 

libero e l’altro è condannato a 10 anni di galera. 

La matrice associata è quella in figura. 

C’è un solo equilibrio di Nash (NE):(CC) (cioè entrambi confessano), ma il 

risultato è insoddisfacente per entrambi perché così faranno 8 anni di galera. 

Se entrambi si mettessero d’accordo di non confessare, farebbero meno anni 

di galera, ma l’accordo è instabile perché se uno sa che l’altro non confessa 

allora gli conviene confessare così sarà libero: è un dilemma. 

L’equilibrio di Nash è l’unica soluzione accettabile però è poco soddisfacente. 

Esempio 1.6 BATTAGLIA DEI SESSI 

❍ 

❍❍❍❍❍ II 

I 

L R 

T 3 1 0 0 

B 0 0 1 3 

esistono due equilibri di Nash: (T,L) e (BR). 

Esempio 1.7 GIOCO A 3 GIOCATORI 

Questo gioco coinvolge 3 giocatori: ciascun giocatore può prendere 1 oppure 

2 monete nella sua mano. 

25

Se ogni giocatore ha un numero differente di monete dagli altri giocatori allora 

egli ottiene un payoff uguale al numero delle monete che ha in mano e 

gli altri non ottengono niente. 

Chiamiamo I, II III i tre giocatori. 

Spazio delle strategie del giocatore I: X = {1, 2} 

dove 1 indica una moneta e 2 indica due monete. 

Y = {1, 2} (spazio delle strategie del giocatore II). 

Z = {1, 2} (spazio delle strategie del giocatore III). 

❍ 

❍❍❍❍❍ II 

I 

j=1 j=2 

i=1 0 0 0 0 2 0 

i=2 2 0 0 0 0 1 

❍ 

❍❍❍❍❍ II 

I 

gli equilibri di Nash sono: 

k = 1 

j=1 j=2 

i=1 0 0 2 1 0 0 

i=2 0 1 0 0 0 0 

k = 2 

(2, 1, 1), (1, 2, 1), (2, 2, 1) 

(1, 1, 2), (1, 2, 2), (2, 1, 2) 

26

ESERCIZI PROPOSTI 

1) Stabilire se esistono equilibri di Nash in strategie pure nel seguente 

gioco a 2 giocatori 

❍ 

❍❍❍❍❍ II 

I 

C D 

A 1 1 1 1 

B 2 2 0 3 

2) stessa domanda nel seguente gioco a 3 giocatori 

dove X = {U, D}, Y = {L, R}, Z = {A, B, C} 

A 

❍ 

❍❍❍❍❍ II 

I 

L R 

U 0 1 3 0 0 0 

D 1 1 1 1 0 0 

❍ 

❍❍❍❍❍ II 

I 

B 

L R 

U 2 2 2 0 0 0 

D 0 0 0 2 2 2 

27

❍ 

❍❍❍❍❍ II 

I 

C 

L R 

U 0 1 0 0 0 0 

D 1 1 0 1 0 3 

ESTENSIONE MISTA DI UN GIOCO 

Sia dato un gioco (che per semplicità di notazione supporremo a 2 giocatori 

e per evitare difficoltà tecniche supporremo AI e AII, spazi delle strategie 

dei due giocatori, finiti) 

G = ({I, II}, AI, AII, uI, uII) 

dicesi ESTENSIONE MISTA DI G il gioco G ∆ così definito 

G ∆ = ({I, II}, ∆(AI), ∆(AII), u ∆ I , u ∆ II) 

dove ∆(Ai) è lo spazio delle distribuzioni di probabilità su Ai. 

Cioè se ad esempio AI = {x1, . . . , xm} 

AII = {y1, . . . , yn} 

allora ∆(AI) = {p ∈ R m , ph ≥ 0 ∀ h e m 

h=1 ph = 1} 

e ∆(AII) = {q ∈ R n , qk ≥ 0 ∀ k e n 

k=1 qk = 1}. 

Risulta u ∆ i l’estensione di ui da AI × AII a ∆(AI) × (∆AII) per bilinearità 

cioè: 

u ∆ i (p, q) = 

m 

h=1 k=1 

n 

phqkui(xh, yk) 

è importante il fatto che: L’ESTENSIONE MISTA DI UN GIOCO FINITO 

HA SEMPRE UN EQUILIBRIO DI NASH (TEOREMA DI NASH 1950) 

(a volte si dice: ogni gioco finito ha equilibrio in strategie miste) 

28

ESEMPIO 

Vediamo nell’esempio della BATTAGLIA DEI SESSI di calcolare gli equilibri 

in strategie miste: 

q 1-q 

p 3 1 0 0 

1-p 0 0 1 3 

p, q ∈ [0, 1] 

Calcoliamo l’utilità attesa del giocatore I 

u ∆ I (p, q) = 3pq + 0 · p(1 − q) + 0 · (1 − p)q + 1 · (1 − p)(1 − q) = 

fissata q, consideriamo 

∂uI(p,q) 

∂p 

3pq + 1 − q − p + pq = 4pq + 1 − p − q 

u ∆ I (p, q) = 4pq + 1 − p − q = p(4q − 1) + 1 − q 

= 4q − 1 

⎧ 

⎪⎨ 

⎪⎩ 

si ottiene così il seguente “grafico” 

> 0 ⇔ q > 1 

4 argmax uI = 1 

p 

= 0 ⇔ q = 1 

4 argmax uI = [0, 1] 

p 

< 0 ⇔ q < 1 

4 argmax uI = 0 

p 

29

q 

1 

¯q= 1 

4 

. 

. . 

0 

. 

◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦◦◦ . 

◦◦◦◦◦◦◦◦◦◦◦◦◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

questo è il grafico della miglior risposta del giocatore I fissata la strategia 

del II; la indico con RI(q). 

Calcoliamo ora l’utilità attesa del giocatore II 

uII(p, q) = 1·pq+0·p(1−q)+0·(1−p)q+3(1−p)(1−q) = pq+3(1−p)(1−q) = 

= pq + 3(1 − q − p + pq) = pq + 3 − 3q − 3p + 3pq = 4pq − 3p − 3q + 3 

uII(p, q) = (4p − 3)q + 3(1 − p) 

cerco q che rende massima uII(p, ·) 

∂uII(p,q) 

∂q 

= 4p − 3 

⎧ 

⎪⎨ 

⎪⎩ 

1 

.. . 

> 0 ⇔ p > 3 

4 ⇒ argmax uII(p, ·) = 1 

q 

= 0 ⇔ p = 3 

4 ⇒ argmax uII(p, ·) = [0, 1] 

q 

< 0 ⇔ p < 3 

4 ⇒ argmax uII(p, ·) = 0 

q 

si ottiene così il “grafico” di RII(p) (cioè la miglior risposta del giocatore II 

fissata la strategia del giocatore I) 

30 

p

q 

1 

. 

. . 

. 

0 ¯p= 1 3 

◦ 

◦◦◦ ◦ ◦ ◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ 

◦ 

4 

da cui sovrapponendo i due “grafici” ridotti otteniamo i due equilibri di Nash 

in strategie miste e cioè 

(p, q) = (0, 0) 

(1, 1) 

 

3 1 

, 

4 4 

(uI(0, 0), uII(0, 0)) = (1, 3) equilibrio in strategie pure 

(uI(1, 1), uII(1, 1)) = (3, 1) equilibrio in strategie pure 

 

uI 

3 1 

, 

4 4 

, uII 

3 1 

, 

4 4 

= 

3 3 

, 

4 4 

e questo è un nuovo equilibrio che trovo in strategie miste. 

ESERCIZIO PROPOSTO: 

Provate a calcolare gli equilibri in strategie miste per il dilemma del prigioniero. 

Definizione 1.8 Un gioco G a due giocatori dicesi a somma zero se 

.. . 

uI(x, y) + uII(x, y) = 0 ∀ x ∈ X, ∀ y ∈ Y 

31 

p

ESERCIZIO: 

Si determinino gli equilibri di Nash in strategie miste del gioco a somma zero 

rappresentato dalla matrice: 

SOLUZIONE ESERCIZIO: 

S D 

A 1 3 

B 4 2 

X = {S, D} spazio delle strategie del I giocatore 

Y = {A, B} spazio delle strategie del II giocatore 

Questo gioco non ha equilibri in strategie pure ma per il Teorema di Nash 

sappiamo che ha almeno un equilibrio in strategie miste. 

Calcoliamo l’utilità attesa da I: 

uI(p, q) = pq · 1 + p(1 − q)3 + (1 − p)q · 4 + (1 − p)(1 − q) · 2 = 

= p(1 − 4q) + 2(q + 1) 

uI(p, q) = p(1 − 4q) + 2(q + 1) 

∂uI(p,q) 

∂p 

= 1 − 4q 

⎧ 

⎪⎨ 

⎪⎩ 

> 0 ⇔ q < 1 

4 ⇒ argmax uI = 1 

p 

= 0 ⇔ q = 1 

4 ⇒ argmax uI = [0, 1] 

p 

< 0 ⇔ q > 1 

4 ⇒ argmax uI = 0 

p 

32

q 

1 

¯q= 1 

4 

. 

. . 

0 

. 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ 

. 

◦ 

◦ 

◦ 

◦ 

uII(p, q) = pq(−1) + p(1 − q)(−3) + (1 − p)q(−4) + (1 − p)(1 − q)(−2) = 

= 4pq − p − 2q − 2 

uII(p, q) = 2q(2p − 1) − (p + 2) 

∂uII(p,q) 

∂q 

= 2(2p − 1) 

⎧ 

⎪⎨ 

⎪⎩ 

1 

. . . 

p 

> 0 ⇔ p > 1 

2 ⇒ argmax uII = 1 

q 

= 0 ⇔ p = 1 

2 ⇒ argmax uII = [0, 1] 

q 

< 0 ⇔ p < 1 

2 ⇒ argmax uII = 0 

q 

33

q 

1 

. 

. . 

. 

0 ¯p= 1 

1 

◦ 

◦ ◦ ◦ ◦ 

◦◦◦ ◦ ◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ 

◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ 

◦ 

2 

Si ottiene così un equilibrio in strategie miste dato da (p, q) = ( 1 1 , 2 4 ) 

 

uI 

 

1 1 

, 

2 4 

, uII 

.. . 

 

1 1 

, 

2 4 

= 

5 

, −5 

2 2 

. 

1.6 Giochi in forma estesa I 

Un qualunque gioco può essere rappresentato sia in forma normale che in 

forma estesa? 

Le due forme sono equivalenti? 

Per rispondere a queste domande classifichiamo i giochi che abbiamo incontrato 

in 4 classi: 

GIOCO STATICO è un gioco in cui i giocatori scelgono contemporaneamente 

le azioni. 

GIOCO A INFORMAZIONE COMPLETA è un gioco in cui la funzione dei 

payoff di ogni giocatore è nota ad ogni giocatore (cioè è conoscenza comune) 

GIOCO DINAMICO è un gioco in cui i giocatori scelgono le azioni in modo 

sequenziale (il 2 ◦ 

osserva cosa fa il 1 ◦ 

e poi decide . . . ) 

GIOCO A INFORMAZIONE PERFETTA è un gioco in cui in corrispondenza 

ad ogni mossa, il giocatore cui spetta muovere è a conoscenza dell’intera 

34 

p

storia fino a quel momento o anche se ogni insieme di informazione contiene 

un solo nodo. 

Osservazione 1.9 Un gioco statico può essere pensato come un gioco dinamico 

ad informazione imperfetta. 

La rappresentazione in forma estesa di un gioco specifica: 

1. i giocatori che prendono parte al gioco 

2. quando i giocatori hanno diritto alla mossa 

3. cosa possono fare i giocatori in ogni circostanza in cui hanno diritto a 

una mossa 

4. cosa conosce ogni giocatore quando gli spetta muovere 

5. i payoff ricevuti da ciascun giocatore in corrispondenza ad ogni combinazione 

di mosse che può essere scelta dai giocatori. 

Esempio 1.10 Gioco a informazione completa e perfetta: 

L ′ 

L 

I 

• 

II II 

• • 

R ′ 

. 

• 

. 

• 

. 

• 

. 

• 

(3,1) (1,2) (2,1) (0,0) 

F ig.1 

35 

R 

L ′ 

R ′

1. il giocatore I sceglie un’azione a1 dall’insieme ammissibile A1 = {L, R} 

2. il giocatore II osserva a1 e poi sceglie un’azione a2 dall’insieme A2 = 

{L ′ 

, R ′ 

} 

3. i payoff sono u1(a1, a2), u2(a1, a2) e sono indicati nell’albero del gioco. 

Questo albero del gioco comincia da un NODO DECISIONALE in cui I decide 

tra L oppure R, se il giocatore I sceglie L, viene raggiunto un nodo 

decisionale dal giocatore II che può scegliere tra L ′ 

e R ′ 

. Analogamente se 

I sceglie R. 

In seguito ad ogni scelta del giocatore II si giunge ad un nodo terminale 

(cioè il gioco finisce) e i payoff indicati sono ricevuti dai giocatori. 

Vogliamo ora rappresentare il gioco in forma normale (o strategica). 

Nel gioco della Fig. 1, il giocatore II ha due azioni e 4 strategie perché ci 

sono 2 diverse circostanze (cioè aver osservato il giocatore I e scegliere L 

oppure aver osservato il giocatore I e scegliere R) in cui II può trovarsi: 

ricordo che la STRATEGIA per un giocatore è un piano completo di azione 

cioè specifica un’azione ammissibile del giocatore per ciascuna circostanza in 

cui il giocatore può essere chiamato ad agire. 

Ritornando alla Fig. 1, cerchiamo di stabilire le strategie del giocatore II: 

Strategia 1: se il giocatore I gioca L allora II gioca L ′ 

, 

se il giocatore I gioca R allora II gioca L ′ 

; 

questa strategia è indicata con (L ′ 

L ′ 

). 

Strategia 2: se il giocatore I gioca L allora II gioca L ′ 

, 

se il giocatore I gioca R allora II gioca R ′ 

Strategia 3: se il giocatore I gioca L allora II gioca R ′ 

, 

se il giocatore I gioca R allora II gioca L ′ 

(R ′ 

Strategia 4: se il giocatore I gioca L allora II gioca R ′ 

, 

se il giocatore I gioca R allora II gioca R ′ 

(L ′ 

(R ′ 

R ′ 

). 

L ′ 

). 

R ′ 

). 

Anche il giocatore I ha 2 azioni ma solo due strategie: giocare L oppure 

36

R (perché ha la prima mossa del gioco) quindi 

A1 = {L, R} 

Il gioco in forma estesa della Fig. 1 ha la seguente rappresentazione strategica: 

❍ 

❍❍❍❍❍ II ′ 

L L 

I 

′ 

L ′ 

R ′ 

R ′ 

L ′ 

R ′ 

R ′ 

L 3 1 3 1 1 2 1 2 

R 2 1 0 0 2 1 0 0 

Fig.2 

Definizione 1.11 Un insieme d’informazione (o insieme informativo) di 

un giocatore è un insieme di nodi decisionali che soddisfano le seguenti condizioni: 

i) in corrispondenza di ogni nodo dell’insieme di informazione, il giocatore 

ha diritto alla mossa. 

ii) quando lo svolgimento del gioco raggiunge un nodo dell’insieme di informazione, 

il giocatore a cui spetta la mossa non sa quale nodo dell’insieme 

di informazione è stato (oppure non è stato) raggiunto. 

37

ESEMPIO 1 

S 

I 

• 

II II 

• • 

l r L R 

. 

• 

vince I 

. 

• 

pari 

. 

• 

vince I 

. 

• 

vince II 

Se tutti gli insiemi di informazione sono “singleton” abbiamo un gioco a 

INFORMAZIONE PERFETTA 

❍ 

❍❍❍❍❍ II 

I 

D 

l L rL lR rR 

S 1 0 1 1 1 0 1 1 

D 1 0 1 0 0 1 0 1 

38

1 

2 

ESEMPIO 2 

I 

• 

II II 

• • 

. 

. 

• 

. 

. 

• 

. 

• 

. 

• 

1 

2 

• • • • 

1 

1 

2 

2 

5 

1 

1 

3 

S 

l r L R 

Le strategie di I sono: S, D, 

le strategie di II sono: lL,lR, rL, rR, 

dove 

lL indica che: II gioca l se I gioca S 

II gioca L se I gioca D 

lR indica che: II gioca l se I gioca S 

II gioca R se I gioca D 

2 

3 

39 

4 

1 

0 

2 

D 

4 

0

❍ 

❍❍❍❍❍ II 

I 

S 

3 

2 

l L lR rL rR 

3 

2 

3 

2 

3 

2 

13 13 1 3 3 

D 0 2 4 0 0 2 4 0 

Infatti se I gioca S e II gioca lL l’utilità attesa dal giocatore I è: 

e l’utilità attesa di II è: 

Se I gioca S e II gioca rL 

eccetera. 

εuI = 1 · 1 1 

+ 2 · 

2 2 

εuII = 1 · 1 1 

+ 2 · 

2 2 

= 3 

2 

= 3 

2 

εuI = 1 2 13 

· 5 + · 4 = 

3 3 3 

εuII = 1 2 

· 1 + · 1 = 1 

3 3 

40 

1

ESERCIZIO. 

Come si rappresenta il “dilemma del prigioniero” con un gioco in forma 

estesa? 

Risoluzione: 

NC 

I 

• 

II II 

•− − − − − − − − − − • 

NC C NC C 

. 

• 

. 

• 

. 

• 

. 

• 

(−1,−1) (−10,0) (0,−10) (−8,−8) 

(confronta Esempio 1.5) 

Ricordo che un gioco statico può essere pensato come un gioco dinamico 

a informazione imperfetta. 

41 

C

QUIZ 

È una buona rappresentazione di un gioco in forma estesa? 

S 

I 

• 

A B 

•− − − − − • 

II − − − − − 

. 

• 

. 

• 

. 

• • 

. 

• 

(1,2) (2,1) (1,3) (0,1) (4,5) 

E la seguente? 

L 

II 

• 

•− − − − − • 

I 

− − − − − 

S D S D 

. 

• 

. 

• 

. 

• 

. 

• 

(1,−1) (−1,1) (1,−1) (−1,1) 

42 

R 

D 

....

TEST 

Che interpretazione puoi dare al seguente “albero”? 

II 

I 

• 

A 

• •. 

(1,2) 

B 

. 

. 

. 

• • 

(2,1) 

• • 

(1,0) (0,1) 

43 

D

QUIZ (QUIZ-MASTER) 

In un popolare quiz televisivo ai concorrenti è data l’opportunità di scegliere 

una fra tre porte. Una porta nasconde un premio, le altre non hanno 

niente. 

La concorrente non ha motivo di pensare che una particolare porta sia privilegiata 

rispetto ad un’altra. 

Il conduttore del gioco (=quiz-master) sa quale porta nasconde il premio. 

Dopo che la concorrente ha scelto provvisoriamente una porta, egli (il quizmaster) 

deve aprire una delle altre porte. 

La concorrente ha allora l’opportunità di cambiare idea circa la porta da 

scegliere. 

Supponiamo che la concorrente desideri rendere massima la probabilità di 

ottenere il premio e che il quiz-master desideri renderla minima. 

a) Descrivi una strategia ottimale del quiz-master e supponi che d’ora in 

poi egli giochi in accordo con questa strategia. 

b) Disegna l’albero del gioco. 

DOMANDE DI P ROBABILIT À 

c) Se la concorrente non cambia mai la sua scelta iniziale spiega perché la 

sua probabilità di vincere prima che il quiz-master apra la porta è 1 

3 . 

Perché la sua probabilità di vincere rimane 1 anche dopo che il quiz- 

3 

master ha aperto la porta? 

Perché una persona ingenua pensa che quest’ultima sia 1 

2 ? 

d) Se la concorrente cambia sempre la sua scelta dopo che il quiz-master 

ha aperto una porta spiega perché la sua probabilità di vincere è 2 

3 . 

Supponi che il quiz-master e la concorrente giocano al meglio. 

Perché una persona ingenua pensa che la probabilità sia 1 

2 ? 

44

1.7 Giochi in forma estesa II 

Data una certa situazione di gioco se ne può costruire una rappresentazione 

più o meno dettagliata a seconda degli scopi. 

Le regole del gioco devono specificare: 

1. chi sono i giocatori 

2. quando spetta muovere a ciascuno di loro 

3. quali sono le alternative tra le quali ciascun giocatore può scegliere 

4. di quali informazioni egli dispone a ciascuno dei turni che gli spettano 

5. quali sono gli esiti possibili del gioco 

6. l’utilità che ciascun giocatore consegue in ciascun esito 

Il gioco si può pensare definito quando sono specificate le sue regole. 

La struttura formale che consente una rappresentazione del gioco che comprende 

gli aspetti suddetti è 

L ′ ALBERO DEL GIOCO 

Un albero è un grafo orientato connesso, senza cicli. 

45

. 

. 

• 

•. 

ESEMPI: 

• • 

. . 

. 

........................................................................................................................................................................... 

. 

. . 

• 

• . 

• 

. ........................................................................................................................................................................... 

. 

. . 

• • 

• 

. . 

. 

• • 

a) b) c) 

grafo orientato grafo orientato grafo orientato 

sconnesso connesso connesso 

senza cicli con un ciclo 

Un grafo orientato è un insieme Y i cui elementi sono detti nodi e rappresentati 

come punti e una relazione R su Y , i cui elementi, coppie ordinate 

di nodi, sono detti archi e rappresentati come frecce (scriveremo x −→ y) 

invece di xRy. 

Le frecce hanno la coda nel primo nodo dell’arco (che viene detto predecessore) 

e la punta nel secondo nodo dell’arco (che viene detto successore del 

primo). 

Un grafo orientato dicesi albero se ha le seguenti proprietà: 

1) ogni nodo riceve una freccia da al massimo un altro nodo (ogni nodo 

ha al massimo un predecessore) 

2) dati due nodi distinti qualsiasi, esiste una successione finita di archi 

adiacenti (ossia, con un nodo comune, ma non necessariamente orientati 

nella stessa direzione) detta percorso che li collega (connessione del 

grafo) 

3) vi sono nodi, detti nodi iniziali o radici dell’albero, non raggiunti da 

alcuna freccia: che non hanno cioè predecessori immediati (esistenza 

delle radici) 

46 

..

• 

. 

. 

• 

. . . 

• 

. 

• 

Diciamo che nel grafo orientato Y vi è un ciclo se per qualche x ∈ Y vi è un 

percorso (x −→ y −→ . . . −→ x) che collega x a se stesso. 

• 

• • 

........................................................................................................................................................................... 

. . 

. . 

. 

• 

. 

. 

. 

. 

d) e) f) 

• 

• 

. . 

. 

• • 

No 1) No 2) No 3) 

Si 2) Si 1) Si 1) 

Si 3) Si 3) Si 2) 

•. 

• • 

. 

. . 

. 

. 

. . 

• 

• . 

• 

. 

. 

. . 

. 

• • 

. 

• • 

a) b) c) 

47 

.. 

.. 

• 

. .

a) b) c) 

No 1) No 1) Si 1) 

No 2) Si 2) Si 2) 

Si 3) Si 3) Si 3) 

Si dimostra facilmente che se un grafo orientato verifica le 3 condizioni dette, 

se cioè è un albero, allora: 

i) è privo di cicli 

ii) ha un’unica radice 

iii) ha nodi terminali (cioè privi di successori immediati) 

I nodi terminali rappresentano cioè gli esiti del gioco cioè le possibili conclusioni 

di una partita, sono rappresentati dai vettori payoff o vettori vincita. 

Sia X l’insieme dei nodi non terminali dell’albero. 

Ciascun nodo non terminale è indicato non solo col suo nome (indice del 

nodo) ma anche con il nome del giocatore al quale è assegnato (indice del 

giocatore). 

Ogni nodo spetta ad un solo giocatore. 

Ogni nodo rappresenta una ben definita fase del gioco cioè una situazione in 

cui, ad un dato giocatore, spetta scegliere tra le diverse alternative. 

Esiste una corrispondenza biunivoca tra le azioni possibili di un certo nodo 

(per il giocatore cui è assegnato questo nodo) e i successori immediati di quel 

nodo. 

48

Giochi ad informazione perfetta 

Un albero con l’assegnazione dei vettori vincita ai nodi terminali, con l’assegnazione 

dei nodi non terminali ai vari giocatori costituisce una risposta ai 

requisiti richiesti e perciò dicesi gioco in forma estesa. 

Cosideriamo i due giochi G1 e G2 

. 

U 

•. . 

• 

a 

(0,2) 

I 

x 

• 

G1 

. 

. . 

. 

• • 

b 

(1,1) 

E 

. . 

S R 

. . 

c 

(−1,−1) 

Il nodo iniziale x è assegnato al giocatore I. 

a, b, c sono gli esiti. 

In G1 il giocatore II, se chiamato a giocare, sa che I ha scelto E e non U, 

infatti se I sceglie U, la partita non raggiungerebbe mai il nodo y e quindi 

II non avrebbe mai la mossa. 

49

Quando un gioco è strutturato in modo che, a ciascun suo turno, ogni giocatore 

è al corrente delle azioni che hanno condotto ad esso, il gioco dicesi ad 

informazione perfetta. 

Consideriamo ora un gioco ad informazione imperfetta: 

. 

. 

U 

I 

x 

• 

•− − − − − − • 

z y 

II . 

− − − − 

S R S R 

. . 

• 

. 

• 

. . 

• 

. 

• 

(0,2) (0,2) (1,1) (−1,−1) 

. . 

G2 

L’insieme di informazione è un insieme di nodi con lo stesso indice di giocatori 

tra i quali per ipotesi (in G2 il giocatore II) non è in grado di distinguere. 

II non è in grado di distinguere tra y e z e per indicare questo fatto, i due 

nodi sono congiunti da un segmento tratteggiato. 

50 

. 

E 

. . 

. .................

Abbiamo già visto che una rappresentazione più sintetica dei giochi è la 

forma strategica (o forma normale del gioco). 

Dato in gioco in forma normale esiste sempre almeno un gioco in forma 

estesa che abbia quella come forma normale: si tratta di un gioco a mosse 

simultanee (quindi ad informazione imperfetta) in cui ciascuno sceglie un’azione 

(un elemento dell’insieme delle strategie) assegnato ad ogni giocatore 

in forma normale contemporaneamente agli altri e perciò a loro insaputa. 

Abbiamo così un gioco in forma estesa ad informazione imperfetta. 

51

.... 

ESEMPI 

. 

U 

I 

• 

•− − − − − − • 

II . 

− − − − 

. . 

• 

. 

• 

. . 

• 

. 

• 

(0,2) (0,2) (1,1) (−1,−1) 

. . 

G2 

Corrisponde al gioco in forma normale: 

❍ 

❍❍❍❍❍ II 

I 

...... 

E 

S R 

U 0 2 0 2 

E 1 1 -1 -1 

G2n 

52 

. . 

. ...............

. 

Ma anche invertendo l’ordine in cui i giocatori eseguono le loro scelte come in 

S 

II 

• 

•−. − − − − − − − − − • 

................. 

U E U E 

. . 

• 

. 

• 

. . 

• 

. 

• 

(0,2) (1,1) (0,2) (−1,−1) 

. . 

. 

G ′ 

2 

è un gioco in forma estesa, la cui forma normale è G2n. 

Questo non deve stupire: ciò che è importante sono le informazioni in possesso 

di ciascun giocatore, all’atto di decidere un’azione non la cronologia delle 

mosse. 

53 

R 

. . 

. .................

Tuttavia anche G1: 

. 

I 

• 

•. . 

• 

(0,2) 

U 

. 

E 

. . 

S R 

. . 

. 

• • 

(1,1) (−1,−1) 

ha forma normale G2n e questo è sconcertante! 

Perché G1 a differenza di G2 e G ′ 

2 è ad informazione perfetta. 

Vi è una perdita di informazione nel passaggio dalla forma estesa alla forma 

normale del gioco? 

Vedremo in seguito che per l’analisi della soluzione di certi giochi in forma 

estesa, che richiede possibili deviazioni dalla soluzione di equilibrio è necessaria 

l’intera forma del gioco. 

54 

. .................

1.8 Raffinamenti degli equilibri di Nash 

Il problema di raffinare o perfezionare gli equilibri di Nash si pone per giungere 

ad una più soddisfacente nozione di soluzione di un gioco non cooperativo. 

L’argomento è affascinante e complesso perché all’inizio si cercava il raffinamento 

“giusto” successivamente si è visto che di criteri di raffinamento ve ne 

sono svariati e che i raffinamenti giusti non ci sono, ma la scelta dei raffinamenti 

dipende da numerosi elementi del contesto. 

Perfezione nei sottogiochi 

Il più noto dei raffinamenti è l’equilibrio perfetto nei sottogiochi. 

Consideriamo il gioco 

. 

U 

I 

x 

• 

•. . 

• 

y 

(0,2) 

G1 

55 

. 

E 

. ................. 

II 

S R 

. . 

. 

• • 

(1,1) (−1,−1) 

. .................

❍ 

❍❍❍❍❍ II 

I 

R S 

U 0 2 0 2 

E -1 -1 1 1 

G1n 

Come è evidente dalla forma normale il gioco ha due equilibri di Nash: 

(U, R) ed (E, S) (efficienti nel senso di Pareto). 

Vediamo perché il profilo di strategia (U, R) è un equilibrio di Nash. 

Se II adotta R a I conviene scegliere U. 

D’altra parte se I sceglie U, II non sarà chiamato a muovere e la sua vincita 

non dipenderà dalla strategia che adotta. 

Infatti le strategie di II si traducono in azioni solo se I sceglie E. 

Notiamo che la scelta di R mentre è indifferente per II se I sceglie U è determinante 

per indurre I a scegliere U. 

Tuttavia questo profilo di strategie (un equilibrio “buono”) è alquanto sospetto. 

Supponiamo che costituisca un accordo non vincolante tra I e II. 

A I non conviene osservarlo. 

Se I scegliesse E invece di U, in modo che II fosse chiamato a muovere, II 

sceglierebbe ovviamente l’alternativa per lui più vantaggiosa quindi sceglierebbe 

S, questo sarebbe nell’interesse di I che quindi violerebbe l’accordo. 

Quindi (U, R) può essere interpretato come equilibrio di minaccia in cui II 

ottiene 2 (invece di 1) minacciando I di portarlo alla rovina se I non decide 

U. 

Ma la minaccia non è credibile perché adottando la strategia R, II danneggia 

anche se stesso. 

Questo è chiaro anche a I che perciò procederà a scegliere E. 

Perciò l’equilibrio (U, R) non è ad attuazione spontanea (self-enforcing). 

56

Se II potesse impegnarsi a scegliere R, allora gli converrebbe farlo, ma non 

ci sono accordi vincolanti. 

L’equilibrio (E, S) ha invece qualcosa di più convincente di (U, R). 

Osserviamo che la parte dell’albero che inizia dal nodo y è esso stesso un 

gioco, quello in cui un solo giocatore è chiamato a muovere. 

Tale gioco dicesi sottogioco di G1. 

Precisiamo la definizione di sottogioco: 

dato un gioco in forma estesa G ed un nodo di G y, un sottoinsieme di nodi 

di G, chiamiamolo G ′ 

, dicesi sottogioco proprio di G con radice in y se: 

1) y e tutti i successori in G stanno in G ′ 

. 

2) y è l’unico elemento dell’insieme di informazioni a cui, in G, y appartiene. 

3) per ogni successore di y, z; se h(z) è l’insieme di informazioni a cui z 

appartiene in G e se w sta in h(z) allora anche w è un successore di y 

cioè anche w sta in G ′ 

. 

Nel nostro esempio (E, S) è un equilibrio perfetto nei sottogiochi, (U, R) no; 

quindi può essere scartato come soluzione del gioco. 

In generale, un equilibrio di Nash s = (x ∗ , y ∗ ) di G dicesi perfetto nei sot- 

togiochi se per pgni sottogioco proprio G ′ 

di G il NE s prescrive ad ogni 

giocatore delle azioni che sono un NE in G ′ 

. 

Si può dimostrare che ogni gioco in forma estesa e finito ammette un equilibrio 

perfetto nei sottogiochi. 

57

S 

I 

• 

II 

• •. 

(2,3) 

L 

D 

I 

•− − − − − − − − − − • 

A B A B 

. 

• 

. 

• 

. 

• 

. 

• 

(3,2) (1,0) (0,0) (1,1) 

G2 

58 

R

❍ 

❍❍❍❍❍ II 

I 

L R 

SA 2 3 2 3 

SB 2 3 2 3 

DA 3 2 0 0 

DB 1 0 1 1 

G2n 

NE: (SA, R) (SB, R) (DA, L) 

non perfetto perfetto perfetto 

nei sottogiochi nei sottogiochi nei sottogiochi 

(efficienti nel senso di Pareto) 

non è quindi garantita l’unicità dell’equilibrio perfetto nei sottogiochi 

59

Equilibri perfetti nei sottogiochi 

Esempio: dato il gioco in forma estesa 

I 

• 

. 

II . 

•. . 

. • 

(1,2) 

T 

G0 

si scriva la forma strategica o normale del gioco 

60 

. 

B 

L R 

. . 

. 

• • 

(0,0) (2,1) 

. .

❍ 

❍❍❍❍❍ II 

I 

L R 

T 1 2 1 2 

B 0 0 2 1 

NE: (T, L) (B, R) 

guardando la forma estesa possiamo dire che (T, L) non è credibile nel senso 

che è basato su una minaccia vuota di II nei confronti di I (B, R) è un equilibrio 

perfetto nei sottogiochi ed è anche quello che si ottiene per induzione 

a ritroso. 

Infatti ogni soluzione per induzione a ritroso di un gioco in forma estesa G, 

è un equilibrio perfetto nei sottogiochi di G. 

1.9 Esempi di giochi con strategie dominate 

Esempio 1.12 

L MII R 

U 4 3 5 1 6 2 

MI 2 1 8 4 3 6 

D 3 0 9 6 2 8 

C’è un modo ovvio di predire come il gioco descritto può essere giocato? 

61

Fissiamo la nostra attenzione su II. 

La strategia R dà al giocatore II un payoff strettamente migliore del payoff 

dato da MII. 

MII è strettamente dominata da R. 

Se il giocatore I sa che II non gioca MII allora per I la miglior scelta è U. 

Infine se il giocatore II sa che I sa che II non giocherà MII allora II sa che 

I giocherà U e così II giocherà L. 

Otteniamo (U, L) che è l’unico equilibrio di Nash. 

Questo processo dicesi dominanza stretta ... (non dipende dall’ordine in cui 

le strategie sono considerate). 

Esempio 1.13 

❍ 

❍❍❍❍❍ II 

I 

M non è dominata da U. 

M non è dominata da D. 

Tuttavia: 

se I gioca U con probabilità 1/2 

se I gioca D con probabilità 1/2 

L R 

U 2 0 -1 0 

M 0 0 0 0 

D -1 0 2 0 

allora I si garantisce un’utilità attesa fI = 1 

2 

> 0 quindi supera il payoff o 

che avrebbe giocando M (indifferentemente da come gioca II). 

Allora una strategia pura può essere strettamente dominata da una strategia 

mista anche se non è strettamente dominata da ogni strategia pura. 

62

Esempio 1.14 

❍ 

❍❍❍❍❍ II 

I 

L R 

U 1 3 -2 0 

M -2 0 1 3 

D 0 1 0 1 

U ed M non sono strettamente dominate. 

Eppure: 

se I gioca U con probabilità 1/2 

se I gioca D con probabilità 1/2 

ottiene un’utilità attesa − 1 

2 

< 0 comunque giochi II e così ottiene un payoff 

peggiore di quello che otterrebbe giocando D eppure né U né M sono dominate. 

Allora una strategia mista che assegna probabilità positiva ad una strategia 

dominata è dominata tuttavia una strategia mista può essere strettamente 

dominata anche se assegna probabilità solo alle strategie pure che non sono 

debolmente dominate. 

Esempio 1.15 Common knowledge 

L R 

U 8 10 -100 9 

D 7 6 6 5 

63

Quando un gioco si può giocare mediante eliminazione di strategie dominate, 

nel senso che a ciascun giocatore rimane solo una strategia, allora questo 

profilo di strategia è il candidato ovvio per predire come sarà giocato il gioco. 

Non è però sempre così, specialmente quando i payoff possono assumere valori 

molto alti o molto piccoli. 

La maggior parte degli studenti a cui è stato chiesto come avrebbero giocato 

questo gioco, ha risposto D come strategia per I sebbene la dominanza iterata 

dia (U, L) come unica soluzione. 

Infatti sebbene U è meglio di D quando II non usa la strategia dominata R, 

D è meglio di U quando c’è una possibilità che II giochi R. 

Se la perdita (U, R) è meno grave, ad esempio sostituendo -100 con -1 allora 

quasi tutti i giocatori I preferiscono U. 

Questo esempio illustra il fatto fondamentale che i payoff e gli spazi delle 

strategie siano conoscenza comune e la razionalità nel senso di 

non giocare una strategia strettamente dominata 

è conoscenza comune 

(come apparentemente non sembrava vero in quest’esempio). 

Esempio 1.16 

L R 

U 1 3 4 1 

D 0 2 3 4 

Per I: U domina D U ≻ D. 

64

L’iterazione delle strategie predice (U, L) come soluzione. 

Può essere di aiuto per il giocatore I cambiare i payoff aggiungendo -2 ad U? 

D ≻ U 

Ora l’iterazione predice (D, R). 

L R 

U -1 3 2 1 

D 0 2 3 4 

1.10 Evasione fiscale (Li-Calzi) 

Il governo italiano desidera ridurre l’evasione fiscale che è un fenomeno molto 

diffuso perché purtroppo, se la possibilità di essere scoperti è sufficientemente 

bassa, molti contribuenti sono disposti a correre il rischio di una multa nella 

speranza di non dover pagare le tasse. 

Supponiamo che il Parlamento abbia approvato una legge che consente alla 

guardia di finanza di punire solo un evasore per ogni anno fiscale. 

La guardia di finanza annuncia che esaminerà le dichiarazioni dei redditi dell’anno 

successivo in ordine alfabetico incominciando da A. 

Se questo ha evaso dovrà pagare 10 volte la tassa dovuta altrimenti la guardia 

di finanza passerà ad esaminare il successivo e così via. 

a) Si disegni l’albero del gioco per questa situazione supponendo che il 

gioco abbia informazione perfetta e vi siano solo 3 contribuenti: Primo, 

Secondo e Terzo (già in ordine alfabetico). 

65

Indichiamo con: E la strategia di evadere. 

T la strategia di pagare subito le tasse. 

Supponiamo per semplicità che le tasse da pagare siano le stesse per 

ciascun giocatore. 

I payoff sono: P (quando si pagano le tasse). 

P + M (quando l’evasione è scoperta e bisogna pagare 

anche la multa). 

S (se l’evasione ha successo). 

b) Utilizzando l’induzione a ritroso, si dimostri che nel gioco dell’evasione 

fiscale, la strategia di non evadere le tasse è ottimale per ciascun giocatore. 

c) Si forniscano alcune ragioni per le quali questa soluzione al problema 

dell’evasione fiscale non è realistica. 

Indichiamo con X, Y, Z lo spazio delle strategie rispettivamente dei giocatori 

I, II, III: 

X = {E, T } 

Y = {EE, ET, T E, T T } cioè D r 2,2 = 2 2 

dova la prima lettera indica cosa fa il giocatore II se I sceglie E e la seconda 

lettera indica cosa fa il giocatore II se I sceglie T . Ad esempio: 

ET significa: II sceglie E se I sceglie E. 

sceglie T se I sceglie T . 

T T significa: II sceglie T se I sceglie E. 

sceglie T se I sceglie T . 

Z = {EEEE, T EEE, T T EE, . . . } sono D r 2,4 = 2 4 . 

Ad esempio 

T T EE significa: III sceglie T se è in c 

sceglie T se è in d 

66

sceglie E se è in e 

sceglie E se è in f 

(c, d, e, f sono i nodi in cui può trovarsi III). 

a) ALBERO DEL GIOCO 

E 

I 

• 

a 

b 

• II 

II • 

E T E T 

. 

. c • III d . 

. 

• III . 

. e • III f 

. 

. 

• III 

E T E T E T E T 

• • • • • • • • 

(P +M,S,S) (P +M,S,P )(P +M,P,S) (P +M,P,P ) (P,P +M,P ) (P,P,P ) 

(completate i payoff) 

67 

T

) Supponiamo che per ciascun giocatore 

S ≻ P ≻ P + M 

III preferisce T se I e II hanno usato T 

E altrimenti. 

II preferisce T se I ha usato T 

cm E altrimenti. 

I preferisce T sempre. 

Ne segue che I paga (T ) inducendo anche II e III a pagare le tasse. 

c) Dite voi. . . 

1.11 Giochi con potenziale 

Esempio 1.17 Duopolio di quasi-Cournot-gioco con potenziale esatto 

Consideriamo la funzione inversa di domanda lineare 

F (Q) = a − bQ a, b > 0 

c1 = c1(x), c2 = c2(y) funzioni arbitrarie. 

Allora i profitti delle due imprese sono: 

π1(x, y) = xF (x + y) − c1(x) 

π2(x, y) = yF (x + y) − c2(y) 

Allora una funzione potenziale esatto è: 

infatti 

P ∗ (x, y) = a(x + y) − b(x + y) 2 − bxy − c1(x) − c2(y) 

f(x, y) − f(t, y) = P ∗ (x, y) − P ∗ (t, y) ∀ t, ∀ x, y 

g(x, y) − g(x, z) = P ∗ (x, y) − P ∗ (x, z) ∀ z, ∀ x, y 

68

o equivalentemente se f, g sono differenziabili 

∂f 

∂x 

∂g 

∂y 

∗ ∂P 

= 

∂x 

∗ ∂P 

= 

∂y 

Esempio 1.18 Gioco di duopolio di Cournot-gioco con potenziale ordinale 

I profitti delle due imprese sono: 

c1(x) = cx, c ∈ R 

c2(y) = cy 

Q = x + y 

π1(x, y) = xF (x + y) − cx 

π2(x, y) = yF (x + y) − cy 

F (Q) > 0 funzione inversa di domanda 

(non sono necessarie ipotesi di monotonia, continuità, differenziabilità). 

La funzione 

P (x, y) = xy(F (x, y) − c) 

P : R+ × R+ −→ R 

è una funzione potenziale ordinale per il gioco, infatti 

69

π1(x, y) − π1(t, y) > 0 ⇐⇒ P (x, y) − P (t, y) > 0 

π2(x, y) − π2(x, z) > 0 ⇐⇒ P (x, y) − P (x, z) > 0 

Definizione 1.19 (ε, k) equilibri 

∀ x, y, z, t ∈ R+ 

Sia ε > 0, k ∈ R. 

Una strategia x del giocatore I è una ε-miglior risposta a y se 

(1) 

e analogamente per II. 

f(x, y) ≥ sup f(t, y) − ε 

t 

x è una risposta che garantisce k se 

(2) f(x, y) ≥ k 

e analogamente per II g(x, y) ≥ k. 

(3) x è una (ε, k) miglior risposta se è vera (1) oppure (2) fissata y. 

Analogamente (x, y) è un (ε, k) equilibrio se x è una (ε, k) miglior risposta a 

y e viceversa. 

Vale il seguente teorema: 

Teorema 1.20 (Lucchetti-Patrone-Tijs ’86) Se G è un gioco con potenziale 

(esatto, ordinale, generalizzato) e tutti gli spazi delle strategie sono 

finiti tranne uno allora G ha almeno un (ε, k) equilibrio ∀ ε > 0 e ∀ k ∈ R. 

Osservazione 1.21 Se ci sono due spazi di strategie infinite allora il teorema 

non vale. 

Esempio 1.22 G = (N, N, f, g) 

f(i, j) = i − j 

70

g(i, j) = j − i 

f + g = 0 

Dimostriamo che ∃ (ε, k) equilibri. 

Un potenziale esatto è P (i, j) = i + j ∀ i, j ∈ N. 

∃ NE 

∃ ε-equilibri perché sup f = +∞ 

∃ (ε, k)-equilibri perché k > 0 (i − j ≥ k, j − i ≥ k). 

1.12 Giochi di contrattazione 

Possiamo supporre che due o più individui agiscano insieme con un proposito 

comune: ogni individuo ha (separatamente) la sua funzione di utilità e 

insieme devono creare qualcosa di completamente nuovo cioè una collezione 

di funzioni di utilità per determinare il comportamento comune. 

Nash nel 1951 suggerì che la cooperazione tra giocatori può essere studiata 

usando alcuni concetti basilari degli equilibri di Nash. 

Egli diede una lista di assiomi che i payoff dovrebbero soddisfare per un 

problema astratto di bargaining e dimostrò che solo una coppia di payoff 

verifica tali assiomi ed è detta soluzione di contrattazione di Nash. 

Matematicamente un problema di contrattazione è semplicemente una coppia 

(F, v) dove F rappresenta l’insieme delle coppie di payoff ammissibili e v 

rappresenta il punto di disaccordo. 

71

CONTRATTAZIONE A DUE PERSONE 

Definiamo un problema di contrattazione a due giocatori come una coppia 

(F, v) dove F è un sottoinsieme chiuso e convesso di R 2 , 

v = (v1, v2) è un vettore di R 2 e l’insieme 

F ∩ {(x1, x2) : x1 ≥ v1, x2 ≥ v2} è non vuoto e limitato. 

F rappresenta l’insieme dei payoff di allocazione ammissibili o insieme ammissibile 

e v rappresenta il payoff di allocazione di distacco. 

F convesso perché i giocatori possono mettersi d’accordo per giocare strategie 

a random così se le allocazioni di utilità x = (x1, x2) e y = (y1, y2) sono 

amissibili e θ ∈ [0, 1] allora l’allocazione utilità attesa θx + (1 − θ)y può essere 

raggiunta programmando di realizzare x con probabilità θ e y altrimenti. 

La chiusura di F è una naturale richiesta topologica. 

La condizione di non vuotezza e non limitatezza asseriscono che alcune allocazioni 

realizzabili sono buone almeno come il disaccordo ma i guadagni non 

limitati sopra il punto di disaccordo non sono possibili. 

Diciamo che un problema di contrattazione (F, v) è essenziale se e solo se 

esiste almeno una allocazione y in F che è strettamente migliore (per entrambi 

i giocatori) dell’allocazione di disaccordo v (cioè y1 > v1, y2 > v2). 

Interpretiamo queste strutture nel contesto di un gioco in forma strategica a 

due giocatori: 

G = { {1, 2}, C1, C2, u1, u2} 

per determinare il punto di disaccordo v ci sono varie possibilità. 

Noi preferiamo in max-min cioè: 

v1 = max min u1(σ1, σ2) 

σ1 ∈ ∆(c1) σ2 ∈ ∆(c2) 

72

v2 = max min u2(σ1, σ2) 

σ2 ∈ ∆(c2) σ1 ∈ ∆(c1) 

Per ogni problema di contrattazione a due persone (F, v) possiamo associare 

un vettore di allocazione φ(F, v) che rappresenta un risultato di negoziazione 

in una situazione in cui F è l’insieme di tutte le allocazioni realizzabili e v è 

l’allocazione di disaccordo. 

Nash si avvicinò a questo problema in modo assiomatico: poniamo 

φ(F, v) = (φ1(F, v), φ2(F, v)) 

così per ogni vettore x, y ∈ R 2 possiamo scrivere: 

x ≥ y ⇐⇒ x1 ≥ y1 e x2 ≥ y2 

e 

x > y ⇐⇒ x1 > y1 e x2 > y2 

Assiomi richiesti per un problema di contrattazione: 

ASSIOMA 1 (EFFICIENZA FORTE) 

φ(F, v) ∈ F e ∀ x ∈ F se x ≥ φ(F, v) =⇒ x = φ(F, v) 

cioè la soluzione per ogni gioco di contrattazione a due persone è pareto efficiente 

cioè non esiste nessun’altra allocazione raggiungibile migliore di questa soluzione 

per un giocatore e non peggiore di questa per l’altro. 

In generale: dato un insieme ammissibile F , 

• diciamo che un punto x è fortemente pareto efficiente se e solo se 

∃ y ∈ F : y ≥ x e yi > xi per almeno un giocatore i 

• diciamo che un punto x è debolmente pareto efficiente se e solo se 

∃ y ∈ F : y > x 

73

cioè 

ASSIOMA 2 (RAZIONALITÀ INDIVIDUALE) 

φ(F, v) ≥ v 

φ1(F, v) ≥ v1 φ2(F, v) ≥ v2 

cioè nessun giocatore con la soluzione bargaining può guadagnare di meno di 

quanto otterrebbe nel disaccordo. 

ASSIOMA 3 (SCALA COVARIANTE) 

∀ λ1, λ2, γ1, γ2 ∈ R, λ1 > 0, λ2 > 0 

se G = {(λ1x1 + γ1, λ2x2 + γ2) : (x1, x2) ∈ F } 

e w = {(λ1u1 + γ1, λ2u2 + γ2)} 

allora φ(G, w) = {(λ1φ1(F, v) + γ1, λ2φ2(F, v) + γ2)} 

cioè se un gioco bargaining a due giocatori (G, w) può essere ottenuto da 

un altro gioco bargaining (F, v) incrementando le funzioni di utilità che non 

influenzano nessuna decisione allora la soluzione di (G, w) è ottenibile dalla 

soluzione di (F, v) con le stesse trasformazioni. 

ASSIOMA 4 (INDIPENDENZA DELLE ALTERNATIVE IRRILEVANTI) 

∀ G insieme chiuso e convesso 

se G ⊆ F e φ(F, v) ∈ G 

allora φ(G, v) = φ(F, v) 

74

cioè eliminando le alternative ammissibili (a parte il disaccordo) che non sarebbero 

state scelte non cambia la soluzione. 

Ad esempio: 

due persone scelgono un piatto in un ristorante. Il menù offre: 

• pesce al cartoccio 

• pollo e patatine 

• uova con prosciutto 

Dopo lunga discussione scelgono “pollo e patatine”. Il cameriere dice che 

uova con prosciutto non è disponibile. E allora? 

Allora se questo porta i due tizi a cambiare la loro scelta, essi violano 

l’assioma delle alternative irrilevanti. 

L’idea è che la scelta tra “pollo e patatine” e “pesce al cartoccio” dovrebbe 

essere indipendente dalla disponibilità o meno del piatto “uova con prosciutto”. 

ASSIOMA 5 (SIMMETRIA) 

Se v1 ≡ v2 e {(x1, x2) : (x1, x2) ∈ F } = F 

allora φ1(F, v) = φ2(F, v) 

cioè se le posizioni dei giocatori 1 e 2 sono completamente simmetriche nel 

problema di contrattazione, allora anche la soluzione li tratta simmetricamente. 

Il risultato importante dovuto a Nash è che esiste una ed una sola soluzione 

del problema di contrattazione (Nash bargaining solution) che verifica gli 

assiomi detti: 

75

Teorema 1.23 ∃! soluzione φ(·, ·) che verifica gli assiomi 1 . . . 5. 

Questa soluzione per ogni problema di contrattazione a due giocatori verifica: 

φ(F, v) = argmax (x1 − v1)(x2 − v2) 

x ∈ F 

x ≥ v 

Esempio 1.24 NEL DILEMMA DEL PRIGIONIERO 

C D 

A 1 1 5 0 

B 0 5 3 3 

Nash equilibrium: (A, C) non efficiente. 

Se il gioco diventa di contrattazione i due giocatori ottengono l’equilibrio 

efficiente: 

76

. 

. 

. 

. 

. 

q 

(0,5) 

. . 

..... 

1 

. 

. 

0 1 

Punto di disaccordo: (1, 1). 

. 

Soluzione di Nash del bargaining: (3, 3). 

◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦ 

. 

FRONTIERA PARETO EFFICIENTE 

. 

. 

. 

. 

. 

. 

. 

. . . . . . . 

. 

◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦ (3,3) 

. 

. 

. 

. 

. 

. 

. 

. 

. 

. 

. 

. 

1.13 Corsa agli sportelli (gioco a due stadi) 

. 

Due persone vogliono investire i loro depositi D in una banca. 

La banca investe tali depositi in un progetto a lungo termine. 

Se la banca è obbligata a liquidare l’investimento prima che il progetto maturi 

. 

77 

(5,0) 

p 

.. .

potrà recuperare una quantità 2r, dove 

D > r > D 

2 

2D > 2r > D 

Se la banca lascia che l’investimento raggiunga la maturità allora il progetto 

pagherà un totale di 2R con R > D. 

Ci sono due date in cui gli investitori possono fare prelievi dalle banche: 

data 1 è prima che gli investimenti maturino 

data 2 dopo. 

Supponiamo per semplicità che non ci siano fattori di sconto. 

Se entrambi gli investitori fanno dei prelievi alla data 1 allora ciascuno riceve 

r e il gioco finisce. 

Se solo un investitore fa un prelievo alla data 1 allora quell’investitore riceve 

D e l’altro riceve 2r − D (2r − D < D) e il gioco finisce. 

Se nessun investitore fa il prelievo alla data 1 allora il progetto matura e 

gli investitori fanno i prelievi alla data 2 allora entrambi ricevono R e il gioco 

finisce. 

Se solo un investitore fa un prelievo alla data 2 allora quell’investitore riceve 

2R − D e l’altro riceve D e il gioco finisce. 

Infine se nessun investitore fa il prelievo alla data 2 allora la banca restituisce 

R a ciascun investitore e il gioco finisce. 

Supponiamo che i payoffs dei due investitori alle date 1 e 2 (come funzione 

dei loro prelievi) siano rappresentati dalle seguenti coppie di giochi in 

forma normale: 

78

prelevo non prelevo 

prelevo r , r D , 2r − D 

non prelevo 2r − D , D prossimo stadio 

data 1 

prelevo non prelevo 

prelevo R , R 2R − D , D 

non prelevo D , 2R − D R , R 

data 2 

prelevare ≻ non prelevare 

2D > 2r > D 2R > 2D 

R > D =⇒ 2R − D > R 

Per analizzare questo gioco procediamo con l’induzione a ritroso. 

Consideriamo il gioco alla data 2: poiché R > D (e così 2R − D > R) 

“prelevare” domina strettamente “non prelevare”. 

Esiste allora un unico NE in questo gioco: entrambi gli investitori prelevano 

e questo conduce a un payoff: (R, R). 

79

Poiché non c’è sconto, noi possiamo sostituire questo payoff nel gioco in 

forma normale alla data 1 come in figura: 

prelevare non prelevare 

prelevare r , r D , 2r − D 

non prelevare 2r − D , D R , R 

poiché r < D (e così 2r − D < r). 

R > D > r 

Questa versione a 1 periodo del gioco, a 2 periodi ha 2 NE in strategie 

pure: 

entrambi gli investitori prelevano =⇒ payoff (r, r). 

entrambi gli investitori non prelevano =⇒ payoff (R, R). 

Allora il gioco originale della corsa agli sportelli ha 2 esiti perfetti nei sottogiochi 

1) entrambi gli investitori prelevano alla data 1 

2) entrambi gli investitori non prelevano alla data 1 ma prelevano alla 

data 2. 

Il primo di questi esiti può essere interpretato come la corsa agli sportelli. 

Se I crede che II preleverà alla data 1 allora la miglior risposta di I è PRE- 

LEVARE anche se i due tizi starebbero meglio se entrambi aspettassero a 

prelevare alla data 2. 

80

Questo gioco differisce dal Dilemma del prigioniero per un aspetto importante: 

entrambi i giochi portano a un equilibrio di Nash che è socialmente 

non efficiente. 

Nel DP questo equilibrio è unico (ed è in strategie dominanti), in questo 

gioco esiste anche un secondo equilibrio che è efficiente. 

Allora questo gioco non predice quando si farà la corsa agli sportelli ma dimostra 

che i tizi possono trovarsi in condizione di equilibrio (vedere Diamond- 

Dybvig 1983). 

1.14 Dilemma del prigioniero ripetuto n volte 

❍ 

❍❍❍❍❍ II 

I 

D H 

D 3 3 0 6 

H 6 0 1 1 

81 

a)

3+x(h) 3+y(h) 0+x(h) 6+y(h) 

6+x(h) 0+y(h) 1+x(h) 1+y(h) 

In figura a) è riprodotto il DILEMMA DEL PRIGIONIERO (DP). 

Studiamo il gioco ripetuto n volte. 

Se n = 10 ciascun giocatore avrebbe 2 349525 strategie pure!!! 

Quindi il DP ha una forma strategica molto grande anche se n è relativamente 

piccolo. 

Esiste un unico equilibrio perfetto nei sottogiochi in cui ciascun giocatore 

sceglie sempre H. 

La ragione è banale. 

Prima dell’ultimo stadio è possibile che un giocatore possa essere scoraggiato 

dallo scegliere H per paura di una punizione da parte dell’oppositore più 

tardi nel gioco. 

Ma allo stadio finale nessuna punizione è possibile. 

Poiché H domina D nel dilemma del prigioniero, entrambi i giocatori sceglieranno 

H all’n-simo stadio qualunque sia stata la precedente storia del gioco. 

Consideriamo ora il penultimo stadio. 

Entrambi i giocatori sanno che, qualunque sia la loro scelta attuale, (H, H) 

sarà giocata nello stadio finale. 

Nessuno può quindi essere punito se usa H nel penultimo stadio perché la 

punizione peggiore potrà essere inflitta dall’oppositore usando H. 

Per l’oppositore è naturale usare H allo stadio finale qualunque cosa accada 

prima. 

82 

b)

Entrambi i giocatori useranno H al penultimo stadio, lo stesso argomento 

può essere usato al second’ultimo e così via... 

Una versione più formale dell’argomento può essere fornita dal seguente mini 

teorema: 

Teorema 1.25 Il DILEMMA DEL PRIGIONIERO (DP) n ripetuto un numero 

finito di volte, ha un unico equilibrio perfetto nei sottogiochi in cui 

entrambi i giocatori usano sempre H. 

Dimostrazione. Sia P (n) la proposizione che il teorema è vero per (DP) 

ripetuto n volte. 

Allora P (1) è vera. 

Dimostriamo il teorema con il principio di induzione cioè 

P (n) =⇒ P (n + 1) ∀ n, 

cioè supponiamo che la proposizione sia vera per (DP) n e dimostriamo che è 

vera per (DP) n+1 . 

Supponiamo che l’ultimo stadio sia raggiunto dopo una storia h del gioco. 

Se nel gioco al k-simo stadio il giocatore I ottiene un payoff uguale a xk, 

allora avrà accumulato un payoff totale 

x(h) = x1 + x2 + · · · + xn + xn+1 

al tempo (n + 1)-simo e si arriva allo stadio finale. 

Analogamente il giocatore II avrà accumulato un payoff pari a y(h). 

Il gioco allo stadio (n + 1)-simo è rappresentato in figura b). 

Poiché H domina fortemente D (H ≻ D) allora ci sarà un unico equilibrio 

di Nash (H, H). 

Infatti il gioco della figura b) è strategicamente identico a quello della figura 

a). 

La nuova funzione di utilità di VNM ottenuta aggiungendo x(h) a ciascun 

payoff del giocatore I descrive esattamente le sue preferenze come la vecchia 

funzione di utilità di VNM. 

Gli equilibri perfetti nei sottogiochi sono quindi trovati usando l’algoritmo di 

Zermelo. 

Il gioco in figura b) è il più piccolo sottogioco del (DP) n+1 . 

83

L’algoritmo di Zermelo richiede per il più piccolo di questi sottogiochi di essere 

rimpiazzato da un nodo terminale etichettato con la coppia di payoff che 

risulta dal giocare un NE nel sottogioco. 

Poiché (H, H) è il solo NE in figura b), il payoff sarà (1 + x(h), 1 + y(h)). 

Il nuovo gioco ottenuto con questa riduzione è precisamente lo stesso come 

nel (DP) n eccetto che 1 è aggiunto a ciascun payoff. 

È quindi strategicamente equivalente al (DP) n . 

Poiché si suppone vera P (n), H sarà quindi sempre usata da entrambi i giocatori 

nel nuovo gioco. 

Noi già sappiamo che useranno H allo stadio finale del (DP) n+1 . 

Allora essi giocano sempre H nelle n + 1 volte del (DP) ripetuto. 

Allora è vera P (n + 1). 

Per il principio di induzione P (n) è vera ∀ n. ✷ 

ATTENZIONE: Una strategia pura in un gioco ripetuto non nomina semplicemente 

un’azione per ciascuno stadio del gioco. 

Nomina un’azione per il primo stadio del gioco e poi per ogni ulteriore stadio 

nomina una funzione che fa la scelta di un’azione in quello stadio tenuto 

conto della storia del gioco. 

Un gioco ripetuto a più stadi ha quindi un insieme di strategie pure molto 

complicato. 

Esempio 1.26 Un esempio con orizzonte infinito. 

La cooperazione non è irrazionale se il (DP) è ripetuto un numero infinito di 

volte. 

In questo esempio noi studiamo il caso in cui la probabilità che il gioco 

continui da qualunque stadio a quello successivo è 2 

3 . 

All’inizio del gioco la probabilità che l’n-simo stadio sia raggiunto è ( 2 

3 )n−1 . 

Consideriamo la strategia S che richiede di giocare D fino a quando l’altro 

giocherà D. 

Se l’altro devia, allora si giocherà H per sempre (GRIM-STRATEGY). 

Ogni deviazione è punita per sempre. 

Se ogni giocatore usa la strategia S, allora non sorgerà nessuna occasione di 

punizione e i giocatori coopereranno sempre. 

84

Il payoff atteso per ciascun giocatore sarà 

 

c = 3 + 3 

2 

3 

+ · · · + 3 

2 

3 

n−1 

 

2 

+ 3 

3 

n 

+ . . . 

Un giocatore ci guadagna a deviare? Se un giocatore devia giocando H per 

la prima volta all’(n + 1)-simo stadio, allora il deviante otterrà al più 

 

d = 3 + 3 

2 

3 

+ · · · + 3 

2 

3 

Studiamo il segno c − d: 

 

2 

c − d = (3 − 6) 

3 

n 

n−1 

 

2 

+ 6 

3 

 

2 

+ (3 − 1) 

3 

n 

n+1 

 

2 

+ 1 

3 

n+1 

 

2 

+ (3 − 1) 

3 

n 

2 

2 

= − 3 + 2 

3 

3 + 

2 

2 

+ . . . = 

3 

n 

2 

2 

3 

= − 3 + 2 

3 

1 − 2 

 

= 

3 

n n 2 

2 

= (−3 + 4) = ≥ 0 

3 

3 

Allora c ≥ d anzi c > d (strettamente). 

 

2 

+ 1 

3 

n+2 

n+2 

+ . . . 

+ . . . 

Allora non è vantaggioso deviare, quindi anche l’oppositore sceglierà S. 

Allora (S, S) è un NE che richiede che i giocatori cooperino nel gioco con 

orizzonte infinito. 

DUOPOLIO DI COURNOT RIPETUTO 

Nel mondo reale gli oligopolisti devono prendere decisioni per produzioni ripetute 

su lunghi periodi o di durata indefinita. 

Una simile situazione è molto più favorevole per sostenere un comportamento 

di cooperazione di quanto lo sia il gioco a uno stadio. 

85

Nel comportamento cooperativo le due imprese si accordano in modo che la 

loro produzione totale debba essere ˜q che è il risultato ottenuto da un monopolista 

con profitto massimo. 

Consideriamo la versione ripetuta: 

I produrrà q1 in ogni periodo, 

II produrrà q2 in ogni periodo 

e q1 + q2 = ˜q. 

Supponiamo che l’implementazione di questo comportamento porti il giocatore 

I a guadagnare un profitto a in ogni periodo e II un profitto b. 

Contrariamente al caso di uno stadio le imprese possono fare delle previsioni 

sul loro comportamento e sulle azioni che devono essere fatte se qualcuno 

devia. 

La previsione più semplice è che se qualcuno devia allora il partner è libero 

ed entrambi giocano le loro strategie (che portano al NE nel gioco a uno 

stadio) in tutti i periodi successivi. 

Ogni giocatore è incentivato a deviare? 

Vediamo cosa ottiene I se non devia: se il suo fattore di sconto è δ (0 < δ < 1), 

egli valuterà il flusso di entrata. 

Se nessuno devia dal comportamento valido 

c = a + aδ + aδ 2 + · · · + aδ n + . . . 

Se il giocatore II mantiene l’accordo ma I devia, quanto ottiene I? 

Supponiamo che I devia la prima volta all’(n + 1)-simo stadio. 

Allora ottiene: 

d = a + aδ + aδ 2 + · · · + aδ n−1 + Bδ n + eδ n+1 + eδ n+2 + . . . 

dove B è la ricchezza che I ottiene deviando dall’accordo allo stadio n + 1, 

mentre e è il profitto per periodo che ciascuna impresa riceve quando ciascuno 

gioca la strategia del NE del gioco a uno stadio. 

Non sono importanti i valori a, B, e. 

È importante solo che e < a < B. 

Affinché deviare non sia vantaggioso per I, dovrà risultare c ≥ d. 

Quindi: 

c − d = δ n {(a − B) + (a − e)δ + (a − e) 2 δ 2 + . . . } = 

86

Allora l’accordo sarà rispettato se: 

δ n 

 

 

δ 

(a − B) + (a − e) 

1 − δ 

. 

δ 

(a − B) + (a − e) ≥ 0 

1 − δ 

δ ≥ 

⇕ 

B − a 

B − e 

e questa condizione è verificata se δ è sufficientemente grande ( B−a 

B−e 

La condizione vale anche per II. 

Allora l’accordo è possibile se il fattore di sconto δ non è troppo alto. 

1.15 Giochi ripetuti e automi finiti 

< 1). 

Un automa finito è una macchina computer idealizzata (o il programma che 

la fa funzionare). 

Quando le strategie possono essere rappresentate da automi finiti, si può 

pensare alla scelta della strategia di un giocatore come alla scelta di delegare 

il gioco a un opportuno programma di computer. 

Gli automi per giocare giochi ripetuti sono chiamati macchine di MOORE. 

La macchina di MOORE scelta da I avrà le azioni di II del gioco componente 

G come suoi possibili INPUT. 

I suoi OUTPUT saranno le azioni del giocatore I nel gioco componente G. 

Consideriamo il gioco componente G e il gioco ripetuto infinite volte: G ∞ . 

L’insieme delle strategie pure del giocatore I (S) per un gioco a uno stadio 

G sarà l’insieme delle azioni possibili in ogni stadio di G ∞ . 

L’insieme delle strategie pure del giocatore II (T ) per un gioco a uno stadio 

G sarà l’insieme delle azioni possibili per II in ciascuno stadio di G ∞ . 

87

Abbiamo già detto che l’insieme delle strategie pure in G ∞ è molto complicato. 

Restringeremo la nostra attenzione sull’insieme delle strategie pure in G ∞ 

che può essere rappresentato da automi finiti. 

Denoteremo con A l’insieme delle macchine di Moore con input T e output 

S. 

Denoteremo con B l’insieme delle macchine di Moore con input S e output 

T . 

Gli insiemi A e B saranno gli insiemi di strategie pure del gioco G ♯ che è 

l’oggetto finale del nostro studio. 

Possiamo pensare la scelta di I di un automa a ∈ A come la decisione di 

delegare la responsabilità di giocare G ∞ alla macchina a. 

Similmente la scelta b ∈ B del giocatore II si può vedere come la decisione 

di delegare la responsabilità di giocare a b ∈ B. 

Dobbiamo introdurre le funzioni di payoff: 

vi : A × B −→ R 

La definizione fa uso di πi, funzioni payoff nel gioco G 

(nel gioco a uno stadio G). 

Se a ha m stadi 

b ha n stadi 

allora esistono m · n stadi. 

πi : S × T −→ R i = 1, 2 (giocatori) 

I sceglie a ∈ A 

II sceglie b ∈ B 

Dopo questi le due macchine devono tornare ad una situazione identica a 

quella che hanno sperimentato prima. 

Sono quindi obbligate a reiterare il loro passato da quel punto in poi. 

Se il ciclo è lungo N stadi e le coppie sono: 

(s1, t1), (s2, t2), . . . , (sN, tN) 

88

allora il giocatore N-simo ha payoff 

vi(a, b) = 1 

N 

N 

πi(sn, tn); 

allora il payoff di un giocatore in G ♯ è ciò che il giocatore ottiene sulla media 

durante il ciclo in cui gioca. 

Si può dimostrare (cfr BINMORE): 

Lemma 1.27 Ogni esito di G ♯ è necessariamente un punto nella regione 

cooperativa del gioco G a uno stadio. 

Per arrivare all’enunciato del FOLK THEOREM abbiamo bisogno del punto 

di MIN-MAX. 

n=1 

mi è il valore di max-min di G (gioco a uno stadio) in termini della sua 

matrice payoff Mi. 

Questo è anche detto livello di sicurezza se i giocatori devono usare le loro 

strategie pure. 

Qui non abbiamo a che fare con il max-min ma con il min-max: mi. 

In generale: 

ma 

mi = min max πi(s, t) mi = max min πi(s, t) 

T S S T 

mi ≤ mi 

mi = mi se e solo se la matrice dei payoff Mi ha un punto di sella. 

Nel (DP) (1, 1) è il punto di min-max e anche di max-min. 

Consideriamo il seguente esempio: 

89

t1 t2 t3 

s1 1 0 6 4 0 9 0 9 

s2 2 1 0 2 3 0 0 2 ← 

s3 3 7 2 3 4 0 0 7 

1 0 0 

3 6 4 min-max 3 

↑ 

table 1 

m = (m1, m2) = (3, 2) 

mi = min max πi(s, t) 

T S 

m = (m1, m2) = (2, 2) 

mi = max min πi(s, t) 

S T 

90

q 

. . 

(0,9) 

. 

(0,2) • 

... 

. 

. 

X 

. 

. 

. 

• 

(1,0) 

. 

. 

• 

m 

. 

. 

. 

. 

. 

. 

. 

. 

. 

. 

. 

. 

. 

. 

. 

. 

. 

. 

. 

• 

. 

m 

. 

... 

. 

. 

. 

. 

. 

Y 

. 

. 

2 3 (4,0) 6 

. 

. 

. 

. 

. 

Fig. 1 

. 

(6,4) • 

Per ogni t ∈ T (insieme delle strategie pure per II), sia rI(t) la miglior 

risposta di I, rI(t) ∈ S 

Segue che: 

π1(rI(t), t) = max π1(s, t) 

S 

m1 = min max π1(s, t) = min π1(rI(t), t) 

t ∈ T s ∈ S t ∈ T 

Allora una banale conseguenza è che ogni NE (σ, τ) in strategie pure del gioco 

a uno stadio G assegna a ciascun giocatore almeno il suo valore di min-max, 

infatti: 

91 

p 

.. .

Analogamente 

π1(σ, τ) = π1(rI(τ), τ) ≥ min π1(rI(t), t) = m1 

t ∈ T 

π2(σ, τ) ≥ m2 

Ricordiamo che G ♯ è differente da G. 

Le strategie pure in G ♯ sono gli automi che giocano il gioco ripetuto G ∞ . 

Lemma 1.28 Ogni equilibrio di Nash di G ♯ assegna a ciascun giocatore 

almeno il suo valore di min-max nel gioco G a uno stadio. 

Nella figura 1 è illustrato che tutti gli esiti dei NE di G ♯ in strategie pure 

sono in 

Y = {x ∈ X : x ≥ m} 

X è la regione cooperativa di G. 

Teorema 1.29 (FOLK-THEOREM) Sia X la regione cooperativa del 

gioco G, m sia il punto di min-max; allora gli esiti che corrispondono ai 

NE in strategie pure del gioco G ♯ sono densi in Y , dove 

Y = {x ∈ X : x ≥ m}. 

SIGNIFICATO DEL FOLK-THEOREM 

Il messaggio che i teorici di Teoria dei Giochi vogliono dare è questo: 

in un contesto di interazioni ripetute, il perseguimento dell’interesse individuale 

e l’efficienza sociale non sono incompatibili, cioè con il folk-theorem il 

problema del contratto sociale è risolto. I vettori di vincita conseguibili con 

accordi la cui attuazione, se G fosse giocato una volta sola, richiederebbe la 

presenza di un’autorità esterna per renderli vincolanti, sono ottenibili, in un 

contesto infinitamente ripetuto, come equilibri cooperativi perfetti. 

Qual è il cemento che tiene insieme la società? 

Gli antichi filosofi hanno parlato di “contratto sociale”, espressione non bella 

perché suggerisce l’idea di un obbligo o di uno sforzo per aderire all’accordo. 

92

Davide Hume, duecento anni prima che fossero “inventati” i giochi ripetuti, 

aveva enfatizzato il fatto che la società non è un gioco a uno stadio. Infatti in 

un famoso passo del suo “TREATISE ON HUMAN NATURE” aveva esortato 

a compiere un servizio ad un altro perché prima o poi renderà tale servizio: 

quando vedrà il vantaggio della nostra azione sarà egli stesso indotto a farlo 

verso altri... 

Il segreto è la RECIPROCIT À. 

C’è un proverbio inglese che riassume bene questo concetto: 

“I’ll scratch your back if you’ll scratch mine”. 

Vediamo un esempio che illustra l’idea del contratto sociale e l’idea che sta 

dietro il FOLK-THEOREM. 

Esempio 1.30 Immagina un mondo in cui ad ogni stadio ci sono solo due 

esseri vivi: madre e figlia (si può immaginare una riproduzione PARTENO- 

GENESI). 

Ciascun individuo vive solo due periodi: 

1. GIOVINEZZA 

2. VECCHIAIA 

Fissiamo alcuni dettagli nella storia della vita dei due giocatori. 

Nella GIOVINEZZA ognuno guadagna due unità di un bene deperibile, ma 

questo è salutare se e solo se è consumato nello stesso periodo in cui è guadagnato. 

Alla fine dello stadio GIOVINEZZA ciascun giocatore genera una figlia. 

La madre entra così nello stadio VECCHIAIA durante il quale è troppo debole 

per lavorare e così non guadagna più niente. 

Chiunque preferirebbe non consumare tutti i guadagni nella giovinezza. 

Tutti preferirebbero consumare: 

1 unità nella giovinezza 

1 unità nella vecchiaia. 

Sfortunatamente il bene guadagnato non può essere accumulato e così la 

seconda possibilità non può essere raggiunta, a meno che non vi siano trasferimenti 

di bene da un giocatore ad un altro. 

Per ogni giocatore un equilibrio è consumare qualunque cosa guadagnata nella 

giovinezza. Così ognuno condurrà una vecchiaia miserevole... 

93

Sarebbe auspicabile che la figlia desse una unità di bene alla madre, così 

ognuno potrebbe godere di una unità di bene in ogni periodo della sua vita. 

Tale comportamento è un equilibrio? 

Supponiamo che la figlia dia un’unità di bene alla madre se questa ha adottato 

un comportamento analogo nel periodo precedente. Questo è un NE, 

infatti nessuna deviazione farebbe guadagnare qualcosa se ci si allontanasse 

dalla strategia di equilibrio. 

Il meglio per chi devia sarebbe consumare tutto il bene al primo stadio, ma 

allora la strategia di equilibrio della figlia richiederebbe una punizione per 

tale comportamento. 

Chi devia sarà allora lasciato senza niente nella vecchiaia. 

Notiamo che una figlia non vorrebbe punire una madre che devia: se facesse 

così farebbe così anche sua figlia con lei. 

Il NE trovato non è perfetto nei sottogiochi, perché il comportamento di 

equilibrio non è credibile per un giocatore razionale. 

Un equilibrio perfetto nei sottogiochi che sostiene esiti cooperativi è facile da 

trovare. 

Ciascuna figlia dà una metà del bene a sua madre se e solo se nessuno ha 

mai fatto in modo differente nel passato. 

Sembra quasi una punizione biblica: la punizione si estende non alla terza o 

quarta generazione, ma a tutti i discendenti... 

Possiamo trovare un equilibrio perfetto nei sottogiochi in cui solo i colpevoli 

sono puniti? 

A tale scopo chiamiamo CONFORMISTA un giocatore che dà a sua madre 

una unità del bene se sua madre si è comportata da conformista. 

Altrimenti una figlia conformista non dà niente a sua madre. 

In questo modo i conformisti ricompensano i conformisti e puniscono i non 

conformisti. 

Allora è un equilibrio perfetto nei sottogiochi essere un conformista. 

Alcune persone si sentono offese da tali storie che insegnano come la società 

dovrebbe essere tenuta insieme. Dicono che tali storie “denigrano lo 

spirito umano” o “sviliscono la capacità umana di amore”. 

“Penso”, dice Binmore, “che avere queste reazioni sia perdere di vista lo scopo 

di tali storie: i teorici di Teoria dei Giochi amano le torte di mele e le loro 

madri... le figlie aiutano le loro madri semplicemente perché le amano”. 

Il modello raccontato vuole mettere in luce il fatto che, se anche tutte le 

94

figlie avessero un cuore di pietra, non necessariamente dimenticherebbero le 

madri. 

In una società coordinata su un contratto sociale opportuno le madri sarebbero 

curate perché così è meglio per tutti. 

95

Capitolo 2 

Evolutionary Game Theory da 

Weibul 

2.1 Elementi della Teoria dei Giochi non cooperativi 

Proposizione 2.1 Per un gioco finito in strategie miste l’insieme degli equilibri 

di Nash è non vuoto e ha un numero finito di componenti connesse 

chiuse. 

Se è un Nash stretto, allora è un punto isolato. 

Con una trasformazione di scala crescente oppure con l’aggiunta di un gioco 

dummy non cambiano i NE. 

RAFFINAMENTO 

Denotiamo con θ NE l’insieme degli equilibri di Nash in strategie miste anche 

non simmetrici. 

Definizione 2.2 (PERFEZIONE DELLA MANO TREMOLANTE) 

x ∈ θ NE è perfetto se esiste una successione di giochi perturbati {G(µ t )}µ t →0 

e per ognuno di essi esiste un equilibrio di Nash x t ∈ θ NE (µ t ) tale che x t → x, 

dove µ t è una funzione errore che ad ogni giocatore i e ad ogni strategia pura 

97

h associa la probabilità µ t ih ∈ (0, 1) cioè la probabilità che quella strategia sia 

giocata per sbaglio. 

< 1 

h 

µih 

Ogni equilibrio di Nash interno è perfetto e inoltre l’insieme degli equilibri 

perfetti è non vuoto. 

Ogni equilibrio perfetto (x ∈ θ P E ) è non dominato. 

Nei giochi a due giocatori vale anche il viceversa. 

Definizione 2.3 x ∈ θ NE è proprio se esiste una successione ε t → 0 e dei 

profili di strategie ε t -propri y(ε t ) tali che y(ε t ) → x 

dove : 

dato ε > 0, un profilo di strategie y ∈ int(θ) è ε-proprio se 

ui(e h i , y−i) < ui(e k i , y−i) =⇒ yih 

≤ εyik 

(cioè la strategia che mi dà un payoff minore, viene giocata con probabilità 

più piccola di ε rispetto all’altra). 

Ogni equilibrio di Nash interno è proprio. 

Ogni equilibrio proprio è perfetto. 

Esistono sempre equilibri propri. 

Definizione 2.4 x ∈ θ NE è strettamente perfetto se per ogni successione 

di giochi perturbati {G(µ t )}µ t →0 esiste per ciascuno di essi un equilibrio di 

Nash x t ∈ θ NE (µ t ) tale che x t → x. 

Valgono i seguenti risultati: 

• Ogni equilibrio di Nash interno è strettamente perfetto. 

98

• Ogni equilibrio di Nash stretto è strettamente perfetto. 

• Ogni equilibrio strettamente perfetto è proprio. 

Osservazione 2.5 Gli equilibri di Nash stretti sono strettamente perfetti, 

quindi propri, quindi perfetti. 

Non sempre esistono equilibri strettamente perfetti: 

Esempio 2.6 Siano α, β > 0. 

❍ 

❍❍❍❍❍ II 

I 

L M R 

T 0 β α 0 0 0 

B 0 β 0 0 α 0 

NE: (T, L) (B, R) 

sono perfetti ma non strettamente perfetti. 

ESSENZIALI 

Definizione 2.7 Definiamo payoff distanza tra due giochi G e G ′ 

guente: 

d(G, G ′ 

) = max |πi(s) − π ′ 

i(s)| 

i ∈ I, s ∈ S 

99 

la se

Definizione 2.8 x ∈ θ NE è essenziale se ∀ ε > 0 ∃ δ > 0 tale che: 

d(G, G ′ 

) < δ =⇒ G ′ 

ha un equilibrio di Nash x ′ 

tale che d(x, x ′ 

) < ε 

(salita nel simplesso). 

Non è detto che i NE interni siano essenziali: 

CONTROESEMPIO: gioco con tutti i payoff uguali. 

x essenziale =⇒ x strettamente perfetto. 

NE stretto è essenziale? 

GIOCHI SIMMETRICI A DUE GIOCATORI 

Definizione 2.9 G = (I, S, π) I = {1, 2} 

S = S1 × S2 = S2 × S1 

π1(s1, s2) = π2(s2, s1) ∀ (s1, s2) ∈ S 

Equivale a B = A T (dove A, B sono le matrici payoff dei due giocatori.) 

Definizione 2.10 G è un gioco doppiamente simmetrico se: 

A T = A = B 

(gioco di puro coordinamento con matrice simmetrica). 

Definizione 2.11 ∆ NE = {x ∈ ∆ : (x, x) ∈ θ NE }. 

100

Proposizione 2.12 Per ogni gioco finito e simmetrico a due giocatori si ha 

ESEMPI: 

1. FALCHI-COLOMBE 

Se c < v 

2 

∆ NE = ∅. 

F C 

F v − c v 

2 

C 0 v 

2 

(cioè costa poco), NE:(F,F). 

Se c > v, 

NE:(C,F), (F,C). 

2 

Non simmetrici ma in strategie miste sì. 

2. ROCK-SCISSORS-PAPER 

❍ 

❍❍❍❍❍ II 

I 

R S P 

R 1 2 0 

S 0 1 2 

P 2 0 1 

101

( 1 

3 

∃ NE in strategie pure, ma 

, 1 

3 

1 

, ) è NE in strategie miste. 

3 

2.2 Criteri di stabilità evolutiva 

Definizione 2.13 x ∈ ∆ (simplesso) è una ESS (strategia evolutivamente 

stabile) se per ogni strategia y = x esiste εy ∈ (0, 1) tale che: 

εu(x, y) + (1 − ε)u(x, x) > εu(y, y) + (1 − ε)u(y, x) (2.1) 

payoff del non mutante > payoff mutante 

∀ ε ∈ (0, εy) 

Osservazione 2.14 ∆ ESS ⊂ ∆ NE 

Proposizione 2.15 x ∈ ∆ ESS se e solo se 

u(y, x) ≤ u(x, x) ∀ y 

u(y, x) = u(x, x) =⇒ u(y, y) < u(x, y) ∀ y = x 

Se (x, x) è un NE stretto, allora è un ESS. 

Esempi 2.16 1. DILEMMA DEL PRIGIONIERO 

Il NE≡ESS anche se non efficiente. 

102

2. 

L R 

T 2 2 0 0 

B 0 0 1 1 

NE: (T, L), (B, R). 

Sono ESS perché simmetrici e stretti. 

3. FALCHI-COLOMBE (chicken per Binmore) 

F v 

v − c 2 

F C 

− c v 0 

2 

C 0 v v 

2 

Con c > v, 

∃ 1 ESS in strategie miste. 

2 

4. SASSO-CARTA-FORBICE 

L’equilibrio di Nash in strategie miste non è ESS. 

Osservazione 2.17 Gioco dummy simmetrico 

103 

v 

2

a a d a 

a d d d 

gioco simmetrico + gioco dummy simmetrico = 

a a b c 

c b d d 

+ 

Infatti: 

0 0 −b −c 

−c −b 0 0 

= 

a 0 

0 d 

 

a a 0 0 

0 0 d d 

ESS non cambiano aggiungendo un gioco dummy. 

Proposizione 2.18 Se x ∈ ∆ ESS e C(y) ⊂ C(x) (cioè y sta nella stessa 

faccia del simplesso di x) per qualche y = x, allora y ∈ ∆ NE . 

C(x)=supporto di x è la faccia del simplesso che ha come vertici le strategie 

pure a cui x assegna probabilità positiva. 

104

. 

• 

Se c’è una ESS interna, questa è unica perché il supporto è tutto il lato. 

A • 

. 

× 

C 

× B 

Se i è una ESS (A) su un lato del triangolo, i due vertici non possono essere 

ESS, però può essere B o C. 

• . 

• • 

CASI POSSIBILI 

caso 3 strategie 

(perché il supporto di un vertice è il vertice stesso.) 

105 

• 

• .

. . 

• 

caso 3 strategie pure: il simplesso è un triangolo. 

. . 

• • • 

• 

. . 

• • • 

106 

• 

nessuna

. 

• 

n = 2 

caso 2 strategie pure: il simplesso è un segmento 

. 

• • 

• 

• 

FORSE IN GENERALE È n2 ? 

Corollario 2.19 L’insieme ∆ ESS ⊂ ∆ è finito. 

Se x ∈ ∆ è debolmente dominata, allora x ∈ ∆ ESS . 

x ∈ ∆ ESS =⇒ (x, x) ∈ θ P E . 

x ∈ ∆ ESS =⇒ (x, x) ∈ θ NE è proprio. 

107 

. 

. 

.

ESS =⇒ PROPRIO =⇒ PERFETTO 

⇐= 

basta considerare 

“carta, sasso, forbice” 

Nella Definizione 2.13 ε è indipendente da y; dice che x ha una barriera 

di invasione uniforme. 

x ∈ ∆ ESS ⇐⇒ x ha una barriera di invasione uniforme 

Definizione 2.20 x ∈ ∆ è localmente superiore se ha un intorno U tale 

che 

u(x, y) > u(y, y) ∀ y = x in U 

Allora: 

x ∈ ∆ ESS ⇐⇒ x è localmente superiore 

Definizione 2.21 x ∈ ∆ è neutralmente stabile (NSS) se ∀ y ∈ ∆ esiste 

εy ∈ (0, 1) tale che la disuguaglianza (2.1) vale debolmente 

u[x, εy + (1 − ε)x] ≥ u[y, εy + (1 − ε)x] ∀ ε ∈ (0, εy) 

Un’altra possibilità di caratterizzazione è la seguente: 

u(y, x) = u(x, x) =⇒ u(y, y) ≤ u(x, y) ∀ y 

∆ ESS ⊂ ∆ NSS ⊂ ∆ NE 

Esempio 2.22 Nel gioco “carta-sasso-forbice”, ( 1 

3 

108 

, 1 

3 

1 , ) non è ESS ma NSS. 

3

x ∈ ∆ NSS ⇐⇒ x ha una barriera di invasione uniforme debole 

⇐⇒ x è localmente debolmente superiore 

Esempio 2.23 Ci sono giochi che non hanno NSS 

⎛ 

1 1 

⎞ 

0 

A = ⎝ 0 1 1 ⎠ 

1 0 1 

Definizione 2.24 x ∈ ∆ è robusto (REE) contro i mutanti di equilibrio 

se qualunque y = x non è mai la miglior risposta a una popolazione mista 

y ∈ β ∗ [εy + (1 − ε)x] 

∆ ESS ⊂ ∆ REE ⊂ ∆ NE 

se x ∈ ∆ REE , allora x è proprio 

Esempio 2.25 “carta-sasso-forbice” ha equilibrio robusto: 

 

1 1 1 

, , ∈ REE 

3 3 3 

∈ NSS 

INSIEMI EVOLUTIVAMENTE STABILI 

Definizione 2.26 X ∈ ∆ NE è un insieme evolutivamente stabile (ES) se 

è un insieme chiuso e non vuoto e ∀ x ∈ X ∃ Ux (intorno di x) tale che 

u(x, y) ≥ u(y, y) ∀ y ∈ Ux ∩ β ∗ (x), con disuguaglianza stretta se y ∈ X. 

Nella Proposizione ?? dimostreremo che y ∈ β ∗ (x) è superfluo. 

X ES =⇒ X ⊂ ∆ NSS 

109

Esempio 2.27 

3 

. 

........................................................................................................................................................................... 

2 1 

. . 

∆NE 

è anche un ES set. 

∃ ESS 

Proposizione 2.28 X ⊂ ∆ ESS =⇒ X è ES set 

⎛ 

⎜ 

A= ⎜ 

⎝ 

0 2 0 

2 0 0 

1 1 0 

Ogni insieme ES è unione finita di insiemi disgiunti chiusi e connessi e ognuno 

di questi è ES. 

Non è detto che esistano insiemi ES, ma nei giochi doppiamente simmetrici 

sì. 

Insiemi robusti contro i mutanti di equilibrio cioè sono insiemi tali che i mutanti 

di equilibrio non possono condurre la popolazione fuori di essi. 

Definizione 2.29 X ⊂ ∆ è EES set se è minimale rispetto alla seguente 

proprietà: 

X è un sottoinsieme non vuoto e chiuso di ∆ NE ed ∃ ε ∈ (0, 1) tale che 

se x ∈ X, y ∈ ∆, ε ∈ (0, ε) e y ∈ β ∗ ((1 − ε)x + εy) 

(cioè y è un mutante miglior risposta alla popolazione mutata), 

allora (1 − εx) + εy ∈ X 

Esempio 2.30 In carta-sasso-forbice: 

 

1 1 1 

, , 

3 3 3 

è NE 

non è ESS 

110 

è EES 

⎞ 

⎟ 

⎠

Ogni insieme EES è una componente connessa di ∆ NE . 

Ogni insieme ES contiene qualche EES e ogni insieme connesso ES è un 

EES. 

Definizione 2.31 x ∈ ∆ è: 

EFFICIENZA SOCIALE 

a) localmente strettamente efficiente se ∃ U : u(x, x) > u(y, y) 

∀ y = x in U. 

b) localmente debolmente efficiente se ∃ U : u(x, x) ≥ u(y, y) 

∀ y = x in U. 

c) globalmente efficiente se u(x, x) ≥ u(y, y) 

∀ y ∈ ∆. 

Esistono sempre strategie globalmente efficienti perché argmax in compatti. 

Nai giochi doppiamente simmetrici si ha: 

x ∈ ∆ NSS ⇐⇒ x è localmente debolmente efficiente 

x ∈ ∆ ESS ⇐⇒ x è localmente strettamente efficiente 

Definizione 2.32 Un insieme X ⊂ ∆ è localmente efficiente se è contenuto 

in qualche insieme U tale che: 

U = argmax u(x, x) = {x ∈ ∆ : u(x, x) ≥ u(y, y) ∀ y ∈ ∆ ∩ U} 

x ∈ ∆ ∩ U 

111

Ogni insieme localmente efficiente è un ES set ed ogni insieme ES X ⊂ ∆ è 

localmente efficiente. 

PREPLAY COMMUNICATION 

I payoff inefficienti possono essere evolutivamente instabili alla presenza di 

mutanti che comunicano. 

Per ogni gioco G possiamo definire il gioco GM (gioco cheap-talk associato a 

G) 

M = insieme finito di messaggi (µ, ν) ∈ M 2 

F = {f : M × M −→ K} 

cioè ad ogni coppia di messaggi (µ, ν) è associata una strategia pura di K 

h = f(µ, ν) ∈ K = insieme delle strategie pure di G. 

KM insieme delle strategie pure di GM. 

Il payoff di un giocatore che usa la strategia pura (µ, f) contro un oppositore 

che usa la strategia pura (ν, g) è: 

π payoff di G. 

estensione mista: 

πM[(µ, f), (ν, g)] = π[f(µ, ν), g(µ, ν)] 

uM(p, q) = 

(µ,f)∈KM 

 

 

i messaggi possono essere caratterisctiche fisiche. 

∀ x ∈ ∆ NE nel gioco G ∃ ˆx ∈ ∆ NE 

M nel gioco GM (caratterizzato dal fatto 

che le azioni sono le stesse dell’equilibrio in G ma tutti i messaggi sono dati 

con la stessa probabilità). 

Esercizio: L’equilibrio ESS di G non è più ESS in GM mentre l’equilibrio 

efficiente diventa ESS in GM. 

112

Esercizio: un risultato inefficiente che non è neppure un NE nel gioco G 

può diventare un ESS stabile in GM. 

Proposizione 2.33 Se la strategia p ∈ ∆M non usa tutti i messaggi, allora 

p sta in un insieme P ⊂ ES se e solo se è globalmente efficiente. 

Esempio 2.34 Se ci sono più di due NE stretti, allora un risultato inefficiente 

non è detto che diventi una ESS anche se non usa tutti i messaggi; 

può diventare semplicemente una NSS. 

COMPORTAMENTI CONDIZIONATI AL RUOLO 

Esempio 2.35 PROPRIETARIO-INTRUSO 

Ogni giocatore ha due ruoli: ruolo 1 e ruolo 2. 

Strategia: x = (x 1 , x 2 ) 

(x 1 nella posizione 1, x 2 nella posizione 2). 

(esempio: (f, c) significa falco se proprietario, colomba se intruso). 

Dato un gioco base anche non simmetrico G (I, S, π) costruisce un gioco 

associato Γ simmetrico che tiene conto del ruolo. 

u ∗ (x, y) = 1 

 

u1(x 

2 

1 , y 2 ) + u2(y 1 , x 2 

) 

Proposizione 2.36 Una strategia di comportamento x di Γ è ESS se e 

solo se x è un NE stretto di G. 

Esempio 2.37 FALCHI-COLOMBE con v = 2, c = 4. 

113

❍ 

❍❍❍❍❍ II 

I 

F C 

F -1 -1 2 0 

C 0 2 1 1 

(C, F ), (F, C) NE stretti 

L’unico ESS in Γ corrisponde a (C, F ) e (F, C) in G. 

L’unica ESS di G (quella delle strategie miste) non è più ESS in Γ. 

Esempio 2.38 GIOCO DELLA DETERRENZA 

❍ 

❍❍❍❍❍ II 

I 

L R 

T 2 2 0 0 

B 1 4 1 4 

NE stretto (T, L) 

intruso entra-proprietario cede 

Nel gioco Γ simmetrico questa è l’unica ESS. 

114

2.3 Dinamica del replicatore 

˙xi = [u(e i , x) − u(x, x)]xi 

xi(t)=percentuale di popolazione che al tempo t usa la strategia pura i. 

u(e i , x)=payoff medio di individui che usano la strategia i. 

u(x, x)=payoff medio di tutta la popolazione. 

(2.2) 

La dinamica del replicatore è invariante per cambiamenti di scala e giochi 

dummy. 

La (2.2) è un sistema di equazioni differenziali il cui secondo membro sono 

polinomi, quindi esiste una ed una sola soluzione per ogni punto iniziale. 

La solution mapping ξ : R × ∆ −→ ∆ è definita da: 

ξ(t, x0) = quel valora x(t) che corrisponde a x0 al variare di t 

(t ↦−→ ξ(t, x0) è l’orbita di x0). 

È interessante sapere che se x0 è interno, tutta l’orbita è interna (anche 

se si avvicina al bordo non arrva al bordo). 

Se x0 sta su una faccia, tutta l’orbita sta su quella faccia. 

Definizione 2.39 Un punto y ∈ ∆ è stazionario se ξ(t, y) = y ∀ t (cioè se 

l’orbita rimane lì.) 

Definizione 2.40 y ∈ ∆=simplesso è Liapunov stabile se ogni intorno B 

di y contiene un intorno B0 di y tale che x0 ∈ B0 =⇒ ξ(t, x0) ∈ B ∀ t. 

Intuitivamente: per ogni intorno esiste un intorno più piccolo tale che se 

parto dal più piccolo non esco comunque dal più grande. 

115

Definizione 2.41 Il bacino di attrazione di un insieme A è l’insieme dei 

punti x 0 tale che 

ξ(t, x 0 ) −→ A 

 

cioè 

dist(ξ(t, x 

t → ∞ 

0 ), A) −→ 

t → +∞ 

 

0 

Definizione 2.42 A dicesi un attrattore se il bacino di attrazione non è 

vuoto ed è un intorno di A. 

Proposizione 2.43 Se x, y ∈ C e 

nario 

lim ξ(t, x) = y 

t → ∞ 

, allora y è stazio- 

ATTRATTORE =⇒ LIAPUNOV STABILE =⇒ STAZIONARIO 

Esempio 2.44 dilemma del prigioniero ÷ hawk-dove 

Esempio 2.45 sasso-carta-forbice generalizzato 

N.B.: Nei giochi 2 × 2 il simplesso ∆ ha dimensione 1 (basta x1(t)...). 

Nei giochi 3 × 3 il simplesso ∆ ha dimensione 2. 

Teorema 2.46 Se una strategia pura i è iterativamente strettamente dominata, 

allora 

ξi(t, x 0 ) −→ 0 se t → +∞ 

per ogni x 0 ∈ int(∆) 

cioè se sono presenti tutte le strategie pure quelle iterativamente strettamente 

dominate sono spazzate via. 

Esempio 2.47 

⎛ 

⎜ 

A= ⎜ 

⎝ 

3 1 6 

0 0 4 

1 2 5 

⎞ 

⎟ 

⎠ 

116 

⎛ 

⎜ 

B= ⎜ 

⎝ 

3 0 1 

1 0 2 

6 4 5 

⎞ 

⎟ 

⎠

WEAK DOMINANCE 

Proposizione 2.48 Supponiamo che i sia una strategia debolmente dominata 

da una strategia y ∈ ∆. 

per ogni x 0 ∈ int(∆). 

Esempio 2.49 A = 

Se u(y, e j ) > u(e i , e j ), allora 

ξi(t, x 0 ) −→ 0 e/o ξj(t, x 0 ) −→ 0 

t → +∞ t → +∞ 

Esempio 2.50 A = ⎝ 

∆ NE = 

 

0 1 

0 0 

⎛ 

 

. 

1 1 1 

1 1 0 

0 0 0 

⎞ 

⎠. 

x ∈ ∆ : u(e i , x) = max u(z, x) ∀ i ∈ C(x) 

z ∈ ∆ 

cioè se il NE è ( 1 1 F, C), allora u(F, x) = u(C, x) (quindi non è NE stretto). 

2 2 

x• 

. C 

F R 

(Attenzione, R guadagna di meno) 

117

∆ 0 = 

 

x ∈ ∆ : u(e i , x) = u(x, x) ∀ i ∈ C(x) 

insieme dei punti stazionari nella dinamica del replicatore (derivata =0). 

∆ NE ⊂ ∆ 0 

 

inoltre per i punti interni ∆ NE = ∆ 0 

per definizione ∆ 00 = ∆ 0 ∩ int(∆) 

Proposizione 2.51 {e 1 , . . . , e k } ∪ ∆ NE ⊂ ∆ 0 

∆ 00 = ∆ NE ∩ int(∆) 

∆ 00 convesso 

LYAPUNOV STABILI 

Proposizione 2.52 Se x ∈ ∆ è Lyapunov stabile nella dinamica del replicatore, 

allora x ∈ ∆ NE . 

Il viceversa non è vero: si veda esempio SASSO-CARTA-FORBICE generalizzato. 

Proposizione 2.53 

Se x 0 ∈ int(A) e ξ(t, x 0 ) −→ x allora x ∈ ∆ NE 

t → +∞ 

⎛ 

Esempio 2.54 A = ⎝ 

0 1 0 

0 0 2 

0 0 1 

⎞ 

⎠. 

La strategia pura x = e 1 è punto limite di tutte le traiettorie interne, è NE 

ma non Lyapunov stabile (perché comunque prenda un intorno “piccolo” vi 

sono traiettorie che da quell’intorno vanno comunque lontano). 

118

MEDIE TEMPORALI E ∆ NE 

Definiamo la media temporale ξ(T, x 0 ) ∈ ∆ come 

ξ i(T, x 0 ) = 1 

T 

K=insieme delle strategie pure. 

T 

t=0 

ξi(t, x 0 ) dt ∀ i ∈ K 

Proposizione 2.55 Sia ∆ NE ∩ int(∆) = {x}, x 0 ∈ int(∆). 

γ + (x 0 ) ⊂ int(∆) 

(orbita in avanti, cioè per i tempi positivi). 

Allora 

lim ξ(T, x 0 ) = x 

T → ∞ 

Esempio 2.56 SASSO-CARTA-FORBICE 

Proposizione 2.57 Supponiamo che ∆ NE ∩ int(∆) = ∅. Allora 

dove bd(∆) = ∂(∆). 

Concludendo: 

ξ(t, x 0 ) −→ bd(∆) ∀ x 0 ∈ ∆ 

t → +∞ 

Proposizione 2.58 Se esiste z ∈ int(∆) tale che u(z, y) > u(y, y) ∀ y ∈ 

∆ 0 ∩ ∂(∆), allora la dinamica del replicatore è permanente (cioè nessuna 

strategia pura sparisce). 

Se la dinamica è permanente, c’è allora un unico NE e vale la Proposizione 

2.55 (cioè la media temporale ξ(T, x 0 ) converge). 

119

Proposizione 2.59 Se x ∈ ∆ è asintoticamente stabile in (2.2), allora 

(x, x) ∈ θ NE è perfetto e isolato. 

(θ NE = eq. di NE simmetrico in strategie miste) 

Non vale il viceversa (esempio: SASSO-CARTA-FORBICE). 

INSIEMI E STRATEGIE EVOLUTIVAMENTE E NEUTRALMENTE STABILI 

Proposizione 2.60 Ogni x ∈ ∆ ESS è asintoticamente stabile nella dinamica 

del replicatore. 

Per la dimostrazione si veda la funzione ENTROPIA relativa, a pagina 96. 

Proposizione 2.61 Se x ∈ int(∆) ∩ ∆ ESS , allora 

ξ(t, x 0 ) −→ x ∀ x 0 ∈ int(∆) 

t → +∞ 

Esempio 2.62 SASSO-CARTA-FORBICE 

⎛ 

CONTROESEMPIO: A = ⎝ 

1 5 0 

0 1 5 

5 0 4 

x = ( 3 8 7 

, , ) è asintoticamente stabile (cioè attrattore della dinamica) 

18 18 18 

x ∈ ∆ ESS 

⎞ 

⎠. 

x ∈ ∆ NSS 

Proposizione 2.63 Ogni x ∈ ∆ NSS è Lyapunov stabile nella dinamica del 

replicatore. 

120

GIOCHI DOPPIAMENTE SIMMETRICI 

Nei giochi simmetrici non sempre il payoff medio della popolazione aumenta 

lungo le traiettorie (si veda falco-colomba), però aumenta se il gioco è doppiamente 

simmetrico. 

Teorema 2.64 (teorema fondamentale della selezione naturale) Per 

ogni gioco doppiamente simmetrico si ha: 

 

a1 0 

Esempio 2.65 A = 

0 a2 

˙u(x, x) ≥ 0 

e ˙u(x, x) = 0 ⇐⇒ x ∈ ∆ 0 

 

. 

gioco doppiamente simmetrico 

equivalente al gioco falco-colomba + gioco dummy. 

(si confronti l’Osservazione 2.17) 

Qui il payoff aumenta (mentre in falco-colomba no); quindi il gioco dummy 

non è poi così dummy. 

Proposizione 2.66 Per ogni gioco doppiamente simmetrico sono fatti equivalenti: 

a) x ∈ ∆ ESS . 

b) x ∈ ∆ è localmente strettamente efficiente. 

c) x ∈ ∆ è asintoticamente stabile nella dinamica del replicatore. 

121

CONVERGENZA DELLE TRAIETTORIE 

Definizione 2.67 A matrice dei payoff è simmetrizzabile se può essere trasformata 

in una matrice simmetrica da un numero finito di trasformazioni 

affini dei payoff e di aggiunte di giochi DUMMY. 

Osservazione 2.68 Tutte le matrici 2 × 2 sono simmetrizzabili. 

Proposizione 2.69 Ogni traiettoria della DR di un gioco a 2 giocatori con 

matrice payoff simmetrizzabile converge a qualche punto x ∈ ∆ 0 . 

APPENDICE (pag. 119): 

Nella DR le traiettorie sono uniche (dato il punto iniziale). 

Inoltre se partono dall’interno rimangono all’interno e se partono da una 

faccia rimangono nella faccia. 

122

appunti 1 - DIMA

Create successful ePaper yourself

Delete template?

Save as template?