Lezione 6 - Brunochiarini.it

7 

Analisi Strategica 

per la 

Politica Economica 

Parte Sesta 

Prof. Bruno Chiarini

Discounting 

Tassi di sconto molto piccoli indicano una 

valutazione inferiore delle payoff future 

rispetto alla payoff corrente (il futuro conta 

poco), tassi di sconto vicini ad 1 indicano 

valutazioni delle payoffs future pressoché 

analoghe a quella corrente (il futuro conta). 

Con δ=1 si ha una situazione di “nodiscounting”. 

Payoffs future e quella 

corrente sono valutate esattamente allo 

stesso modo. Un euro ottenuto nel futuro 

vale esattamente un euro di oggi. 

Il tasso di sconto δ è legato al fattore di 

sconto r (o tasso di interesse) nel seguente 

modo: δ=1/1+r. In altri termini, quando 

δ=1, ciò significa che r=0. Più il tasso di 

interesse è basso (il fattore di sconto è alto) 

più l’individuo sconta meno il futuro ed è più 

paziente. Per un tasso di sconto δ=1/2, il 

tasso di interesse è r=1.

GIOCHI RIPETUTI 

Supergioco ≠ Gioco Dinamico 

● La ripetizione del 

iniziale modifica lo 

stock di 

informazione degli 

agenti ad ogni 

round successivo 

● Modificano le 

strutture dei 

payoffs 

● Modifica lo spazio 

delle strategie 

disponibili 

→ Non è del tutto inappropriato chiamarli 

giochi dinamici

● Mosse → Sequenza di mosse 

● Il gioco si estende da: 

● Sequenza di payoffs 

● L’esito del supergioco è dato dalla somma dei 

guadagni scontata (guadagni percepiti in ogni 

round del supergioco) 

● Sconto: esigenza in quanto i guadagni hanno 

luogo in tempi diversi. I giocatori sono 

“impazienti”: danno un peso diverso (minore) 

ai guadagni percepiti in futuro 

● Per confrontare tali esiti occorre perciò 

attualizzarli 

0 T FINITO 

0 

∞ INFINITO

● La soluzione del supergioco non è 

necessariamente la ripetizione di T volte della 

soluzione del gioco iniziale: 

→ Es. Giochi riconducibili al Dilemma- 

Prigioniero 

→ Soluzione One-Shot 

Nash (C-C) 

→ Soluzione ripetuta potrebbe essere: 

[NC-NC] t=1,2, … 

● La strategia cooperativa ad ogni round del 

gioco può risultare conveniente perchè 

altrimenti le perdite causate nel futuro dalla 

punizione comminata dall’avversario (che 

giocherà Nash) potrebbe essere più onerosa 

del guadagno con la defezione!

● L’idea è che la ripetizione di situazioni 

conflittuali (quando esistono minacce credibili 

di punizioni) possa generare comportamenti 

cooperativi è alla base del: 

● Es. Un’autorità 

esterna (o un 

fattore esterno) 

costringe a 

cooperare 

Folk Theorem 

→ La cooperazione può avvenire per via: 

Esogena Endogena 

● Con la ripetizione 

la cooperazione si 

impone 

endogenamente 

(anche se non si è 

del tutto sicuri)

→ Si coopera per convenienza economica 

→ L’esito dipende dal gioco se è ripetuto un 

numero: 

Finito 

Infinito 

One-Shot Nash 

Cooperaz. 

Se Finito: Backward-Induction: 

● L’ultimo round cessa la convenienza nel 

giocare cooperativo: non vi è deterrente della 

punizione futura 

● Nel penultimo round non c’è convenienza a 

cooperare dato che nel round successivo si 

avrà una soluzione conflittuale, etc. 

→ Con T Finito → Cooperazione solo se i 

giocatori non sanno con esattezza quando 

avrà termine il gioco

FOLK THEOREM 

→ Giocatori A e B 

→ Punto di vista di A: 

A 

Collabora 

Tradisce 

(Defeziona) 

A e B non 

collaborano 

V COOP 

V DEF 

V NASH 

V DEF > V COOP > V NASH 

● Se al tempo t, A tradisce ottiene il guadagno 

V DEF – V COOP 

● Ma in ogni periodo successivo subirà una 

perdita: l’avversario lo costringerà 

all’equilibrio di Nash 

V COOP – V NASH 

Perdita in ogni 

periodo successivo

A coopera solo se: 

→ L’incremento dell’utilità ottenuto con la 

defezione è inferiore al valore attuale delle 

perdite future: (VAP) per t= 1,2, …. 

VAP = Ʃ t δ t (V COOP -V NASH ) 

Per cooperare: 

Ʃ tδ t (V COOP -V NASH )>(V DEF -V COOP )

NOTA: Proprietà serie geometriche: 

Ʃ ∞ 0δ = 1+δ+δ 2 + … δ i i →∞ 

= 

1 

1- δ 

1 

= 

1- 1 

1+ r 

1 +r 

r 

Inoltre la nostra Ʃ parte da t=1: 

Ʃ ∞ 

t=1 

1 +r 

= 

r 

t 

= 1 +r 

1 +r 

r 

1 

- 

r 1+r 

- 1 = 1/r 

0

VAP = 1 (V COOP -V NASH ) 

r Valore attuale 

Per cooperare: 

delle perdite future 

1 (V COOP -V NASH )>(V DEF -V COOP ) 

r 

r < 

(V COOP -V NASH ) 

(V DEF -V COOP ) 

● Conviene tener fede all’accordo quando si da 

adeguata importanza al futuro (il tasso di 

sconto è abbastanza piccolo e il fattore di 

sconto δ conseguentemente elevato e 

prossimo a 1)

● In tal caso si valutano come onerose 

le perdite. Se il giocatore è molto 

impaziente (ralto δ basso) sarà 

per lui conveniente tradire: 

attribuisce scarso peso alle perdite 

future

ESEMPIO DILEMMA DEL PRIGIONIERO 

b 1 

b 2 

a 1 8, 8 1, 14 

a 2 14, 1 5, 5 

Equilibrio One-Shot: 

(a 2 , b 2) 

→ Se viene ripetuto un numero infinito di volte? 

● Se I defeziona ottiene un guadagno 

immediato di 6 (da 8 a 14). Tuttavia in tutti i 

rounds successivi la sua payoff peggiora di 3 

(da 8 a 5) 

● Al giocatore I conviene confermare l’accordo 

su (a 1 , b 1) se 

6 

< 

Ʃ ∞ 

t=1 

3 

1 

1+r 

(V DEF -V COOP ) (V COOP -V NASH ) 

Guagagno 

immediato 

< 

Perdite 

attualizzate 

t

6 < 3 (1/r) r < ½ 

r < ½ 

È la condizione necessaria affinché nel 

gioco ripetuto (con orizzonte infinito) 

al giocatore I convenga adottare un 

comportamento cooperativo, posto 

che II cooperi

FOLK THEOREM 

INTRODUZIONE 

DELLE 

TRIGGER 

STRATEGIES

→ Dato il fattore di sconto δ il valore attuale di 

una successione infinita di payoff π 1, π 2, π 3 … 

π 1 + δπ 2 + δ 2 π 3 + … Ʃ ∞ δ t-1 π 2 

● Con il fattore di sconto si può intendere un 

gioco ripetuto infinitamente come un gioco 

che termina dopo un numero casuale di 

ripetizioni 

● Alla fine di ogni ripetizione esiste una 

probabilità (p) che il gioco finisca e (1-p) che 

continui per un altro turno 

● Nel prossimo turno la payoff vale: 

(1-p)πδ 

● Tra due turni (qualora entrambi i turni 

vengano giocati), la payoff sarà: 

(1-p) 2 πδ 2

→ Se ridefiniamo: 

δ = (1-p) 

(1+r) 

→ Allora il valore attuale: 

π 1 + δπ 2 + δ 2 π 3 + … 

● Riflette sia lo sconto che l’“eventualità” che il 

gioco abbia termine

Dilemma del Prigioniero 

L 2 

R 2 

L 1 1,1 5,0 

R 1 0,5 4,4 

● Il giocatore (i) inizia il gioco ripetuto 

infinitamente cooperando, e poi 

coopera in ogni turno successivo a 

condizione che entrambi i giocatori 

abbiano cooperato nello stadio 

precedente 

→ (i) gioca R i nel primo stadio 

→ (i) gioca R i nel t-esimo stadio se: 

l’esito dei t-1 stadi precedenti è stato 

(R 1, R 2), altrimenti gioca L i

● Una Trigger Strategy: prescrive che un 

giocatore cooperi fino a quando un 

altro non devia dalla soluzione 

cooperativa 

● Se entrambi usano la Trigger Strategy 

l’esito del gioco è (R 1, R 2) 

● Se (i) adotta la TS anche per il 

giocatore (j) giocare la TS è una 

risposta ottima se δ è 

sufficientemente prossimo all’unità 

● (j) giocando L j otterrà una payoff di 5 

nel primo stadio ma innescherà una 

fase di non cooperazione da parte di 

(i) (e quindi anche di j) così che le 

payoff in ogni stadio futuro saranno 

pari a 1.

Se sceglie L j il valore attuale è: 

5 + δ·1 + δ 2 ·1 + … = 

5 + 

δ 

1- δ 

= V 

● Se invece sceglie R j ottiene una payoff 

di 4 in questo stadio 

● Se V= valore attuale della successione 

infinita delle payoff che (j) riceve con 

tale scelta: 

V= 4 + δ·V 

V = 

4 

(1- δ)

Riassumendo: Nell’esempio del Dilemma del 

Prigioniero 

Devia 

5 + δ·1 + δ 2 ·1 + δ 3 ·1 = 

5 + δ [1 + δ + δ 2 + …] = 

Coopera 

4 + δ·4 + δ 2 ·4 + δ 3 ·4 = 

4 [1 + δ + δ 2 + …] = 1- δ 

→ È ottimo cooperare se: 

4 . 

1 

1- δ 

≥ 

4 

δ 

5 + . 1 

1- δ 

δ 

5 + . 1 

1- δ

→ Giocare R j è ottimo solo se: 

4 

≥ 

1- δ 

→Cioè se δ ≥ ¼. 

5 + 

δ 

1- δ 

→ In ogni stadio per (j) è ottimo 

giocare R j solo se δ ≥ ¼. Qualora 

l’esito in uno stadio sia diverso da 

(R 1, R 2) (j) giocherà L j per sempre: 

Giocare la Trigger Strategy , da parte 

di entrambi i giocatori, in questo 

gioco è un Equilibrio di Nash se e solo 

se δ ≥ ¼

Ricordare: Un Equilibrio di Nash è perfetto 

nei sottogiochi se le strategie dei 

sottogiochi costituiscono un E.N. in 

ogni sottogioco 

● Per mostrare che un E.N. in Trigger 

Strategies del Dilemma del Prigioniero 

ripetuto infinitam. è perfetto nei 

sottogiochi, mostrare che le TS sono 

un E.N. per ogni sottogioco del gioco 

ripetuto 

● Ogni sottogioco di un gioco ripetuto 

infinitamente è identico al gioco nel 

suo complesso 

→ 2 Classi di sottogiochi: 

1. In cui tutti gli stadi precedenti sono (R 1, R 2) 

2. In cui in almeno uno stadio precedente l’esito 

è diverso da (R 1, R 2)

● Le TS nei sottogiochi della prima 

classe sono le TS che si è mostrato 

producono un Equilibrio di Nash per 

l’intero gioco. 

● Le strategie della seconda classe 

producono la ripetizione infinita di (L 1, 

L 2) che è anch’esso un Equilibri di 

Nash per il gioco nel suo complesso. 

● L’Equilibrio di Nash in Trigger 

Strategy del DP ripetuto è perfetto 

nei sottogiochi

Relazione tra tasso di sconto e 

fattore di sconto. 

Nella prima formulazione del Folk Theorem 

abbiamo fornito una soluzione in termini di 

fattore di sconto. Nella formulazione delle 

trigger strategy in termini di tasso di sconto. 

δ = 

1 

1+r

→ Riprendiamo il gioco DP 

≥ 

8 . 

→ NOTA: 

δ = 

8 ≥ 

1 

1- δ 

14 - δ·9 

1 

≥ 

14 + 

(1- δ)14+ δ·5 

1+r 

b 1 

δ = 

2 

3 

b 2 

a 1 8,8 1,14 

a 2 14,1 5,5 

δ 

1- δ 

6 

9 

= 

. 

= 

1 

5 

2 

3 

1+r 

(1+r) 3 

= r 1 

= 

2 

2

COURNOT 

P(Q) = a – Q ; Q = q 1 + q 2 ; 

→ Unico Equilibrio di Nash ogni impresa 

produce 

q i = 

(a-c) 

= q C = q COURNOT 

→NOTA: La quantità aggregata di Equilibrio 

(a-c) 

è maggiore di quella di monopolio 

Le imprese hanno l’incentivo a produrre la metà 

della quantità di monopolio 

3 

2 

q i = 

3 

q m 

2 

q m = 

Questa potrebbe essere la quantità 

su cui accordarsi 

Q < a ; C 

(a-c) 

2

→ Nel Gioco statico non si rispetta questo 

accordo, in un Gioco ripetuto infinitamente? 

● Calcolare i valori di δ per cui le Trigger- 

Strategy adottate dalle imprese costituiscono 

un E.N. perfetto nei sottogiochi: 

● Accordo prevede che si produca q m/2 nel 1 

periodo: nel t-esimo si produce q m/2 se 

entrambe hanno prodotto q m/2 nei t-1 periodi 

altrimenti si produce q c 

● Se entrambe producono q m/2, 

PROFITTO 

Se entrambe producono q C: 

PROFITTO 

π m 

2 

π c 

= 

= 

(a-c) 2 

8 

(a-c) 2 

9

COURNOT – RIPETUTO 

→ NOTA: 

C.P.O. 

πD = a qj – q 2 q 

j – qj 

m 

– c qj 2 

∂(π D) 

∂q j 

qm = a - 2qj - - c 

2 

qm qj = a - - c 

2 

q m = 

(a-c) 

2 

1 

= a - 

(a-c) 

- c 

2 

4 

q j = 

3 (a-c) 

8 

1 

2

π m 

2 

π c 

π D 

= 

= 

= 

(a-c) 2 

8 

(a-c) 2 

9 

9(a-c) 2 

64 

10 

8 

10 

9 

10·9 

64 

π D >π m/2>π c 

= 1.25 

= 1.11 

= 1.40

→ DEVIAZIONE: Se (i) produce q m/2 , (j) può 

massimizzare la sua quantità 

∂(π D) 

∂q j 

q m 

π MAX 

D = (a – qj – – c) qj qj 2 

q j 

= 

3(a-c) 

8 

π D 

= 

9(a-c) 2 

64 

→ La soluzione dove entrambe adottano le TS è 

un Equilibrio di Nash se: 

1 

1- δ 

· 

π m 

2 

≥ 

π d + 

δ 

1- δ 

· π c 

→ Se sostituite i valori πm , πd e πc nella 

si ha: 

9 

δ ≥ 

17 

1 

1- δ 

· 

π m 

2 

≥ 

π d + 

δ 

1- δ 

· π c 

(1) 

(1) 

Deviazione Cournot 

Cooperano sempre 

Nash 

per la metà del 

monopolio 

(Punizione)

SERIE GEOMETRICHE CONVERGENTI 

→ Per ogni valore positivo di p 

1+p+p 2 +p 3 + … p i i →∞ 

→ Converge a: 

1 

1- p 

i →∞

Un gioco ripetuto rappresenta una 

situazione in cui due o più individui 

affrontano esattamente la stessa 

situazione competitiva un numero infinito 

di volte e sempre con informazione 

completa riguardo il comportamento 

passato dei giocatori. 

Una strategia per un giocatore in un gioco 

ripetuto è una regola per determinare la 

sua mossa in ogni round in funzione della 

storia delle mosse che sono state utilizzate 

in ogni precedente round. 

Le due strategie più utilizzate sono grim 

strategy e Tit-for-Tat, entrambi sono 

dette trigger strategy.

E 

C F 

C 5,5 -3,8 

F 8,-3 0,0 

(-3, 8) 

8 

A 

B 

(5, 5) 

-3 O 5 

8 

-3 

gli assi verticali ed orizzontali 

indicano le payoffs, 

rispettivamente, di II e di I. 

C 

F 

(8, -3) 

L’area OEABCF, rappresenta tutte le possibili 

soluzioni se i due giocatori utilizzano le 

possibili combinazioni delle quattro soluzioni 

(5,5), (-3,8), (8,-3) e (0,0)

Se restringiamo il set di strategie a quelle 

nell’area convessa OABC il Folk Theorem 

garantisce che ogni punto in questa area 

convessa è un equilibrio di Nash 

raggiungibile come media delle payoffs del 

gioco ripetuto un numero di volte infinito, 

purché i giocatori non scontino troppo il 

futuro (siano pazienti). 

Questa area mostra l’area di payoffs 

cooperativa (superiore all’equilibrio one-shot 

che produce una payoff di zero per entrambi 

i giocatori). 

L’area piuttosto ampia indica che un DP 

ripetuto infinitamente ha molti Nash. Notare 

che uno di questi è giocare sempre (F,F) in 

ogni ripetizione e uno è invece giocare sempre 

(C,C), entrambi i punti fanno parte del set di 

equilibri della figura.

Il giocatore I annuncia una grim strategy 

(feroce, spietato, truce): gioca C e nel caso 

l’atro giocatore devi da questa soluzione, 

giocherà sempre F. 

Se per II questo annuncio è credibile, allora 

qual è la sua strategia ottimale? 

Se gioca anch’esso sempre C, otterrà una 

sequenza di 5, cui corrisponde un valore 

atteso scontato pari a 5/1-δ 

Se invece, per qualsiasi ragione, non ritiene 

di giocare C, ma optare subito con F, ottiene 

subito un guadagno pari a 8 e poi, 

successivamente, una payoff pari a 0. 

Confrontando i due esiti si nota che la 

risposta ottima dipende dal tasso di sconto, 

in questo caso sappiamo che per valori del 

tasso di sconto almeno uguali a 3/8, 

l’opponente non ha incentivo a giocare né 

ora né mai F. 

In maniera analoga se il giocatore II 

annuncia una grim strategy, giocare sempre 

C.

:Grim vs Tit for Tat strategy 

c d 

C R, R N, T 

D T, N P, P 

DP: R=ricavo; P=punizione; T=tentazione; N=naive. 

C = strategia cooperativa; D =defezione. T>R>P>N. 

TfT: gioca cooperare nella primo round 

e in tutti gli altri rounds gioca la 

strategia usata dell’altro giocatore nel 

round precedente 

Un giocatore coopera nel primo round di 

un DP e, successivamente, si comporta 

in base a quello che ha fatto il suo 

opponente nel precedente round. 

Quindi, una volta constatata la 

defezione, si pratica un immediata e 

reciproca punizione: se tu defezioni in 

questo round io defeziono il round 

successivo.

Grim (spietata) trigger strategy: una 

volta che un giocatore devia dalla 

soluzione cooperativa, l’opponente 

mette in pratica per sempre la 

minaccia punitiva di giocare la 

strategia il cui risultato produce 

l’equilibrio inefficiente.

Con grim trigger strategy, il comportamento 

opportunistico o “deviante” è dissuaso 

quando: 

Dev 

Dev 

c d 

C R, R N, T 

D T, N P, P 

1 

R 

1 

R T ( 1 

T 

T 

T 

P 

R 

P 

T 

T 

) 

1 

coop 

Nash 

R 

P 

P 

R 

T 

T 

T 

R 

P 

T 

P

Con TfT trigger strategy 

Dev 

coop 

coop 

Naive 

T 

R 

R 

N

se un giocatore defeziona in un 

round del gioco e poi gioca 

cooperativo nel round successivo, 

ottiene una payoff di T+δN. Se 

invece il giocatore che defeziona usa 

il TfT (gioca cooperare nella primo 

round e in tutti gli altri rounds gioca 

la strategia usata dell’altro giocatore 

nel round precedente), la sua payoff 

è R+δR. Dopo questi due primi 

round i giocatori ritornano a giocare 

cooperativo negli altri round. La 

defezione è quindi dissuasa se: 

Cioe’: 

R 

Dev 

coop 

R 

T 

coop 

Naive 

N 

T 

R 

R 

N

T 

T 

R 

P 

9 

9 

8 

2 

1 

7 

s g 

a 8, 8 0, 9 

b 9, 0 2, 2 

; 

Nota in questo caso la Grim strategy produce la 

soglia del tasso di sconto più elevata di quella 

della TfT . 

Il deterrente necessario per cooperare in ogni 

round del gioco è supportato dalla strategia grim. 

In questi casi la strategia TfT potrebbe supportare 

la (o forzare alla) cooperazione tra i due giocatori 

per valori del tasso di sconto per cui la strategia 

grim non potrebbe: la TfT produce valori inferiori 

per il tasso di sconto di quelli prodotti dalla grim. 

T 

R 

R 

N 

9 

8 

8 

0 

1 

8

Un DP ripetuto infinitamente ha un infinito 

numero di strategie, ad esempio, 

1) Il giocatore I può giocare TfT e il giocatore II può 

giocare TfT. 


giocare grim. 


giocare sempre C. 


giocare sempre F. 

5) Il giocatore I può giocare grim e il giocatore II 

giocare TfT. 


giocare grim 


giocare sempre C 

………..

Lezione 6 - Brunochiarini.it

Create successful ePaper yourself

Delete template?

Save as template?