Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
7<br />
Analisi Strategica<br />
per la<br />
Pol<strong>it</strong>ica Economica<br />
Parte Sesta<br />
Prof. Bruno Chiarini
Discounting<br />
Tassi di sconto molto piccoli indicano una<br />
valutazione inferiore delle payoff future<br />
rispetto alla payoff corrente (il futuro conta<br />
poco), tassi di sconto vicini ad 1 indicano<br />
valutazioni delle payoffs future pressoché<br />
analoghe a quella corrente (il futuro conta).<br />
Con δ=1 si ha una s<strong>it</strong>uazione di “nodiscounting”.<br />
Payoffs future e quella<br />
corrente sono valutate esattamente allo<br />
stesso modo. Un euro ottenuto nel futuro<br />
vale esattamente un euro di oggi.<br />
Il tasso di sconto δ è legato al fattore di<br />
sconto r (o tasso di interesse) nel seguente<br />
modo: δ=1/1+r. In altri termini, quando<br />
δ=1, ciò significa che r=0. Più il tasso di<br />
interesse è basso (il fattore di sconto è alto)<br />
più l’individuo sconta meno il futuro ed è più<br />
paziente. Per un tasso di sconto δ=1/2, il<br />
tasso di interesse è r=1.
GIOCHI RIPETUTI<br />
Supergioco ≠ Gioco Dinamico<br />
● La ripetizione del<br />
iniziale modifica lo<br />
stock di<br />
informazione degli<br />
agenti ad ogni<br />
round successivo<br />
● Modificano le<br />
strutture dei<br />
payoffs<br />
● Modifica lo spazio<br />
delle strategie<br />
disponibili<br />
→ Non è del tutto inappropriato chiamarli<br />
giochi dinamici
● Mosse → Sequenza di mosse<br />
● Il gioco si estende da:<br />
● Sequenza di payoffs<br />
● L’es<strong>it</strong>o del supergioco è dato dalla somma dei<br />
guadagni scontata (guadagni percep<strong>it</strong>i in ogni<br />
round del supergioco)<br />
● Sconto: esigenza in quanto i guadagni hanno<br />
luogo in tempi diversi. I giocatori sono<br />
“impazienti”: danno un peso diverso (minore)<br />
ai guadagni percep<strong>it</strong>i in futuro<br />
● Per confrontare tali es<strong>it</strong>i occorre perciò<br />
attualizzarli<br />
0 T FINITO<br />
0<br />
∞ INFINITO
● La soluzione del supergioco non è<br />
necessariamente la ripetizione di T volte della<br />
soluzione del gioco iniziale:<br />
→ Es. Giochi riconducibili al Dilemma-<br />
Prigioniero<br />
→ Soluzione One-Shot<br />
Nash (C-C)<br />
→ Soluzione ripetuta potrebbe essere:<br />
[NC-NC] t=1,2, …<br />
● La strategia cooperativa ad ogni round del<br />
gioco può risultare conveniente perchè<br />
altrimenti le perd<strong>it</strong>e causate nel futuro dalla<br />
punizione comminata dall’avversario (che<br />
giocherà Nash) potrebbe essere più onerosa<br />
del guadagno con la defezione!
● L’idea è che la ripetizione di s<strong>it</strong>uazioni<br />
confl<strong>it</strong>tuali (quando esistono minacce credibili<br />
di punizioni) possa generare comportamenti<br />
cooperativi è alla base del:<br />
● Es. Un’autor<strong>it</strong>à<br />
esterna (o un<br />
fattore esterno)<br />
costringe a<br />
cooperare<br />
Folk Theorem<br />
→ La cooperazione può avvenire per via:<br />
Esogena Endogena<br />
● Con la ripetizione<br />
la cooperazione si<br />
impone<br />
endogenamente<br />
(anche se non si è<br />
del tutto sicuri)
→ Si coopera per convenienza economica<br />
→ L’es<strong>it</strong>o dipende dal gioco se è ripetuto un<br />
numero:<br />
Fin<strong>it</strong>o<br />
Infin<strong>it</strong>o<br />
One-Shot Nash<br />
Cooperaz.<br />
Se Fin<strong>it</strong>o: Backward-Induction:<br />
● L’ultimo round cessa la convenienza nel<br />
giocare cooperativo: non vi è deterrente della<br />
punizione futura<br />
● Nel penultimo round non c’è convenienza a<br />
cooperare dato che nel round successivo si<br />
avrà una soluzione confl<strong>it</strong>tuale, etc.<br />
→ Con T Fin<strong>it</strong>o → Cooperazione solo se i<br />
giocatori non sanno con esattezza quando<br />
avrà termine il gioco
FOLK THEOREM<br />
→ Giocatori A e B<br />
→ Punto di vista di A:<br />
A<br />
Collabora<br />
Tradisce<br />
(Defeziona)<br />
A e B non<br />
collaborano<br />
V COOP<br />
V DEF<br />
V NASH<br />
V DEF > V COOP > V NASH<br />
● Se al tempo t, A tradisce ottiene il guadagno<br />
V DEF – V COOP<br />
● Ma in ogni periodo successivo subirà una<br />
perd<strong>it</strong>a: l’avversario lo costringerà<br />
all’equilibrio di Nash<br />
V COOP – V NASH<br />
Perd<strong>it</strong>a in ogni<br />
periodo successivo
A coopera solo se:<br />
→ L’incremento dell’util<strong>it</strong>à ottenuto con la<br />
defezione è inferiore al valore attuale delle<br />
perd<strong>it</strong>e future: (VAP) per t= 1,2, ….<br />
VAP = Ʃ t δ t (V COOP -V NASH )<br />
Per cooperare:<br />
Ʃ tδ t (V COOP -V NASH )>(V DEF -V COOP )
NOTA: Proprietà serie geometriche:<br />
Ʃ ∞ 0δ = 1+δ+δ 2 + … δ i i →∞<br />
=<br />
1<br />
1- δ<br />
1<br />
=<br />
1- 1<br />
1+ r<br />
1 +r<br />
r<br />
Inoltre la nostra Ʃ parte da t=1:<br />
Ʃ ∞<br />
t=1<br />
1 +r<br />
=<br />
r<br />
t<br />
= 1 +r<br />
1 +r<br />
r<br />
1<br />
-<br />
r 1+r<br />
- 1 = 1/r<br />
0
VAP = 1 (V COOP -V NASH )<br />
r Valore attuale<br />
Per cooperare:<br />
delle perd<strong>it</strong>e future<br />
1 (V COOP -V NASH )>(V DEF -V COOP )<br />
r<br />
r <<br />
(V COOP -V NASH )<br />
(V DEF -V COOP )<br />
● Conviene tener fede all’accordo quando si da<br />
adeguata importanza al futuro (il tasso di<br />
sconto è abbastanza piccolo e il fattore di<br />
sconto δ conseguentemente elevato e<br />
prossimo a 1)
● In tal caso si valutano come onerose<br />
le perd<strong>it</strong>e. Se il giocatore è molto<br />
impaziente (ralto δ basso) sarà<br />
per lui conveniente tradire:<br />
attribuisce scarso peso alle perd<strong>it</strong>e<br />
future
ESEMPIO DILEMMA DEL PRIGIONIERO<br />
b 1<br />
b 2<br />
a 1 8, 8 1, 14<br />
a 2 14, 1 5, 5<br />
Equilibrio One-Shot:<br />
(a 2 , b 2)<br />
→ Se viene ripetuto un numero infin<strong>it</strong>o di volte?<br />
● Se I defeziona ottiene un guadagno<br />
immediato di 6 (da 8 a 14). Tuttavia in tutti i<br />
rounds successivi la sua payoff peggiora di 3<br />
(da 8 a 5)<br />
● Al giocatore I conviene confermare l’accordo<br />
su (a 1 , b 1) se<br />
6<br />
<<br />
Ʃ ∞<br />
t=1<br />
3<br />
1<br />
1+r<br />
(V DEF -V COOP ) (V COOP -V NASH )<br />
Guagagno<br />
immediato<br />
<<br />
Perd<strong>it</strong>e<br />
attualizzate<br />
t
6 < 3 (1/r) r < ½<br />
r < ½<br />
È la condizione necessaria affinché nel<br />
gioco ripetuto (con orizzonte infin<strong>it</strong>o)<br />
al giocatore I convenga adottare un<br />
comportamento cooperativo, posto<br />
che II cooperi
FOLK THEOREM<br />
INTRODUZIONE<br />
DELLE<br />
TRIGGER<br />
STRATEGIES
→ Dato il fattore di sconto δ il valore attuale di<br />
una successione infin<strong>it</strong>a di payoff π 1, π 2, π 3 …<br />
π 1 + δπ 2 + δ 2 π 3 + … Ʃ ∞ δ t-1 π 2<br />
● Con il fattore di sconto si può intendere un<br />
gioco ripetuto infin<strong>it</strong>amente come un gioco<br />
che termina dopo un numero casuale di<br />
ripetizioni<br />
● Alla fine di ogni ripetizione esiste una<br />
probabil<strong>it</strong>à (p) che il gioco finisca e (1-p) che<br />
continui per un altro turno<br />
● Nel prossimo turno la payoff vale:<br />
(1-p)πδ<br />
● Tra due turni (qualora entrambi i turni<br />
vengano giocati), la payoff sarà:<br />
(1-p) 2 πδ 2
→ Se ridefiniamo:<br />
δ = (1-p)<br />
(1+r)<br />
→ Allora il valore attuale:<br />
π 1 + δπ 2 + δ 2 π 3 + …<br />
● Riflette sia lo sconto che l’“eventual<strong>it</strong>à” che il<br />
gioco abbia termine
Dilemma del Prigioniero<br />
L 2<br />
R 2<br />
L 1 1,1 5,0<br />
R 1 0,5 4,4<br />
● Il giocatore (i) inizia il gioco ripetuto<br />
infin<strong>it</strong>amente cooperando, e poi<br />
coopera in ogni turno successivo a<br />
condizione che entrambi i giocatori<br />
abbiano cooperato nello stadio<br />
precedente<br />
→ (i) gioca R i nel primo stadio<br />
→ (i) gioca R i nel t-esimo stadio se:<br />
l’es<strong>it</strong>o dei t-1 stadi precedenti è stato<br />
(R 1, R 2), altrimenti gioca L i
● Una Trigger Strategy: prescrive che un<br />
giocatore cooperi fino a quando un<br />
altro non devia dalla soluzione<br />
cooperativa<br />
● Se entrambi usano la Trigger Strategy<br />
l’es<strong>it</strong>o del gioco è (R 1, R 2)<br />
● Se (i) adotta la TS anche per il<br />
giocatore (j) giocare la TS è una<br />
risposta ottima se δ è<br />
sufficientemente prossimo all’un<strong>it</strong>à<br />
● (j) giocando L j otterrà una payoff di 5<br />
nel primo stadio ma innescherà una<br />
fase di non cooperazione da parte di<br />
(i) (e quindi anche di j) così che le<br />
payoff in ogni stadio futuro saranno<br />
pari a 1.
Se sceglie L j il valore attuale è:<br />
5 + δ·1 + δ 2 ·1 + … =<br />
5 +<br />
δ<br />
1- δ<br />
= V<br />
● Se invece sceglie R j ottiene una payoff<br />
di 4 in questo stadio<br />
● Se V= valore attuale della successione<br />
infin<strong>it</strong>a delle payoff che (j) riceve con<br />
tale scelta:<br />
V= 4 + δ·V<br />
V =<br />
4<br />
(1- δ)
Riassumendo: Nell’esempio del Dilemma del<br />
Prigioniero<br />
Devia<br />
5 + δ·1 + δ 2 ·1 + δ 3 ·1 =<br />
5 + δ [1 + δ + δ 2 + …] =<br />
Coopera<br />
4 + δ·4 + δ 2 ·4 + δ 3 ·4 =<br />
4 [1 + δ + δ 2 + …] = 1- δ<br />
→ È ottimo cooperare se:<br />
4 .<br />
1<br />
1- δ<br />
≥<br />
4<br />
δ<br />
5 + . 1<br />
1- δ<br />
δ<br />
5 + . 1<br />
1- δ
→ Giocare R j è ottimo solo se:<br />
4<br />
≥<br />
1- δ<br />
→Cioè se δ ≥ ¼.<br />
5 +<br />
δ<br />
1- δ<br />
→ In ogni stadio per (j) è ottimo<br />
giocare R j solo se δ ≥ ¼. Qualora<br />
l’es<strong>it</strong>o in uno stadio sia diverso da<br />
(R 1, R 2) (j) giocherà L j per sempre:<br />
Giocare la Trigger Strategy , da parte<br />
di entrambi i giocatori, in questo<br />
gioco è un Equilibrio di Nash se e solo<br />
se δ ≥ ¼
Ricordare: Un Equilibrio di Nash è perfetto<br />
nei sottogiochi se le strategie dei<br />
sottogiochi cost<strong>it</strong>uiscono un E.N. in<br />
ogni sottogioco<br />
● Per mostrare che un E.N. in Trigger<br />
Strategies del Dilemma del Prigioniero<br />
ripetuto infin<strong>it</strong>am. è perfetto nei<br />
sottogiochi, mostrare che le TS sono<br />
un E.N. per ogni sottogioco del gioco<br />
ripetuto<br />
● Ogni sottogioco di un gioco ripetuto<br />
infin<strong>it</strong>amente è identico al gioco nel<br />
suo complesso<br />
→ 2 Classi di sottogiochi:<br />
1. In cui tutti gli stadi precedenti sono (R 1, R 2)<br />
2. In cui in almeno uno stadio precedente l’es<strong>it</strong>o<br />
è diverso da (R 1, R 2)
● Le TS nei sottogiochi della prima<br />
classe sono le TS che si è mostrato<br />
producono un Equilibrio di Nash per<br />
l’intero gioco.<br />
● Le strategie della seconda classe<br />
producono la ripetizione infin<strong>it</strong>a di (L 1,<br />
L 2) che è anch’esso un Equilibri di<br />
Nash per il gioco nel suo complesso.<br />
● L’Equilibrio di Nash in Trigger<br />
Strategy del DP ripetuto è perfetto<br />
nei sottogiochi
Relazione tra tasso di sconto e<br />
fattore di sconto.<br />
Nella prima formulazione del Folk Theorem<br />
abbiamo forn<strong>it</strong>o una soluzione in termini di<br />
fattore di sconto. Nella formulazione delle<br />
trigger strategy in termini di tasso di sconto.<br />
δ =<br />
1<br />
1+r
→ Riprendiamo il gioco DP<br />
≥<br />
8 .<br />
→ NOTA:<br />
δ =<br />
8 ≥<br />
1<br />
1- δ<br />
14 - δ·9<br />
1<br />
≥<br />
14 +<br />
(1- δ)14+ δ·5<br />
1+r<br />
b 1<br />
δ =<br />
2<br />
3<br />
b 2<br />
a 1 8,8 1,14<br />
a 2 14,1 5,5<br />
δ<br />
1- δ<br />
6<br />
9<br />
=<br />
.<br />
=<br />
1<br />
5<br />
2<br />
3<br />
1+r<br />
(1+r) 3<br />
= r 1<br />
=<br />
2<br />
2
COURNOT<br />
P(Q) = a – Q ; Q = q 1 + q 2 ;<br />
→ Unico Equilibrio di Nash ogni impresa<br />
produce<br />
q i =<br />
(a-c)<br />
= q C = q COURNOT<br />
→NOTA: La quant<strong>it</strong>à aggregata di Equilibrio<br />
(a-c)<br />
è maggiore di quella di monopolio<br />
Le imprese hanno l’incentivo a produrre la metà<br />
della quant<strong>it</strong>à di monopolio<br />
3<br />
2<br />
q i =<br />
3<br />
q m<br />
2<br />
q m =<br />
Questa potrebbe essere la quant<strong>it</strong>à<br />
su cui accordarsi<br />
Q < a ; C<br />
(a-c)<br />
2
→ Nel Gioco statico non si rispetta questo<br />
accordo, in un Gioco ripetuto infin<strong>it</strong>amente?<br />
● Calcolare i valori di δ per cui le Trigger-<br />
Strategy adottate dalle imprese cost<strong>it</strong>uiscono<br />
un E.N. perfetto nei sottogiochi:<br />
● Accordo prevede che si produca q m/2 nel 1<br />
periodo: nel t-esimo si produce q m/2 se<br />
entrambe hanno prodotto q m/2 nei t-1 periodi<br />
altrimenti si produce q c<br />
● Se entrambe producono q m/2,<br />
PROFITTO<br />
Se entrambe producono q C:<br />
PROFITTO<br />
π m<br />
2<br />
π c<br />
=<br />
=<br />
(a-c) 2<br />
8<br />
(a-c) 2<br />
9
COURNOT – RIPETUTO<br />
→ NOTA:<br />
C.P.O.<br />
πD = a qj – q 2 q<br />
j – qj<br />
m<br />
– c qj 2<br />
∂(π D)<br />
∂q j<br />
qm = a - 2qj - - c<br />
2<br />
qm qj = a - - c<br />
2<br />
q m =<br />
(a-c)<br />
2<br />
1<br />
= a -<br />
(a-c)<br />
- c<br />
2<br />
4<br />
q j =<br />
3 (a-c)<br />
8<br />
1<br />
2
π m<br />
2<br />
π c<br />
π D<br />
=<br />
=<br />
=<br />
(a-c) 2<br />
8<br />
(a-c) 2<br />
9<br />
9(a-c) 2<br />
64<br />
10<br />
8<br />
10<br />
9<br />
10·9<br />
64<br />
π D >π m/2>π c<br />
= 1.25<br />
= 1.11<br />
= 1.40
→ DEVIAZIONE: Se (i) produce q m/2 , (j) può<br />
massimizzare la sua quant<strong>it</strong>à<br />
∂(π D)<br />
∂q j<br />
q m<br />
π MAX<br />
D = (a – qj – – c) qj qj 2<br />
q j<br />
=<br />
3(a-c)<br />
8<br />
π D<br />
=<br />
9(a-c) 2<br />
64<br />
→ La soluzione dove entrambe adottano le TS è<br />
un Equilibrio di Nash se:<br />
1<br />
1- δ<br />
·<br />
π m<br />
2<br />
≥<br />
π d +<br />
δ<br />
1- δ<br />
· π c<br />
→ Se sost<strong>it</strong>u<strong>it</strong>e i valori πm , πd e πc nella<br />
si ha:<br />
9<br />
δ ≥<br />
17<br />
1<br />
1- δ<br />
·<br />
π m<br />
2<br />
≥<br />
π d +<br />
δ<br />
1- δ<br />
· π c<br />
(1)<br />
(1)<br />
Deviazione Cournot<br />
Cooperano sempre<br />
Nash<br />
per la metà del<br />
monopolio<br />
(Punizione)
SERIE GEOMETRICHE CONVERGENTI<br />
→ Per ogni valore pos<strong>it</strong>ivo di p<br />
1+p+p 2 +p 3 + … p i i →∞<br />
→ Converge a:<br />
1<br />
1- p<br />
i →∞
Un gioco ripetuto rappresenta una<br />
s<strong>it</strong>uazione in cui due o più individui<br />
affrontano esattamente la stessa<br />
s<strong>it</strong>uazione compet<strong>it</strong>iva un numero infin<strong>it</strong>o<br />
di volte e sempre con informazione<br />
completa riguardo il comportamento<br />
passato dei giocatori.<br />
Una strategia per un giocatore in un gioco<br />
ripetuto è una regola per determinare la<br />
sua mossa in ogni round in funzione della<br />
storia delle mosse che sono state utilizzate<br />
in ogni precedente round.<br />
Le due strategie più utilizzate sono grim<br />
strategy e T<strong>it</strong>-for-Tat, entrambi sono<br />
dette trigger strategy.
E<br />
C F<br />
C 5,5 -3,8<br />
F 8,-3 0,0<br />
(-3, 8)<br />
8<br />
A<br />
B<br />
(5, 5)<br />
-3 O 5<br />
8<br />
-3<br />
gli assi verticali ed orizzontali<br />
indicano le payoffs,<br />
rispettivamente, di II e di I.<br />
C<br />
F<br />
(8, -3)<br />
L’area OEABCF, rappresenta tutte le possibili<br />
soluzioni se i due giocatori utilizzano le<br />
possibili combinazioni delle quattro soluzioni<br />
(5,5), (-3,8), (8,-3) e (0,0)
Se restringiamo il set di strategie a quelle<br />
nell’area convessa OABC il Folk Theorem<br />
garantisce che ogni punto in questa area<br />
convessa è un equilibrio di Nash<br />
raggiungibile come media delle payoffs del<br />
gioco ripetuto un numero di volte infin<strong>it</strong>o,<br />
purché i giocatori non scontino troppo il<br />
futuro (siano pazienti).<br />
Questa area mostra l’area di payoffs<br />
cooperativa (superiore all’equilibrio one-shot<br />
che produce una payoff di zero per entrambi<br />
i giocatori).<br />
L’area piuttosto ampia indica che un DP<br />
ripetuto infin<strong>it</strong>amente ha molti Nash. Notare<br />
che uno di questi è giocare sempre (F,F) in<br />
ogni ripetizione e uno è invece giocare sempre<br />
(C,C), entrambi i punti fanno parte del set di<br />
equilibri della figura.
Il giocatore I annuncia una grim strategy<br />
(feroce, spietato, truce): gioca C e nel caso<br />
l’atro giocatore devi da questa soluzione,<br />
giocherà sempre F.<br />
Se per II questo annuncio è credibile, allora<br />
qual è la sua strategia ottimale?<br />
Se gioca anch’esso sempre C, otterrà una<br />
sequenza di 5, cui corrisponde un valore<br />
atteso scontato pari a 5/1-δ<br />
Se invece, per qualsiasi ragione, non r<strong>it</strong>iene<br />
di giocare C, ma optare sub<strong>it</strong>o con F, ottiene<br />
sub<strong>it</strong>o un guadagno pari a 8 e poi,<br />
successivamente, una payoff pari a 0.<br />
Confrontando i due es<strong>it</strong>i si nota che la<br />
risposta ottima dipende dal tasso di sconto,<br />
in questo caso sappiamo che per valori del<br />
tasso di sconto almeno uguali a 3/8,<br />
l’opponente non ha incentivo a giocare né<br />
ora né mai F.<br />
In maniera analoga se il giocatore II<br />
annuncia una grim strategy, giocare sempre<br />
C.
:Grim vs T<strong>it</strong> for Tat strategy<br />
c d<br />
C R, R N, T<br />
D T, N P, P<br />
DP: R=ricavo; P=punizione; T=tentazione; N=naive.<br />
C = strategia cooperativa; D =defezione. T>R>P>N.<br />
TfT: gioca cooperare nella primo round<br />
e in tutti gli altri rounds gioca la<br />
strategia usata dell’altro giocatore nel<br />
round precedente<br />
Un giocatore coopera nel primo round di<br />
un DP e, successivamente, si comporta<br />
in base a quello che ha fatto il suo<br />
opponente nel precedente round.<br />
Quindi, una volta constatata la<br />
defezione, si pratica un immediata e<br />
reciproca punizione: se tu defezioni in<br />
questo round io defeziono il round<br />
successivo.
Grim (spietata) trigger strategy: una<br />
volta che un giocatore devia dalla<br />
soluzione cooperativa, l’opponente<br />
mette in pratica per sempre la<br />
minaccia pun<strong>it</strong>iva di giocare la<br />
strategia il cui risultato produce<br />
l’equilibrio inefficiente.
Con grim trigger strategy, il comportamento<br />
opportunistico o “deviante” è dissuaso<br />
quando:<br />
Dev<br />
Dev<br />
c d<br />
C R, R N, T<br />
D T, N P, P<br />
1<br />
R<br />
1<br />
R T ( 1<br />
T<br />
T<br />
T<br />
P<br />
R<br />
P<br />
T<br />
T<br />
)<br />
1<br />
coop<br />
Nash<br />
R<br />
P<br />
P<br />
R<br />
T<br />
T<br />
T<br />
R<br />
P<br />
T<br />
P
Con TfT trigger strategy<br />
Dev<br />
coop<br />
coop<br />
Naive<br />
T<br />
R<br />
R<br />
N
se un giocatore defeziona in un<br />
round del gioco e poi gioca<br />
cooperativo nel round successivo,<br />
ottiene una payoff di T+δN. Se<br />
invece il giocatore che defeziona usa<br />
il TfT (gioca cooperare nella primo<br />
round e in tutti gli altri rounds gioca<br />
la strategia usata dell’altro giocatore<br />
nel round precedente), la sua payoff<br />
è R+δR. Dopo questi due primi<br />
round i giocatori r<strong>it</strong>ornano a giocare<br />
cooperativo negli altri round. La<br />
defezione è quindi dissuasa se:<br />
Cioe’:<br />
R<br />
Dev<br />
coop<br />
R<br />
T<br />
coop<br />
Naive<br />
N<br />
T<br />
R<br />
R<br />
N
T<br />
T<br />
R<br />
P<br />
9<br />
9<br />
8<br />
2<br />
1<br />
7<br />
s g<br />
a 8, 8 0, 9<br />
b 9, 0 2, 2<br />
;<br />
Nota in questo caso la Grim strategy produce la<br />
soglia del tasso di sconto più elevata di quella<br />
della TfT .<br />
Il deterrente necessario per cooperare in ogni<br />
round del gioco è supportato dalla strategia grim.<br />
In questi casi la strategia TfT potrebbe supportare<br />
la (o forzare alla) cooperazione tra i due giocatori<br />
per valori del tasso di sconto per cui la strategia<br />
grim non potrebbe: la TfT produce valori inferiori<br />
per il tasso di sconto di quelli prodotti dalla grim.<br />
T<br />
R<br />
R<br />
N<br />
9<br />
8<br />
8<br />
0<br />
1<br />
8
Un DP ripetuto infin<strong>it</strong>amente ha un infin<strong>it</strong>o<br />
numero di strategie, ad esempio,<br />
1) Il giocatore I può giocare TfT e il giocatore II può<br />
giocare TfT.<br />
2) Il giocatore I può giocare TfT e il giocatore II può<br />
giocare grim.<br />
3) Il giocatore I può giocare TfT e il giocatore II può<br />
giocare sempre C.<br />
4) Il giocatore I può giocare TfT e il giocatore II può<br />
giocare sempre F.<br />
5) Il giocatore I può giocare grim e il giocatore II<br />
giocare TfT.<br />
6) Il giocatore I può giocare grim e il giocatore II<br />
giocare grim<br />
7) Il giocatore I può giocare grim e il giocatore II<br />
giocare sempre C<br />
………..