2. Giochi con mosse sequenziali - utenti
2. Giochi con mosse sequenziali - utenti
2. Giochi con mosse sequenziali - utenti
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>2.</strong> <strong>Giochi</strong> <strong>con</strong> <strong>mosse</strong> <strong>sequenziali</strong><br />
<strong>2.</strong>1. Esempi di giochi <strong>con</strong> <strong>mosse</strong> <strong>sequenziali</strong> e <strong>con</strong> informazione perfetta<br />
La dama, gli scacchi, il filetto sono esempi di giochi <strong>con</strong> <strong>mosse</strong><br />
<strong>sequenziali</strong> (c’è un preciso ordine in cui i giocatori eseguono le <strong>mosse</strong>) <strong>con</strong><br />
informazione perfetta e senza intervento della Fortuna.<br />
“Informazione perfetta” significa che in ogni punto del gioco in cui un<br />
qualsiasi giocatore ha la mossa, egli <strong>con</strong>osce tutto ciò che riguarda lo<br />
svolgimento del gioco fino a quel punto.<br />
In ciascuno dei giochi sopra citati non interviene alcun elemento aleatorio<br />
(lanci di monete o di dadi, ecc.). Se però facciamo precedere l’inizio di una<br />
partita a scacchi dal lancio di una moneta, per decidere a chi spetta il<br />
bianco, otteniamo un esempio di gioco <strong>con</strong> informazione perfetta e <strong>con</strong><br />
intervento della Fortuna.<br />
Si noti che una <strong>con</strong>dizione necessaria (ma non sufficiente) perché una<br />
situazione possa venire modellata come gioco <strong>con</strong> informazione perfetta è<br />
che essa non preveda la presenza di <strong>mosse</strong> simultanee dei giocatori.<br />
<strong>2.</strong><strong>2.</strong> L’albero del gioco<br />
Le regole di un gioco <strong>con</strong> <strong>mosse</strong> <strong>sequenziali</strong> devono precisare (almeno) i<br />
seguenti aspetti:<br />
i) chi sono i giocatori;<br />
ii) quando spetta a ciascuno di muovere<br />
iii) quali sono le azioni tra cui un giocatore può scegliere quando è il<br />
suo turno;<br />
iv) di quali informazioni dispone ciascun giocatore nei turni di sua<br />
spettanza [se ciascuno, in ogni suo turno, <strong>con</strong>osce tutto ciò che è<br />
avvenuto sino a quel punto, si dice che il gioco ha informazione<br />
perfetta];<br />
v) quali sono i possibili esiti fisici del gioco e quanto ciascun<br />
giocatore ne ottiene (quest’ultimo punto verrà chiarito nel<br />
seguito).<br />
L’albero del gioco. La struttura formale per una rappresentazione del<br />
gioco che <strong>con</strong>tenga i suddetti aspetti è l’albero del gioco.<br />
1
Un albero è un grafo orientato, <strong>con</strong>nesso e senza cicli. Ricordiamo che un<br />
grafo è semplicemente un insieme di punti (detti nodi) e di segmenti (detti<br />
archi) che collegano alcune coppie di punti.<br />
Un albero ha un nodo (unico), detto radice dell’albero, da cui parte la prima<br />
mossa del gioco. È caratterizzato graficamente dal fatto di non avere nodi<br />
predecessori nel senso delle frecce.<br />
I nodi diversi dalla radice si distinguono in nodi non terminali e nodi<br />
terminali. Ciascun nodo non terminale ha un solo predecessore (ossia<br />
riceve una sola freccia) e da esso si dipartono uno o più archi, che<br />
rappresentano le azioni (“<strong>mosse</strong>”) a disposizione del giocatore che ha la<br />
mossa in quel nodo. Quindi ogni nodo non terminale rappresenta un punto<br />
di decisione di un giocatore (nell’albero precedente il giocatore che ha la<br />
mossa nella radice dell’albero ha ivi a disposizione le azioni l ed r).<br />
2
I nodi terminali corrispondono ai possibili esiti finali del gioco. In questi<br />
primi esempi saranno etichettati semplicemente <strong>con</strong> gli esiti fisici del<br />
gioco, ma in seguito verranno etichettati coi pagamenti in utilità che<br />
ciascun giocatore riceve dall’esito fisico del gioco.<br />
Ed ora completiamo, in modo arbitrario, l’albero precedente in modo da<br />
far sì che esso rappresenti un gioco <strong>con</strong> due giocatori e <strong>con</strong> <strong>mosse</strong><br />
<strong>sequenziali</strong>. I due giocatori saranno chiamati I (Primo) e II (Se<strong>con</strong>da).<br />
Ciascun nodo non terminale è assegnato a I oppure a II. A I sono<br />
assegnati il nodo iniziale indicato <strong>con</strong> a e un se<strong>con</strong>do nodo, indicato <strong>con</strong> b<br />
(la scelta delle lettere per indicare i nodi è importante per evitare<br />
<strong>con</strong>fusione nel seguito). A II sono assegnati i due nodi indicati <strong>con</strong> c e d.<br />
Le azioni di I in a e in b sono indicate <strong>con</strong> l ed r. Questo non significa che I<br />
ha a disposizione in b le stesse scelte che ha a disposizione in a, ma solo<br />
che ha a disposizione sia in a che in b due possibili scelte. Le azioni di II<br />
sono due in c, indicate <strong>con</strong> L ed R e tre in d indicate <strong>con</strong> L, M, R.<br />
Si noti che per non appesantire il disegno dell’albero abbiamo evitato l’uso<br />
delle frecce, essendo dato per s<strong>con</strong>tato il verso di percorrenza dell’albero,<br />
dalla radice, indicata <strong>con</strong> a, ai nodi terminali (che qualche autore chiama<br />
“foglie”). In seguito utilizzeremo le frecce, ma <strong>con</strong> un significato speciale,<br />
come si vedrà.<br />
Supponiamo che il gioco possa terminare o <strong>con</strong> la vittoria di I e la<br />
s<strong>con</strong>fitta di II, esito che, per semplicità indicheremo semplicemente <strong>con</strong> V,<br />
anziché <strong>con</strong> la notazione più completa (V, S), oppure <strong>con</strong> la s<strong>con</strong>fitta di I e<br />
la vittoria di II che indicheremo semplicemente <strong>con</strong> S anziché <strong>con</strong> (S, V).<br />
3
L’obiettivo di ciascun giocatore è di vincere ogni singola partita ossia le<br />
preferenze dei giocatori, <strong>con</strong> la <strong>con</strong>venzione adottata sopra, sono<br />
S I V e S II V<br />
e tali preferenze sono <strong>con</strong>oscenza comune.<br />
Cerchiamo ora di disegnare l’albero di due giochi molto noti, il Filetto<br />
(tic-tac-toe) e il Nim.<br />
Il Filetto. Su una tavola 3x3 I e II collocano a <strong>mosse</strong> alternate il<br />
proprio simbolo (x e o).<br />
Vince chi realizza per primo un filetto in orizzontale, verticale<br />
o diagonale.<br />
È anche possibile che la tavola venga riempita senza che sia stato realizzato<br />
alcun filetto e in questo caso la partita è pari. Con la <strong>con</strong>venzione usata in<br />
precedenza di riferire l’esito al giocatore I indichiamo i possibili esiti <strong>con</strong><br />
V, S, P (P = patta sta per (P, P)) che indicano vittoria di I, s<strong>con</strong>fitta di I,<br />
patta. Le preferenze sono allora<br />
S I P I V e S II P II V .<br />
All’atto della mossa iniziale I ha 9 scelte; la mossa successiva spetta a II<br />
che, per ogni possibile scelta iniziale di I, ha 8 risposte. Poi la mossa<br />
seguente è di nuovo di I che in ognuno dei 9 · 8 = 72 nodi di decisione ha 7<br />
possibili <strong>mosse</strong> e così via. Solo dopo 5 turni di gioco ci sono alcuni nodi<br />
terminali ed alcune partite si protraggono fino al riempimento completo<br />
della tavola. L’albero del gioco è piuttosto grande (è piuttosto difficile<br />
calcolare il numero totale di nodi dell’albero).<br />
Tuttavia semplici <strong>con</strong>siderazioni sono sufficienti per vedere che, a gioco<br />
corretto, la partita è patta. Intanto nella mossa iniziale I ha in realtà soltanto<br />
3 scelte realmente diverse: collocare il suo segno al centro (la mossa da<br />
preferire poiché <strong>con</strong>trolla ben 4 filetti) oppure in uno dei quattro angoli<br />
(ciascuno di essi è equivalente) oppure in una casa di lato. Se I<br />
muove al centro a II per assicurarsi almeno la patta basta<br />
collocare il suo simbolo in una casa d’angolo (perde, a gioco<br />
corretto, la scelta di una casa di lato) e poi bloccare ogni<br />
o x<br />
o<br />
tentativo di filetto dell’avversario. Se I inizia scegliendo un angolo oppure<br />
una casa di lato, II si può assicurare la patta occupando il centro e poi<br />
<strong>con</strong>tinuando come indicato in precedenza.<br />
4
Nim. Ci sono due o più file di cerini (o monete, o altro ancora) e ciascuna<br />
fila <strong>con</strong>tiene un numero arbitrario di cerini. Due giocatori I e II muovono<br />
alternativamente. Ogni mossa <strong>con</strong>siste nel togliere da una qualsiasi delle<br />
file uno o più cerini (anche tutti). L’ultimo a togliere cerini vince.<br />
Chiaramente il Nim non può finire in parità: l’uno o l’altro giocatore deve<br />
togliere l’ultimo cerino e vincere.<br />
Nella figura che segue è disegnato l’albero del Nim 1-2-1. I nodi terminali<br />
sono etichettati <strong>con</strong> V (vittoria di I) oppure <strong>con</strong> S (s<strong>con</strong>fitta di I).<br />
6
<strong>2.</strong>3. Strategie pure<br />
Quando un gioco <strong>con</strong> <strong>mosse</strong> <strong>sequenziali</strong> viene rappresentato mediante un<br />
albero, si dice che esso è rappresentato in forma estesa.<br />
In un gioco in forma estesa e <strong>con</strong> informazione perfetta una strategia pura<br />
del giocatore i è una regola (o piano completo di azione) che specifica<br />
un’azione in ogni nodo di decisione del giocatore i (in ciascuno cioè dei<br />
nodi dell’albero in cui, in base alle regole del gioco, può essere chiamato ad<br />
operare se il nodo viene realmente raggiunto).<br />
Se tutti i giocatori (due o più) scelgono una strategia pura e la attuano, ciò<br />
determina univocamente, in un gioco senza intervento della Fortuna, lo<br />
svolgimento di una partita.<br />
Riferendoci, a titolo di esempio, al gioco G di pagina 3, il giocatore I<br />
deve operare una scelta tra due alternative sia nel nodo a che nel nodo b. Le<br />
sue strategie pure sono dunque 2 · 2 = 4 e precisamente<br />
ll, lr, rl, rr.<br />
Per esempio, lr significa che I sceglie l in a ed r in b. Si noti che se I<br />
sceglie l in a, è impossibile che venga raggiunto il nodo b, qualunque scelta<br />
operi II.<br />
Tuttavia la definizione formale di strategia pura richiede la specificazione<br />
di un’azione anche nel nodo b, benché l’azione scelta in b non abbia<br />
influenza sulla partita.<br />
Il giocatore II deve scegliere nei nodi c e d e, come appare dall’albero, ha a<br />
disposizione 2 · 3 = 6 strategie pure e precisamente<br />
LL, LM, LR, RL, RM, RR.<br />
La scelta di una strategia di I e di una di II determina una partita, che dà<br />
luogo ad un percorso dalla radice dell’albero fino ad un nodo terminale.<br />
Per esempio, nel gioco G la coppia (o “profilo”) di strategie pure (rl, RL)<br />
dà luogo alla partita<br />
[rLl]<br />
che ha come esito la s<strong>con</strong>fitta di I.<br />
Si noti che una stessa partita può derivare da più coppie (s, t) di strategie<br />
pure, indicando <strong>con</strong> s una strategia pura di I e <strong>con</strong> t una strategia pura di II.<br />
Nel nostro esempio, anche la coppia di strategie pure (rl, LL) dà luogo alla<br />
partita [rLl].<br />
<strong>2.</strong>4. L’algoritmo di analisi a ritroso<br />
Il metodo di analisi a ritroso <strong>con</strong>siste nel partire dalla fine e risalire<br />
l’albero del gioco fino alla radice, scegliendo in ogni nodo l’azione<br />
ottimale per il giocatore che ha la mossa. Tale metodo è anche chiamato<br />
7
“algoritmo di Zermelo” perché può essere utilizzato per dimostrare il<br />
teorema di Zermelo.<br />
Illustriamo in dettaglio il metodo utilizzando il gioco G del nostro<br />
esempio guida, ma, come vedremo in seguito, esso può essere applicato a<br />
un qualunque gioco in forma estesa <strong>con</strong> informazione perfetta.<br />
Sottogiochi di un gioco <strong>con</strong> informazione perfetta. In un gioco in forma<br />
estesa <strong>con</strong> informazione perfetta, ogni nodo x non terminale determina un<br />
sottogioco, costituito dal nodo x stesso e da tutti i nodi che lo seguono<br />
sull’albero. Il gioco stesso è un sottogioco di se stesso.<br />
Nel nostro esempio guida, il gioco G ha tre sottogiochi propri (cioè diversi<br />
da se stesso) G 1, G 2, G 3 che hanno radice nei nodi b, c, d rispettivamente.<br />
Diciamo che un sottogioco H di G ha valore V, e scriviamo v(H) = V, se in<br />
H il giocatore I ha una strategia che vince (porta all’esito V), qualunque<br />
strategia usi II. Analogamente, v(H) = S se II ha una strategia che vince<br />
(porta all’esito S), qualunque strategia usi I. Si noti che, a priori, non è<br />
ovvio che una di queste due alternative debba essere vera.<br />
Analizzando a ritroso il gioco G. Iniziamo la nostra analisi del gioco G,<br />
partendo dai nodi “prefinali” 1 b e c, che sono radici dei sottogiochi (di G)<br />
ad un solo giocatore G 1 e G <strong>2.</strong><br />
In G 1, ossia nel nodo b, la mossa spetta a I che sceglie r e vince. Quindi<br />
v(G 1) = V.<br />
In G 2, ossia nel nodo c, la mossa spetta a II che sceglie L e vince. Quindi<br />
v(G 2) = S.<br />
Ora <strong>con</strong>sideriamo il gioco G', che si ottiene sostituendo il sottogioco G 1<br />
<strong>con</strong> un nodo terminale etichettato col valore V ed il sottogioco G 2 <strong>con</strong> un<br />
nodo terminale etichettato col valore S.<br />
1 Un nodo è “prefinale” se è seguito soltanto da nodi terminali.<br />
8
Notiamo che, se I ha una strategia s' che vince comunque in G', allora I ha<br />
una strategia s che vince in G.<br />
Infatti, quale che sia la strategia usata da II, l’utilizzo di s' da parte di I dà<br />
luogo ad una partita di G' che si <strong>con</strong>clude in un nodo terminale x di G'<br />
etichettato <strong>con</strong> V. Tale nodo x o è esso stesso un nodo terminale anche di G<br />
ed allora s = s' è una strategia vincente in G oppure è la radice di un<br />
sottogioco G x di G <strong>con</strong> v(G x) = V. In questo se<strong>con</strong>do caso I ha una strategia<br />
vincente s x nel sottogioco G x, da cui segue che I ha una strategia vincente s<br />
in G che <strong>con</strong>siste nel giocare s' in G' e <strong>con</strong>tinuando poi col giocare s x in G x.<br />
Analogamente se II ha una strategia vincente t' in G', ella ha una strategia<br />
vincente in G.<br />
In <strong>con</strong>clusione, se G' ha un valore, lo ha anche G e si ha v(G') = v(G).<br />
Ora <strong>con</strong>sideriamo il gioco G'' che si ottiene da G' osservando che G' ha un<br />
unico nodo prefinale, precisamente d, e sostituendo il sottogioco G' 1 (di G')<br />
cha ha radice d <strong>con</strong> un nodo terminale etichettato col suo valore e cioè <strong>con</strong><br />
V (dal momento che II perde in G' 1 qualche che sia la sua scelta).<br />
9
Ragionando come prima si trae che se G'' ha un valore anche G' ha un<br />
valore e v(G'') = v(G').<br />
In <strong>con</strong>clusione se G'' ha un valore si ha<br />
v(G'') = v(G') = v(G).<br />
Ma G'' è un gioco ad un solo giocatore in cui I vince scegliendo r e dunque<br />
v(G'') = v(G') = v(G) = V.<br />
Il procedimento ora descritto può essere utilizzato nel caso di un qualsiasi<br />
gioco <strong>con</strong> informazione perfetta che abbia i due soli possibili esiti di<br />
vittoria e s<strong>con</strong>fitta.<br />
Un tale gioco ha necessariamente valore V oppure S.<br />
Generalizzeremo tale risultato ma ora ci proponiamo di determinare una<br />
strategia vincente di I in G.<br />
Il modo migliore di fare ciò <strong>con</strong>siste nell’evidenziare graficamente il<br />
procedimento di analisi a ritroso.<br />
A tale scopo riprendiamo l’albero del gioco G e cominciamo dai nodi<br />
prefinali b e c, marcando <strong>con</strong> una freccia gli archi corrispondenti a strategie<br />
ottimali. In alternativa si possono cancellare (“potare”) gli archi (“rami”)<br />
corrispondenti a strategie non ottimali. [In figura sono usati entrambi i<br />
procedimenti.]<br />
Poi, andando all’indietro e sostituendo mentalmente i nodi b e c coi loro<br />
valori (V ed S) marchiamo <strong>con</strong> la freccia, in corrispondenza ai nuovi nodi<br />
prefinali (in realtà uno solo), gli archi corrispondenti a strategie ottimali e<br />
così via fino a pervenire alla radice.<br />
10
Una strategia pura vincente di I si legge direttamente nella figura ed è rr.<br />
Per II le strategie ottimali sono tutte le strategie della forma RX (R nel nodo<br />
c, ma qualunque azione in d). Se, ad esempio, I sceglie rr e II sceglie RL ne<br />
deriva la partita [rLr].<br />
<strong>2.</strong>5. Risoluzione del gioco del Nim mediante <strong>con</strong>siderazioni di teoria dei<br />
numeri<br />
Il Nim è un gioco sequenziale <strong>con</strong> informazione perfetta che può<br />
terminare in due soli modi, vittoria o s<strong>con</strong>fitta di I e dunque ha valore V o<br />
S. Ciò dipende dal numero di file e di cerini nelle varie file.<br />
È facile tradurre in pratica il procedimento precedente nel caso del Nim 1-<br />
2-1 di cui abbiamo disegnato in precedenza l’albero. In realtà, basta al<br />
giocatore I togliere entrambi i cerini della fila <strong>con</strong> due per assicurarsi la<br />
vittoria.<br />
Però se ci sono almeno tre file e molti cerini per fila, l’albero è troppo<br />
grande per poterlo costruire manualmente.<br />
Tuttavia, nel caso del Nim, esiste un elegante metodo numerico che evita la<br />
necessità di costruire l’albero del gioco. Lo illustriamo nel caso del Nim 9-<br />
4-3, ma il procedimento ha carattere generale (C. Bouton, 1901).<br />
Nella figura seguente il numero di cerini di ogni fila viene indicato prima<br />
<strong>con</strong> file di punti, poi in notazione decimale, poi in notazione binaria.<br />
• • • • • • • • • 9 1 0 0 1<br />
• • • • 4 0 1 0 0<br />
• • • 3 0 0 1 1<br />
11
(Gli zeri che precedono 100 nella se<strong>con</strong>da riga ed 11 nella terza servono<br />
per far sì che ogni colonna abbia lo stesso numero di cifre.)<br />
Una posizione del Nim è detta bilanciata se ogni colonna della<br />
rappresentazione binaria ha un numero pari di 1, mentre è detta sbilanciata<br />
in caso <strong>con</strong>trario. La posizione iniziale del Nim 9-4-3 è sbilanciata perché<br />
la prima colonna (in realtà anche la se<strong>con</strong>da e la terza) ha un numero<br />
dispari di 1.<br />
Notiamo i seguenti fatti:<br />
a) Ogni mossa ammissibile del Nim trasforma una posizione bilanciata<br />
in una posizione sbilanciata. Infatti, nella rappresentazione binaria<br />
della fila dalla quale si tolgono cerini, almeno una cifra 1 viene<br />
trasformata nella cifra 0.<br />
b) Purché ci siano almeno due file di cerini (non vuote) è sempre<br />
possibile togliendo il numero giusto di cerini trasformare una<br />
posizione sbilanciata in una posizione bilanciata.<br />
c) Il giocatore che muove in una posizione bilanciata non può vincere<br />
in una sola mossa, dal momento che ci sono almeno due file non<br />
vuote di cerini.<br />
Ne segue che uno dei due giocatori ha una strategia vincente il cui filo<br />
logico <strong>con</strong>duttore è quello di lasciare costantemente l’avversario <strong>con</strong> una<br />
posizione bilanciata.<br />
Se la <strong>con</strong>figurazione iniziale dei cerini è sbilanciata (come nel caso del<br />
Nim 9-4-3) è I che ha una strategia vincente, mentre se è bilanciata è II che<br />
ha una strategia vincente.<br />
Di seguito indichiamo un possibile svolgimento di una partita del Nim 9-<br />
4-3, in cui I usa una strategia vincente mentre II fa delle <strong>mosse</strong> qualunque.<br />
1 0 0 1 0 1 1 1 0 1 1 1 0 0 1 0 0 0 1 0<br />
0 1 0 0 → I<br />
0 1 0 0 → II<br />
0 0 0 1 → I<br />
0 0 0 1 → II<br />
0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1<br />
0 0 0 1<br />
0 0 1 0<br />
↓ I<br />
0 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0<br />
vince ← I<br />
← II<br />
← I<br />
← II<br />
0 0 0 1 0 0 0 1 0 0 1 0<br />
<strong>2.</strong>6. Il teorema di Zermelo (1913)<br />
Abbiamo visto che il gioco G del nostro esempio guida ha un valore. È<br />
chiaro che l’argomentazione usata, e cioè l’uso dell’algoritmo di Zermelo,<br />
12
funziona <strong>con</strong> qualsiasi gioco <strong>con</strong> informazione perfetta strettamente<br />
competitivo <strong>con</strong> due soli possibili esiti (V, S) ed (S, V). Ci chiediamo se<br />
funziona anche nel caso in cui gli esiti siano più di due (per esempio negli<br />
scacchi e nel filetto gli esiti possibili sono tre).<br />
Intanto precisiamo il <strong>con</strong>cetto di gioco strettamente competitivo. In<br />
termini di preferenze ciò significa che, per ogni due esiti distinti a e b<br />
a I b<br />
⇔ a II b .<br />
[Se nel gioco interviene la Fortuna questa definizione va rafforzata.]<br />
Gli obiettivi dei due giocatori sono perciò diametralmente opposti.<br />
Valore di un gioco strettamente competitivo <strong>con</strong> k ≥ 2 esiti.<br />
Sia G un gioco finito, a due persone, <strong>con</strong> informazione perfetta,<br />
strettamente competitivo e senza intervento della Fortuna e U = {u1, u2, …,<br />
uk} l’insieme degli esiti che pensiamo etichettati in modo tale che u1 I u2 I … I uk (escludiamo, per semplicità, che ci siano degli esiti che I<br />
giudica equivalenti). Quindi dato che il gioco G è supposto strettamente<br />
competitivo si ha u1 II u2 II … II uk .<br />
Diciamo che un esito v ∈ U è il valore del gioco se I può forzare l’esito del<br />
gioco nell’insieme<br />
{u<br />
∈ U | u I v}<br />
e II può forzare l’esito del gioco nell’insieme<br />
{u<br />
∈ U | u II v} = {u<br />
come illustrato nello schema seguente<br />
∈ U | u I v}<br />
I può forzare l’esito qui<br />
<br />
u1 u2 … v = uj uj+1 … uk <br />
II può forzare l’esito qui<br />
13
Teorema. (Zermelo, 1913) Ogni gioco a due persone, finito 2 , strettamente<br />
competitivo, <strong>con</strong> informazione perfetta e senza intervento del caso, ha un<br />
valore.<br />
In realtà, Zermelo dimostrò il teorema nel caso particolare del gioco degli<br />
scacchi. In tale caso il senso del teorema di Zermelo è il seguente:<br />
• o il Bianco ha una strategia vincente;<br />
• o il Nero ha una strategia vincente;<br />
• o il Bianco ha una strategia che gli assicura almeno la patta e<br />
<strong>con</strong>temporaneamente il Nero ha una strategia che gli assicura almeno<br />
la patta.<br />
Se fosse possibile utilizzare l’algoritmo di Zermelo nell’albero degli<br />
scacchi, si potrebbe vedere quale di queste tre alternative è quella giusta e<br />
quindi se il valore del gioco degli scacchi è V, S oppure P (esiti riferiti al<br />
Bianco).<br />
Ma l’albero degli scacchi è così spropositatamente grande che, anche col<br />
più potente dei computer attuali, occorrerebbero miliardi di miliardi di<br />
miliardi … di anni per eseguire una tale analisi 3 .<br />
Esattamente come nel caso del nostro esempio guida, l’uso dell’algoritmo<br />
di Zermelo sull’albero di un gioco strettamente competitivo e <strong>con</strong><br />
informazione perfetta permette di individuare almeno un profilo di strategie<br />
pure (s, t) il cui uso <strong>con</strong>duce ad un nodo terminale il cui esito è il valore del<br />
gioco.<br />
[Se l’uso dell’algoritmo di Zermelo individua due o più profili di strategie<br />
ottimali (s, t), (s', t'), … essi possono determinare degli esiti v, v', … che<br />
non sono necessariamente coincidenti, ma che i giocatori <strong>con</strong>siderano<br />
equivalenti tra di loro e quindi aventi lo stesso valore.]<br />
Ebbene noi assumiamo come soluzione del gioco un tale profilo di strategie<br />
pure.<br />
<strong>2.</strong>7. L’uso dell’algoritmo di Zermelo in giochi <strong>sequenziali</strong> <strong>con</strong><br />
informazione perfetta, ma non strettamente competitivi<br />
Riprenderemo a più riprese nel seguito l’argomento dei giochi<br />
strettamente competitivi. Tuttavia la maggior parte dei giochi della vita<br />
2 Un gioco in forma estesa si dice finito se è finito il numero dei nodi dell’albero. (Cfr.<br />
es. <strong>2.</strong>1<strong>2.</strong>11 per un esempio di gioco infinito.)<br />
3 Cfr. E. Santi, Michail Botvinnik: un programma “intelligente” per giocare a scacchi,<br />
http://matematica.uni-boc<strong>con</strong>i.it/interventi/botvinnik/scacchi_botvinnik.htm.<br />
14
eale non sono strettamente competitivi ed offrono ai giocatori sia elementi<br />
di <strong>con</strong>flitto che elementi di cooperazione.<br />
Ci chiediamo ora cosa rimane valido dei risultati precedenti quando si<br />
passa a <strong>con</strong>siderare un generico gioco in forma estesa <strong>con</strong> informazione<br />
perfetta e (per ora) senza intervento della Fortuna.<br />
Per semplicità supporremo, negli esempi di questo capitolo, che gli esiti<br />
finali siano rappresentati da coppie (x, y) di pagamenti in denaro, per<br />
esempio in euro, e che l’utilità che un giocatore ne riceve coincida <strong>con</strong> la<br />
somma di denaro che egli riceve (o sborsa, se la somma è negativa).<br />
Il criterio di preferenza di ciascun giocatore è allora determinato dal fatto<br />
che egli preferisce avere più denaro che meno e che non è interessato a<br />
null’altro nel gioco che ad avere quanto più denaro è possibile.<br />
Si suppone che questo fatto sia <strong>con</strong>oscenza comune dei giocatori.<br />
Ebbene è facile <strong>con</strong>vincersi che si può <strong>con</strong>tinuare ad applicare<br />
l’algoritmo di Zermelo ad un qualunque gioco in forma estesa, finito e <strong>con</strong><br />
informazione perfetta, determinando <strong>con</strong> ciò almeno un profilo di strategie<br />
pure.<br />
In generale il profilo di strategie che viene individuato è unico come nel<br />
seguente esempio.<br />
In G1, nel nodo iniziale, I può<br />
uscire subito dal gioco <strong>con</strong><br />
pagamenti, in milioni di euro, 0<br />
per lui e 2 per II, oppure entrare<br />
ed allora II può reagire <strong>con</strong><br />
pagamenti (-1, -1) oppure subire<br />
l’ingresso di I coi pagamenti (1,<br />
1).<br />
L’uso dell’algoritmo di Zermelo,<br />
indicato <strong>con</strong> le frecce, determina<br />
il profilo di strategie pure (E, S)<br />
<strong>con</strong> pagamenti (1, 1).<br />
Altre volte però l’uso dell’algoritmo di Zermelo determina più di un profilo<br />
di strategie pure come nel seguente gioco G<strong>2.</strong><br />
15
Nei giochi strettamente competitivi si può lavorare <strong>con</strong> un singolo albero<br />
del gioco, indicando <strong>con</strong> la freccia tutti gli archi corrispondenti a scelte<br />
ottimali.<br />
Nei giochi che non sono strettamente competitivi <strong>con</strong>viene disegnare un<br />
diagramma per ciascuna scelta ottimale in un nodo (se ce n’è più di una)<br />
perché gli esiti finali determinati dai profili di strategia selezionati<br />
dall’algoritmo di Zermelo sono in genere diversi.<br />
Nel nostro caso, poiché II in b può scegliere indifferentemente L o R,<br />
abbiamo i due diagrammi<br />
Nel diagramma di sinistra viene individuato il profilo di strategie (l, L) <strong>con</strong><br />
pagamenti finali (2, 0), nel diagramma di destra viene individuato il profilo<br />
di strategie (r, R) <strong>con</strong> la coppia di pagamenti (1, 1).<br />
Come si vede da questo esempio, nel caso che il gioco non sia strettamente<br />
competitivo, non ha più senso la nozione di valore di un gioco.<br />
16
Inoltre dato che i due profili di strategie (l, L) ed (r, R) portano a<br />
pagamenti diversi ci possiamo chiedere se la TdG può dare indicazioni per<br />
scegliere uno di essi come soluzione del gioco. È giunto il momento di<br />
chiarire cosa pretendiamo da un profilo di strategie pure per poterlo<br />
assumere come “soluzione del gioco”.<br />
<strong>2.</strong>8. La forma strategica (o normale) del gioco G<br />
Riprendiamo il nostro esempio guida, cioè il gioco G, che è stato<br />
assegnato in forma estesa, mediante l’albero del gioco.<br />
Da tale albero si deduce la forma “strategica” o “normale” del gioco<br />
elencando le strategie di I e di II e indicando per ogni profilo di strategie<br />
l’esito del gioco. Adottando la <strong>con</strong>venzione di indicare semplicemente <strong>con</strong><br />
V l’esito (V, S) e <strong>con</strong> S l’esito (S, V) si ottiene allora la seguente matrice<br />
4x6 dove le strategie di I corrispondono alle righe e quelle di II alle<br />
colonne (ignora per ora le marcature degli esiti).<br />
ll<br />
lr<br />
LL LM LR RL RM RR<br />
V V V S S S<br />
V V V S S S<br />
rl S V V S<br />
rr<br />
V V<br />
V V V V V V<br />
La forma normale del gioco G<br />
Dalla forma normale del gioco G appare subito che rr è una strategia<br />
vincente di I (il giocatore delle righe) poiché nell’ultima riga compaiono<br />
solo delle V, che significa vittoria di I.<br />
La forma normale del gioco G1 (pag. 15) è invece<br />
R S<br />
U 0, 2 0, 2<br />
E -1, -1 1, 1<br />
dove, il primo dei due numeri di ciascuna riga e colonna rappresenta il<br />
pagamento di I (il giocatore delle righe) ed il se<strong>con</strong>do quello di II (il<br />
giocatore delle colonne). Una tale tabella viene chiamata bimatrice.<br />
17
<strong>2.</strong>9. Equilibri di Nash ed equilibri perfetti nei sottogiochi<br />
In TdG una richiesta minima che viene fatta ad un profilo di strategie<br />
pure perché esso possa essere assunto come soluzione del gioco è che esso<br />
sia un “equilibrio di Nash”.<br />
In un gioco a due persone dire che un profilo di strategie pure (s, t) è un<br />
“equilibrio di Nash” significa che s è una scelta ottimale di strategia per I<br />
ove II scelga t e che, <strong>con</strong>temporaneamente, t è una scelta ottimale di<br />
strategia di II ove I scelga s.<br />
Ossia, ciascuna delle strategie della coppia (s, t) è una risposta ottimale<br />
all’uso dell’altra da parte dell’avversario.<br />
È facile leggere tutti gli equilibri di Nash sulla forma normale (di un<br />
gioco a due persone).<br />
Dalla forma normale del gioco G si evince che, giocando rr, I vince<br />
qualunque strategia scelga II. Tutti i profili di strategie pure (rr, XY) sono<br />
equilibri di Nash.<br />
Il criterio per determinare gli equilibri di Nash nella forma normale del<br />
gioco è semplice.<br />
Per esempio, (rr, LL) è un equilibrio di Nash perché leggendo l’esito nella<br />
casella corrispondente alla scelta della riga e della colonna si vede che<br />
<strong>con</strong>temporaneamente:<br />
• rr è una risposta ottimale di I all’uso di LL da parte di II (il giocatore<br />
delle colonne), cosa che è stata evidenziata sottosegnando l’esito;<br />
• LL è una risposta ottimale di II all’uso di rr da parte di I (l’esito è<br />
infausto per II, ma non c’è di meglio, se I sceglie rr).<br />
In pratica basta (sotto)segnare in ogni colonna l’esito migliore per I e<br />
(sopra)segnare in ogni riga l’esito migliore per II (che nel caso del gioco G<br />
è il peggiore per I).<br />
Si noti che non tutti gli equilibri di Nash del gioco G (rr, XY) possono<br />
<strong>con</strong>siderarsi equivalenti tra loro.<br />
Consideriamo ad esempio l’equilibrio di Nash (rr, LL). Esso non<br />
costituisce un profilo di strategie che venga selezionato, nella forma estesa<br />
del gioco G, dall’algoritmo di Zermelo. Come abbiamo visto in precedenza<br />
l’algoritmo sceglie rr per I e una qualunque strategia della forma RX per II<br />
e tra di esse non c’è LL.<br />
La ragione per cui l’algoritmo di Zermelo non sceglie LL è che tale<br />
strategia propone a II la scelta irrazionale L nel nodo c. Tale scelta è<br />
irrazionale perché, se il nodo c venisse raggiunto, II potrebbe vincere<br />
giocando R mentre <strong>con</strong> L perde.<br />
18
Il fatto che la strategia LL incorpori una tale scelta irrazionale non è<br />
messo in luce dalla nozione di equilibrio di Nash perché, se I sceglie la sua<br />
strategia di equilibrio rr, allora il nodo c non verrà raggiunto e quindi II<br />
non sarà chiamato ad utilizzare la sua scelta in c.<br />
Il punto qui è che restringere l’attenzione alle strategie degli equilibri di<br />
Nash assicura soltanto che i giocatori si comporteranno razionalmente nei<br />
nodi del cammino di equilibrio (cioè nella partita che viene giocata se i<br />
giocatori seguono fedelmente la strategia di equilibrio). Fuori dal cammino<br />
di equilibrio, le strategie di equilibrio di Nash possono suggerire scelte<br />
assurde.<br />
È perciò importante che un profilo di strategia che venga proposto come<br />
soluzione di un gioco, oltre ad essere un equilibrio di Nash, goda di qualche<br />
ulteriore proprietà. In particolare, nei giochi <strong>sequenziali</strong> <strong>con</strong> informazione<br />
perfetta, i profili di strategie (s, t) che vengono scelti dall’algoritmo di<br />
Zermelo non soltanto sono equilibri di Nash dell’intero gioco, ma di più<br />
essi generano equilibri di Nash in ogni sottogioco. Un profilo di strategie<br />
che gode di questa proprietà è detto “equilibrio perfetto nei sottogiochi”.<br />
Come ulteriore esempio, riprendiamo in esame il gioco di pag. 15.<br />
R S<br />
U 0, 2 0, 2<br />
E -1, -1 1, 1<br />
Nella forma normale di tale gioco, sottolineiamo in ogni colonna della<br />
bimatrice il miglior pagamento del giocatore delle righe (I) ed in ogni riga<br />
il miglior pagamento del giocatore delle colonne. In questo modo si vede<br />
che ci sono due equilibri di Nash (U, R) ed (E, S), ma soltanto (E, S) è<br />
perfetto nei sottogiochi.<br />
<strong>2.</strong>10. Equilibri multipli nei giochi <strong>con</strong> informazione perfetta<br />
Abbiamo detto in precedenza che una <strong>con</strong>dizione necessaria, ma in<br />
generale non sufficiente, perché un profilo di strategie pure possa essere<br />
assunto come soluzione di un gioco è che esso sia un equilibrio di Nash.<br />
19
In particolare, nel caso di un gioco sequenziale <strong>con</strong> informazione perfetta,<br />
noi pretendiamo perché un profilo di strategie pure possa essere assunto<br />
come soluzione che esso sia un equilibrio perfetto nei sottogiochi.<br />
Tuttavia può verificarsi che un gioco <strong>con</strong> informazione perfetta possieda<br />
più di un equilibrio perfetto nei sottogiochi. Ciò può creare un problema di<br />
scelta tra equilibri non semplice da affrontare. 4<br />
A titolo di esempio, riprendiamo in esame il gioco G2 di pag. 16<br />
che possiede i due equilibri perfetti (l, L) ed (r, R).<br />
I preferirebbe l’equilibrio (l, L) che gli dà 2 anziché 1 e II preferirebbe (r,<br />
R) che le dà 1 anziché 0.<br />
Se le regole del gioco permettono a I ed a II di comunicare tra di loro, II<br />
può assumere l’impegno di giocare R. Tale “minaccia” di II è credibile,<br />
poiché II non ha alcunchè da perdere a metterla in esecuzione al momento<br />
di giocare. Si perviene allora all’equilibrio (r, R) <strong>con</strong> pagamenti (1, 1).<br />
Se invece non è possibile la comunicazione pre-gioco, può capitare che si<br />
pervenga al non-equilibrio (l, R) dannoso per entrambi. Infetti, se I sceglie<br />
l, egli si può aspettare che II, se è razionale, scelga indifferentemente L<br />
oppure R e dunque I si può aspettare di ottenere, in media, 1€. Se però I<br />
sospetta un pizzico di irrazionalità (leggi desiderio di vendetta) in II, ciò<br />
dovrebbe suggerire a I la scelta r, che gli dà 1€ <strong>con</strong> certezza.<br />
In altri casi la natura del problema può indicare tra più equilibri, uno di essi<br />
come “equilibrio focale”, cioè come un equilibrio sul quale sono portati ad<br />
operare le loro scelte entrambi (se sono due) i giocatori, per qualche<br />
caratteristica speciale ed evidente del problema. Ritorneremo su questo<br />
punto in seguito.<br />
4 Il problema non si presenta se il gioco è strettamente competitivo. Si può dimostrare,<br />
ricorrendo alla forma normale, che in un gioco strettamente competitivo, se (s, t) ed (s',<br />
t') sono equilibri di Nash anche (s, t') ed (s', t) lo sono e tutti e quattro portano agli stessi<br />
pagamenti (Cfr. es. 7.6.4).<br />
20
<strong>2.</strong>11. Esempio di un gioco <strong>con</strong> <strong>mosse</strong> <strong>sequenziali</strong> ed informazione<br />
imperfetta<br />
All’inizio di questo gioco, che chiameremo G3, I e II pongono 1 € sul<br />
piatto. Poi I sceglie una carta coperta da un mazzo ben mescolato, in cui<br />
metà delle carte sono rosse (cuori e quadri) e metà sono nere (fiori e<br />
picche). I guarda in privato la carta e decide se chiudere il gioco o<br />
rilanciare.<br />
Se I chiude allora egli mostra la carta a II e il gioco finisce; in tale caso I<br />
prende il denaro nel piatto se la carta è rossa, ma II prende il denaro nel<br />
piatto se la carta è nera.<br />
Se I rilancia, allora egli aggiunge un altro euro nel piatto e II deve decidere<br />
se passare o vedere.<br />
Se II passa il gioco finisce e I prende il denaro nel piatto. Se II vede, anche<br />
ella deve mettere un altro euro nel piatto ed allora I mostra la carta a II e il<br />
gioco finisce. Di nuovo I prende il denaro nel piatto se la carta è rossa, ma<br />
II prende il denaro nel piatto se la carta è nera.<br />
Siamo tentati di rappresentare il gioco ora descritto mediante il seguente<br />
albero, la cui radice è stata indicata <strong>con</strong> un quadratino per indicare che ivi<br />
la mossa spetta alla Fortuna (“giocatore zero”).<br />
Tuttavia questa non è una rappresentazione adeguata del gioco. Nella figura<br />
non appare in alcun modo il fatto cruciale che I <strong>con</strong>osce il colore della<br />
21
carta mentre II non lo <strong>con</strong>osce. Guardando l’albero ora disegnato ci si<br />
aspetta che II passi se I rilancia <strong>con</strong> una carta rossa, ma che II veda se I<br />
rilancia <strong>con</strong> una carta nera.<br />
Ma questo è in<strong>con</strong>gruo col fatto che ella non <strong>con</strong>osce il colore della carta<br />
quando deve scegliere tra vedere e passare e che dunque non sa se si trova<br />
in c o in d; in altre parole il comportamento atteso di II deve essere lo<br />
stesso in c e in d.<br />
Un albero che rappresenta fedelmente la situazione è il seguente.<br />
Nella figura i nodi c, d sono racchiusi entro una stessa curva chiusa: si dice<br />
che l’insieme {c, d} è un “insieme di informazioni”.<br />
Un “insieme di informazioni” è un insieme, E, di uno o più nodi<br />
dell’albero, <strong>con</strong> le seguenti proprietà:<br />
i) tutti i nodi di E appartengono ad uno stesso giocatore i;<br />
ii) non c’è alcuna relazione di precedenza tra i nodi di E;<br />
iii) in ciascuno dei nodi di E, i dispone delle stesse azioni;<br />
iv) i non è in grado di distinguere tra i nodi di E;<br />
ed inoltre<br />
v) se x è un nodo che non appartiene ad E, l’insieme E∪ {x} non<br />
soddisfa almeno una delle proprietà i), ii), iii), iv).<br />
Nel gioco G3, gli insiemi di informazioni di I sono i singoletti {a} e {b},<br />
mentre l’unico insieme di informazioni di II è {c, d}. Utilizzando la<br />
22
nozione di “insieme di informazioni” possiamo così riformulare le<br />
definizioni di informazione perfetta, di informazione imperfetta e di<br />
strategia pura.<br />
Un gioco in forma estesa ha informazione perfetta se tutti i suoi insiemi<br />
di informazioni sono singoletti.<br />
Un gioco in forma estesa ha informazione imperfetta se almeno un suo<br />
insieme di informazioni possiede più di un elemento 5 .<br />
Una strategia pura del giocatore i, in un gioco in forma estesa, è una<br />
regola (o un piano di azione) che indica la scelta di un’azione di i in ogni<br />
suo insieme di informazioni.<br />
Le strategie pure di I, nel gioco G3, sono quattro: RR, RC, CR, CC. Le<br />
strategie pure di II sono soltanto due: V e P.<br />
Della risoluzione del gioco G3 ci occuperemo nel seguito.<br />
Un caso particolare di informazione imperfetta: ricordo imperfetto.<br />
Nel suo se<strong>con</strong>do insieme di informazioni {c, d} I non si ricorda se nella<br />
mossa iniziale della Fortuna è uscito Testa (<strong>con</strong> mossa a lui) o Croce (<strong>con</strong><br />
mossa a II).<br />
5 N.B. Un gioco può avere informazione imperfetta anche senza la presenza della<br />
Fortuna (e pur essendo tutte le <strong>mosse</strong> di tipo sequenziale).<br />
23
Tutti i giochi <strong>con</strong>siderati nel corso (tranne questo!) hanno ricordo perfetto<br />
ossia i giocatori non sono mai smemorati.<br />
Nota storico-filologica<br />
Nei paragrafi precedenti (ed anche nel mio articolo su Botvinnik, citato<br />
nella nota a piede di pagina 14) ho parlato di algoritmo di Zermelo. Tale<br />
locuzione non è appropriata e ciò ha la seguente spiegazione. Fino a pochi<br />
anni or sono quasi nessuno aveva letto il lavoro di Zermelo del 1913 (sul<br />
gioco degli scacchi), perché scritto in lingua tedesca, e tutti ritenevano che<br />
Zermelo, nella dimostrazione del suo risultato avesse utilizzato il<br />
procedimento di induzione a ritroso (cfr. ad esempio [B], Fun and Games,<br />
cap. 1). Nel 2001 due storici, Ulrich Schwalbe e Paul Walker, in appendice<br />
ad un loro articolo dal titolo "Zermelo and the early history of game<br />
theory", hanno pubblicato una versione in lingua inglese del lavoro di<br />
Zermelo. Si è visto allora che Zermelo ha utilizzato solo argomentazioni di<br />
teoria degli insiemi.<br />
In realtà, ad utilizzare per la prima volta (in teoria dei giochi) l'algoritmo di<br />
induzione a ritroso è stato Harold Kuhn nel 1953, allorché ha provato la<br />
seguente importante estensione del teorema di Zermelo: "Ogni gioco finito<br />
<strong>con</strong> informazione perfetta ammette (almeno) un equilibrio di Nash, in<br />
strategie pure."<br />
Nell'enunciato di Kuhn non compare, come ci si aspetterebbe, il termine<br />
"equilibrio perfetto nei sottogiochi" semplicemente perché tale nozione è<br />
stata introdotta (da Reinhard Selten) nel 1965.<br />
24
<strong>2.</strong>1<strong>2.</strong> Esercizi<br />
1) L’albero disegnato qui di seguito rappresenta un gioco G <strong>con</strong> due<br />
giocatori I e II, strettamente competitivo e <strong>con</strong> informazione perfetta.<br />
[V sta per (V, S) e significa vittoria di I e s<strong>con</strong>fitta di II, S sta per (S,<br />
V), P sta per (P, P) ed indica la patta.]<br />
a) Quante e quali strategie ha ciascun giocatore?<br />
b) Quale partita risulta dall’uso del profilo di strategie (rll, LM)?<br />
c) Elenca tutti i profili di strategie pure che danno luogo alla<br />
partita [rRl].<br />
d) Applica l’algoritmo di Zermelo al gioco G.<br />
e) Quali sono il valore del sottogioco che parte dal nodo b, il<br />
valore del sottogioco che parte dal nodo c, e il valore del gioco<br />
G stesso?<br />
2) Consideriamo di nuovo il gioco G del precedente esercizio.<br />
a) Scrivi la forma normale del gioco G.<br />
b) Determina tutti gli equilibri di Nash (in strategie pure) del<br />
gioco G e precisa quali di essi sono perfetti nei sottogiochi.<br />
c) Mostra che la strategia pura rrr di I garantisce a I il valore del<br />
gioco o meglio. Perché tale strategia pura non è scelta<br />
dall’algoritmo di Zermelo?<br />
25
3) Considera il gioco del Nim 13-9-8.<br />
a) Mostra che tale gioco ha valore V (ossia che la posizione<br />
iniziale è vincente per I, il giocatore che ha la mossa).<br />
b) È unica la mossa iniziale vincente?<br />
c) Dai un esempio di un’intera partita del Nim 13-9-8, in cui I fa<br />
sempre <strong>mosse</strong> ottimali mentre II risponde in un modo<br />
qualunque, fino a che I vince.<br />
4) Il Nim negativo. Le regole del Nim negativo sono le stesse del Nim,<br />
salvo il fatto che l’ultimo giocatore a togliere cerini perde. Le<br />
questioni che seguono si riferis<strong>con</strong>o al Nim negativo.<br />
a) Se c’è una sola fila di cerini, quando la situazione iniziale è<br />
vincente per I (il giocatore che ha la mossa iniziale) e quando<br />
è vincente per II?<br />
b) Descrivi tutte le situazioni vincenti quando ci sono<br />
esattamente due file. [Suggerimento: comincia <strong>con</strong> file piccole<br />
per capire cosa succede in generale.]<br />
c) Vero o Falso: una posizione del Nim negativo è una posizione<br />
vincente se e solo se essa è una posizione perdente del Nim.<br />
5) Nel “Nim del Povero” c’è una sola fila di cerini e i due giocatori, a<br />
<strong>mosse</strong> alternate, tolgono 1 oppure 2 oppure 3 cerini della fila. Chi<br />
toglie l’ultimo cerino perde.<br />
a) Chi vincerà partendo da una fila di 5 cerini?<br />
b) Chi vincerà partendo da una fila di n cerini? Descrivi una<br />
strategia vincente.<br />
6) Il gioco del Hex 6 . Si gioca tra due giocatori su una scacchiera<br />
romboidale di nxn celle esagonali (in figura n = 7). I due lati opposti<br />
del rombo <strong>con</strong>trassegnati <strong>con</strong> le croci appartengono a un giocatore<br />
che ha a disposizione pedine marcate <strong>con</strong> la croce. Gli altri due lati<br />
6 Il gioco del Hex è stato inventato da Piet Hein nel 1942 e riproposto, in versione un<br />
po’ diversa, da J. F. Nash nel 1947. Si dimostra che il primo giocatore ha una strategia<br />
vincente, ma essa è nota solo per piccoli valori di n.<br />
26
del rombo <strong>con</strong>trassegnati <strong>con</strong> cerchietti appartengono all’altro<br />
giocatore che dispone di pedine marcate col cerchio.<br />
I due giocatori si alternano a collocare una propria pedina in una<br />
cella (tra quelle ancora vuote) e vince uno che riesca per primo a<br />
creare <strong>con</strong> le sue pedine una catena ininterrotta che colleghi i due lati<br />
opposti che gli appartengono. Nella figura (b) è presentata una<br />
situazione in cui il giocatore delle croci ha vinto.<br />
a) Sapresti, <strong>con</strong> <strong>con</strong>siderazioni intuitive, notare che il gioco non<br />
può terminare <strong>con</strong> un pareggio? [Una prova formale è<br />
difficile.]<br />
b) Indica, nel caso del Hex 3x3, una strategia vincente del<br />
giocatore che ha la prima mossa.<br />
7) Determina tutti gli equilibri perfetti nei sottogiochi del gioco<br />
seguente (pagamenti in euro).<br />
27
8) Due giocatori, I e II, si alternano scegliendo ogni volta un numero<br />
intero compreso tra 1 e 10 (inclusi). Col procedere della partita viene<br />
calcolato ogni volta il totale cumulativo di tutti i numeri scelti (ossia<br />
la loro somma). Il giocatore che <strong>con</strong> la sua ultima scelta raggiunge il<br />
totale di 100 è il vincitore.<br />
a) Chi vincerà a gioco corretto?<br />
b) Quali sono strategie ottimali per entrambi?<br />
9) L’e<strong>con</strong>omista Martin Shubik propose una volta a due suoi studenti, I<br />
e II, di fare offerte alternate per ottenere un dollaro.<br />
Le offerte vanno fatte in multipli di 10 centesimi a crescere (ossia<br />
l’offerta iniziale di I è di almeno 10 centesimi e ogni eventuale rialzo<br />
è di almeno 10 centesimi) fino a che uno si ritiri e <strong>con</strong> una soglia<br />
massima per le offerte di <strong>2.</strong>50 dollari.<br />
Il maggior offerente ottiene il dollaro, ma (ove ci sia almeno un<br />
rialzo dopo la prima offerta) Martin Shubik incassa entrambe le due<br />
ultime offerte.<br />
È <strong>con</strong>oscenza comune che I e II sono giocatori razionali.<br />
a) Come si comporteranno I e II, se sono in grado di mettersi<br />
d’accordo?<br />
b) Come si comporteranno I e II, se<strong>con</strong>do la TdG, se essi giocano<br />
in modo non cooperativo?<br />
28
c) Hai compreso il motivo per cui è stata posta una limitazione<br />
superiore al rialzo massimo?<br />
10) (Il gioco dei centopiedi di Rosenthal)<br />
Vengono scelti due giocatori e indicati <strong>con</strong> I e II.<br />
Uno sperimentatore pone 1 € sul tavolo. Il giocatore I può prendere<br />
l’euro o passare. Se I prende l’euro, il gioco è finito, <strong>con</strong> I che prende<br />
1 € e II che non riceve nulla. Se I passa, lo sperimentatore aggiunge<br />
1 €, ed ora II ha la scelta tra prendere i 2 € o passare. I turni si<br />
alternano, fino a raggiungere, diciamo 10 €, il che è noto in anticipo<br />
ai giocatori.<br />
L’albero del gioco è disegnato qui di seguito.<br />
a) Determina l’unico equilibrio perfetto nei sottogiochi di questo<br />
gioco.<br />
b) Le sperimentazioni <strong>con</strong>dotte su questo tipo di gioco, hanno<br />
mostrato che spesso i giocatori vanno avanti per almeno<br />
qualche turno (ossia rifiutano le offerte iniziali).<br />
Che spiegazione ne dai, in relazione ai suggerimenti della TdG<br />
(che in questo caso raccomanda a giocatori razionali l’uso<br />
dell’unico equilibrio perfetto nei sottogiochi del gioco stesso)?<br />
11) I e II scelgono a <strong>mosse</strong> alternate la cifra 0 oppure la cifra 1<br />
<strong>con</strong>tinuando idealmente all’infinito. Una partita di questo gioco<br />
infinito può allora essere identificata <strong>con</strong> una successione di elementi<br />
dell’insieme {0, 1}. 7<br />
Una tale successione sarà ora vista come l’espansione binaria (la<br />
parte dopo la zero e la virgola) di un numero reale x compreso tra 0 e 1. 8<br />
1 _<br />
7<br />
Per esempio, la partita 10 ≡ 1011111… significa che I inizia scegliendo 1, poi II<br />
sceglie 0, e poi entrambi i giocatori scelgono sempre 1.<br />
8<br />
Per esempio 101<br />
_<br />
1 1 1<br />
sarà 0,1011111… = 1 · + 0 · + 2<br />
2 2 2 k<br />
+∞<br />
1<br />
∑ =<br />
2 +<br />
1<br />
4 =<br />
3<br />
4 .<br />
k= 3<br />
29
Fissato un sottoinsieme proprio e non vuoto E di [0, 1] = {x∈R<br />
| 0 ≤<br />
x ≤ 1}, si stabilisce che I vince se è in grado di indicare una regola<br />
per le sue infinite scelte tale che x ∈E, quali che siano le scelte di II e<br />
che I perde se II è in grado di indicare una regola per le sue infinite<br />
scelte tale che x ∉E, quali che siano le scelte di I.<br />
• Spiega perché, se E =<br />
⎤ 1 ⎤<br />
, 1<br />
⎦ ⎥<br />
2 ⎦ ⎥ , I vince facilmente.<br />
⎡ 2 ⎤<br />
• Mostra che, se E = , 1<br />
⎣ ⎢<br />
3 ⎦ ⎥ , I ha una ed una sola strategia<br />
vincente <strong>con</strong>tro la strategia ottimale di II.<br />
⎤ 2 ⎤<br />
• Mostra che, se E = , 1<br />
⎦ ⎥<br />
3 ⎦ ⎥ , è II che ha una (ed una sola, se I<br />
gioca in modo ottimale) strategia vincente.<br />
• Spiega perché II ha sempre una strategia vincente, <strong>con</strong>tro la<br />
strategia adottata da I, se E è l’insieme dei numeri razionali<br />
compresi tra 0 e 1. 9<br />
12) (Un programma semplice per il filetto). Nel gioco del filetto 3x3, è<br />
facile vedere che se il giocatore che muove per primo (I) occupa il<br />
quadrato centrale, egli ha una strategia semplice che gli assicura<br />
almeno la patta. Tale strategia di I <strong>con</strong>siste nello scegliere, in ogni<br />
sua mossa dopo la prima, un quadrato d’angolo o di lato che<br />
determini due suoi simboli in una riga o colonna o diagonale,<br />
minacciando filetto alla mossa successiva.<br />
Allora II è costretta a bloccare per non perdere.<br />
Scrivi un programma in cui il computer (giocatore I) muove per<br />
primo e utilizza una tale strategia. Per la rappresentazione della<br />
tavola da gioco utilizza la tabella seguente.<br />
1 2 3<br />
8 9 4<br />
7 6 5<br />
Tale rappresentazione (“circolare”) permette di determinare la mossa<br />
del computer in funzione della precedente mossa del giocatore<br />
9 Questa questione è più difficile e necessita, per la sua soluzione, di alcune <strong>con</strong>oscenze<br />
su numeri razionali e numeri irrazionali.<br />
30
umano (II) e/o della propria mossa precedente, usando una speciale<br />
funzione di tipo modulare.<br />
I due esempi che seguono chiaris<strong>con</strong>o la <strong>con</strong>catenazione delle<br />
successive <strong>mosse</strong> del computer e il tipo di dialogo interattivo che si<br />
chiede di realizzare nel programma. Nella se<strong>con</strong>da partita, il<br />
giocatore umano erroneamente sceglie un quadrato di lato (nella sua<br />
prima mossa) e perde.<br />
run<br />
Il computer gioca 9<br />
Tua mossa? 3<br />
Il computer gioca 4<br />
Tua mossa? 8<br />
Il computer gioca 6<br />
Tua mossa? 2<br />
Il computer gioca 1<br />
Tua mossa? 5<br />
Il computer gioca 7 (patta)<br />
run<br />
Il computer gioca 9<br />
Tua mossa? 2<br />
Il computer gioca 3<br />
Tua mossa? 7<br />
Il computer gioca 5<br />
Tua mossa? 1<br />
Il computer gioca 4 (e vince)<br />
13) (Esercizio di ripasso.) Rispondi, in modo accurato, alle seguenti<br />
questioni:<br />
a. Cos’è un insieme di informazioni?<br />
b. In un gioco rappresentato in forma estesa, qual è la differenza<br />
tra “informazione perfetta” e “informazione imperfetta”?<br />
c. Descrivi a parole, per un generico gioco in forma estesa <strong>con</strong><br />
informazione perfetta, il procedimento di analisi a ritroso.<br />
d. Enuncia il Teorema di Zermelo, chiarendo il significato dei<br />
termini utilizzati.<br />
e. La nozione di “valore di un gioco” si dà per un qualsiasi gioco<br />
<strong>con</strong> informazione perfetta?<br />
f. Enuncia una proposizione che estenda il Teorema di Zermelo<br />
al caso di un qualsiasi gioco (finito) <strong>con</strong> informazione perfetta.<br />
14) La logica dell’analisi a ritroso può palesare aspetti paradossali nel<br />
caso che, sullo stesso percorso dalla radice ad una foglia, più di un<br />
nodo di decisione appartenga ad uno stesso giocatore. Ecco un<br />
31
esempio. Il gioco descritto dall’albero in basso ha l’unico equilibrio<br />
perfetto nei sottogiochi (ll, R). Ora, se II fosse realmente chiamata a<br />
giocare nel nodo b, ciò avverrebbe perché I, in a, ha fatto la scelta<br />
“sbagliata”. Ed allora II può ancora <strong>con</strong>fidare che, se ella sceglie R in<br />
b, poi I sceglierà l in c? Cosa ne pensi?<br />
15) Il test a sorpresa. Anna, l’insegnante di matematica, ha<br />
preannunciato un questionario per la prossima settimana ma ha anche<br />
detto che il test deve cogliere di sorpresa gli alunni. Le lezioni di<br />
matematica si tengono il lunedì, mercoledì e venerdì. Bruno, che<br />
<strong>con</strong>osce l’argomentazione dell’induzione a ritroso, catechizza così i<br />
suoi compagni:<br />
“Se giovedì prossimo il test non è ancora stato assegnato, venerdì<br />
non può costituire una sorpresa e quindi il venerdì può essere<br />
scartato. Perciò rimangono lunedì e mercoledì. Mercoledì può essere<br />
scartato <strong>con</strong> lo stesso tipo di argomentazione. Resta solo il lunedì,<br />
ma allora un test assegnato lunedì non può costituire una sorpresa.<br />
Dunque il test non sarà assegnato.”<br />
Perciò Bruno e i suoi compagni evitano di studiare nel weekend.<br />
E lunedì Anna entra in aula e assegna il questionario e Bruno e i suoi<br />
compagni sono colti di sorpresa.<br />
Esprimi le tue valutazioni su questa storia.<br />
32