02.06.2013 Views

2. Giochi con mosse sequenziali - utenti

2. Giochi con mosse sequenziali - utenti

2. Giochi con mosse sequenziali - utenti

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>2.</strong> <strong>Giochi</strong> <strong>con</strong> <strong>mosse</strong> <strong>sequenziali</strong><br />

<strong>2.</strong>1. Esempi di giochi <strong>con</strong> <strong>mosse</strong> <strong>sequenziali</strong> e <strong>con</strong> informazione perfetta<br />

La dama, gli scacchi, il filetto sono esempi di giochi <strong>con</strong> <strong>mosse</strong><br />

<strong>sequenziali</strong> (c’è un preciso ordine in cui i giocatori eseguono le <strong>mosse</strong>) <strong>con</strong><br />

informazione perfetta e senza intervento della Fortuna.<br />

“Informazione perfetta” significa che in ogni punto del gioco in cui un<br />

qualsiasi giocatore ha la mossa, egli <strong>con</strong>osce tutto ciò che riguarda lo<br />

svolgimento del gioco fino a quel punto.<br />

In ciascuno dei giochi sopra citati non interviene alcun elemento aleatorio<br />

(lanci di monete o di dadi, ecc.). Se però facciamo precedere l’inizio di una<br />

partita a scacchi dal lancio di una moneta, per decidere a chi spetta il<br />

bianco, otteniamo un esempio di gioco <strong>con</strong> informazione perfetta e <strong>con</strong><br />

intervento della Fortuna.<br />

Si noti che una <strong>con</strong>dizione necessaria (ma non sufficiente) perché una<br />

situazione possa venire modellata come gioco <strong>con</strong> informazione perfetta è<br />

che essa non preveda la presenza di <strong>mosse</strong> simultanee dei giocatori.<br />

<strong>2.</strong><strong>2.</strong> L’albero del gioco<br />

Le regole di un gioco <strong>con</strong> <strong>mosse</strong> <strong>sequenziali</strong> devono precisare (almeno) i<br />

seguenti aspetti:<br />

i) chi sono i giocatori;<br />

ii) quando spetta a ciascuno di muovere<br />

iii) quali sono le azioni tra cui un giocatore può scegliere quando è il<br />

suo turno;<br />

iv) di quali informazioni dispone ciascun giocatore nei turni di sua<br />

spettanza [se ciascuno, in ogni suo turno, <strong>con</strong>osce tutto ciò che è<br />

avvenuto sino a quel punto, si dice che il gioco ha informazione<br />

perfetta];<br />

v) quali sono i possibili esiti fisici del gioco e quanto ciascun<br />

giocatore ne ottiene (quest’ultimo punto verrà chiarito nel<br />

seguito).<br />

L’albero del gioco. La struttura formale per una rappresentazione del<br />

gioco che <strong>con</strong>tenga i suddetti aspetti è l’albero del gioco.<br />

1


Un albero è un grafo orientato, <strong>con</strong>nesso e senza cicli. Ricordiamo che un<br />

grafo è semplicemente un insieme di punti (detti nodi) e di segmenti (detti<br />

archi) che collegano alcune coppie di punti.<br />

Un albero ha un nodo (unico), detto radice dell’albero, da cui parte la prima<br />

mossa del gioco. È caratterizzato graficamente dal fatto di non avere nodi<br />

predecessori nel senso delle frecce.<br />

I nodi diversi dalla radice si distinguono in nodi non terminali e nodi<br />

terminali. Ciascun nodo non terminale ha un solo predecessore (ossia<br />

riceve una sola freccia) e da esso si dipartono uno o più archi, che<br />

rappresentano le azioni (“<strong>mosse</strong>”) a disposizione del giocatore che ha la<br />

mossa in quel nodo. Quindi ogni nodo non terminale rappresenta un punto<br />

di decisione di un giocatore (nell’albero precedente il giocatore che ha la<br />

mossa nella radice dell’albero ha ivi a disposizione le azioni l ed r).<br />

2


I nodi terminali corrispondono ai possibili esiti finali del gioco. In questi<br />

primi esempi saranno etichettati semplicemente <strong>con</strong> gli esiti fisici del<br />

gioco, ma in seguito verranno etichettati coi pagamenti in utilità che<br />

ciascun giocatore riceve dall’esito fisico del gioco.<br />

Ed ora completiamo, in modo arbitrario, l’albero precedente in modo da<br />

far sì che esso rappresenti un gioco <strong>con</strong> due giocatori e <strong>con</strong> <strong>mosse</strong><br />

<strong>sequenziali</strong>. I due giocatori saranno chiamati I (Primo) e II (Se<strong>con</strong>da).<br />

Ciascun nodo non terminale è assegnato a I oppure a II. A I sono<br />

assegnati il nodo iniziale indicato <strong>con</strong> a e un se<strong>con</strong>do nodo, indicato <strong>con</strong> b<br />

(la scelta delle lettere per indicare i nodi è importante per evitare<br />

<strong>con</strong>fusione nel seguito). A II sono assegnati i due nodi indicati <strong>con</strong> c e d.<br />

Le azioni di I in a e in b sono indicate <strong>con</strong> l ed r. Questo non significa che I<br />

ha a disposizione in b le stesse scelte che ha a disposizione in a, ma solo<br />

che ha a disposizione sia in a che in b due possibili scelte. Le azioni di II<br />

sono due in c, indicate <strong>con</strong> L ed R e tre in d indicate <strong>con</strong> L, M, R.<br />

Si noti che per non appesantire il disegno dell’albero abbiamo evitato l’uso<br />

delle frecce, essendo dato per s<strong>con</strong>tato il verso di percorrenza dell’albero,<br />

dalla radice, indicata <strong>con</strong> a, ai nodi terminali (che qualche autore chiama<br />

“foglie”). In seguito utilizzeremo le frecce, ma <strong>con</strong> un significato speciale,<br />

come si vedrà.<br />

Supponiamo che il gioco possa terminare o <strong>con</strong> la vittoria di I e la<br />

s<strong>con</strong>fitta di II, esito che, per semplicità indicheremo semplicemente <strong>con</strong> V,<br />

anziché <strong>con</strong> la notazione più completa (V, S), oppure <strong>con</strong> la s<strong>con</strong>fitta di I e<br />

la vittoria di II che indicheremo semplicemente <strong>con</strong> S anziché <strong>con</strong> (S, V).<br />

3


L’obiettivo di ciascun giocatore è di vincere ogni singola partita ossia le<br />

preferenze dei giocatori, <strong>con</strong> la <strong>con</strong>venzione adottata sopra, sono<br />

S I V e S II V<br />

e tali preferenze sono <strong>con</strong>oscenza comune.<br />

Cerchiamo ora di disegnare l’albero di due giochi molto noti, il Filetto<br />

(tic-tac-toe) e il Nim.<br />

Il Filetto. Su una tavola 3x3 I e II collocano a <strong>mosse</strong> alternate il<br />

proprio simbolo (x e o).<br />

Vince chi realizza per primo un filetto in orizzontale, verticale<br />

o diagonale.<br />

È anche possibile che la tavola venga riempita senza che sia stato realizzato<br />

alcun filetto e in questo caso la partita è pari. Con la <strong>con</strong>venzione usata in<br />

precedenza di riferire l’esito al giocatore I indichiamo i possibili esiti <strong>con</strong><br />

V, S, P (P = patta sta per (P, P)) che indicano vittoria di I, s<strong>con</strong>fitta di I,<br />

patta. Le preferenze sono allora<br />

S I P I V e S II P II V .<br />

All’atto della mossa iniziale I ha 9 scelte; la mossa successiva spetta a II<br />

che, per ogni possibile scelta iniziale di I, ha 8 risposte. Poi la mossa<br />

seguente è di nuovo di I che in ognuno dei 9 · 8 = 72 nodi di decisione ha 7<br />

possibili <strong>mosse</strong> e così via. Solo dopo 5 turni di gioco ci sono alcuni nodi<br />

terminali ed alcune partite si protraggono fino al riempimento completo<br />

della tavola. L’albero del gioco è piuttosto grande (è piuttosto difficile<br />

calcolare il numero totale di nodi dell’albero).<br />

Tuttavia semplici <strong>con</strong>siderazioni sono sufficienti per vedere che, a gioco<br />

corretto, la partita è patta. Intanto nella mossa iniziale I ha in realtà soltanto<br />

3 scelte realmente diverse: collocare il suo segno al centro (la mossa da<br />

preferire poiché <strong>con</strong>trolla ben 4 filetti) oppure in uno dei quattro angoli<br />

(ciascuno di essi è equivalente) oppure in una casa di lato. Se I<br />

muove al centro a II per assicurarsi almeno la patta basta<br />

collocare il suo simbolo in una casa d’angolo (perde, a gioco<br />

corretto, la scelta di una casa di lato) e poi bloccare ogni<br />

o x<br />

o<br />

tentativo di filetto dell’avversario. Se I inizia scegliendo un angolo oppure<br />

una casa di lato, II si può assicurare la patta occupando il centro e poi<br />

<strong>con</strong>tinuando come indicato in precedenza.<br />

4


Nim. Ci sono due o più file di cerini (o monete, o altro ancora) e ciascuna<br />

fila <strong>con</strong>tiene un numero arbitrario di cerini. Due giocatori I e II muovono<br />

alternativamente. Ogni mossa <strong>con</strong>siste nel togliere da una qualsiasi delle<br />

file uno o più cerini (anche tutti). L’ultimo a togliere cerini vince.<br />

Chiaramente il Nim non può finire in parità: l’uno o l’altro giocatore deve<br />

togliere l’ultimo cerino e vincere.<br />

Nella figura che segue è disegnato l’albero del Nim 1-2-1. I nodi terminali<br />

sono etichettati <strong>con</strong> V (vittoria di I) oppure <strong>con</strong> S (s<strong>con</strong>fitta di I).<br />

6


<strong>2.</strong>3. Strategie pure<br />

Quando un gioco <strong>con</strong> <strong>mosse</strong> <strong>sequenziali</strong> viene rappresentato mediante un<br />

albero, si dice che esso è rappresentato in forma estesa.<br />

In un gioco in forma estesa e <strong>con</strong> informazione perfetta una strategia pura<br />

del giocatore i è una regola (o piano completo di azione) che specifica<br />

un’azione in ogni nodo di decisione del giocatore i (in ciascuno cioè dei<br />

nodi dell’albero in cui, in base alle regole del gioco, può essere chiamato ad<br />

operare se il nodo viene realmente raggiunto).<br />

Se tutti i giocatori (due o più) scelgono una strategia pura e la attuano, ciò<br />

determina univocamente, in un gioco senza intervento della Fortuna, lo<br />

svolgimento di una partita.<br />

Riferendoci, a titolo di esempio, al gioco G di pagina 3, il giocatore I<br />

deve operare una scelta tra due alternative sia nel nodo a che nel nodo b. Le<br />

sue strategie pure sono dunque 2 · 2 = 4 e precisamente<br />

ll, lr, rl, rr.<br />

Per esempio, lr significa che I sceglie l in a ed r in b. Si noti che se I<br />

sceglie l in a, è impossibile che venga raggiunto il nodo b, qualunque scelta<br />

operi II.<br />

Tuttavia la definizione formale di strategia pura richiede la specificazione<br />

di un’azione anche nel nodo b, benché l’azione scelta in b non abbia<br />

influenza sulla partita.<br />

Il giocatore II deve scegliere nei nodi c e d e, come appare dall’albero, ha a<br />

disposizione 2 · 3 = 6 strategie pure e precisamente<br />

LL, LM, LR, RL, RM, RR.<br />

La scelta di una strategia di I e di una di II determina una partita, che dà<br />

luogo ad un percorso dalla radice dell’albero fino ad un nodo terminale.<br />

Per esempio, nel gioco G la coppia (o “profilo”) di strategie pure (rl, RL)<br />

dà luogo alla partita<br />

[rLl]<br />

che ha come esito la s<strong>con</strong>fitta di I.<br />

Si noti che una stessa partita può derivare da più coppie (s, t) di strategie<br />

pure, indicando <strong>con</strong> s una strategia pura di I e <strong>con</strong> t una strategia pura di II.<br />

Nel nostro esempio, anche la coppia di strategie pure (rl, LL) dà luogo alla<br />

partita [rLl].<br />

<strong>2.</strong>4. L’algoritmo di analisi a ritroso<br />

Il metodo di analisi a ritroso <strong>con</strong>siste nel partire dalla fine e risalire<br />

l’albero del gioco fino alla radice, scegliendo in ogni nodo l’azione<br />

ottimale per il giocatore che ha la mossa. Tale metodo è anche chiamato<br />

7


“algoritmo di Zermelo” perché può essere utilizzato per dimostrare il<br />

teorema di Zermelo.<br />

Illustriamo in dettaglio il metodo utilizzando il gioco G del nostro<br />

esempio guida, ma, come vedremo in seguito, esso può essere applicato a<br />

un qualunque gioco in forma estesa <strong>con</strong> informazione perfetta.<br />

Sottogiochi di un gioco <strong>con</strong> informazione perfetta. In un gioco in forma<br />

estesa <strong>con</strong> informazione perfetta, ogni nodo x non terminale determina un<br />

sottogioco, costituito dal nodo x stesso e da tutti i nodi che lo seguono<br />

sull’albero. Il gioco stesso è un sottogioco di se stesso.<br />

Nel nostro esempio guida, il gioco G ha tre sottogiochi propri (cioè diversi<br />

da se stesso) G 1, G 2, G 3 che hanno radice nei nodi b, c, d rispettivamente.<br />

Diciamo che un sottogioco H di G ha valore V, e scriviamo v(H) = V, se in<br />

H il giocatore I ha una strategia che vince (porta all’esito V), qualunque<br />

strategia usi II. Analogamente, v(H) = S se II ha una strategia che vince<br />

(porta all’esito S), qualunque strategia usi I. Si noti che, a priori, non è<br />

ovvio che una di queste due alternative debba essere vera.<br />

Analizzando a ritroso il gioco G. Iniziamo la nostra analisi del gioco G,<br />

partendo dai nodi “prefinali” 1 b e c, che sono radici dei sottogiochi (di G)<br />

ad un solo giocatore G 1 e G <strong>2.</strong><br />

In G 1, ossia nel nodo b, la mossa spetta a I che sceglie r e vince. Quindi<br />

v(G 1) = V.<br />

In G 2, ossia nel nodo c, la mossa spetta a II che sceglie L e vince. Quindi<br />

v(G 2) = S.<br />

Ora <strong>con</strong>sideriamo il gioco G', che si ottiene sostituendo il sottogioco G 1<br />

<strong>con</strong> un nodo terminale etichettato col valore V ed il sottogioco G 2 <strong>con</strong> un<br />

nodo terminale etichettato col valore S.<br />

1 Un nodo è “prefinale” se è seguito soltanto da nodi terminali.<br />

8


Notiamo che, se I ha una strategia s' che vince comunque in G', allora I ha<br />

una strategia s che vince in G.<br />

Infatti, quale che sia la strategia usata da II, l’utilizzo di s' da parte di I dà<br />

luogo ad una partita di G' che si <strong>con</strong>clude in un nodo terminale x di G'<br />

etichettato <strong>con</strong> V. Tale nodo x o è esso stesso un nodo terminale anche di G<br />

ed allora s = s' è una strategia vincente in G oppure è la radice di un<br />

sottogioco G x di G <strong>con</strong> v(G x) = V. In questo se<strong>con</strong>do caso I ha una strategia<br />

vincente s x nel sottogioco G x, da cui segue che I ha una strategia vincente s<br />

in G che <strong>con</strong>siste nel giocare s' in G' e <strong>con</strong>tinuando poi col giocare s x in G x.<br />

Analogamente se II ha una strategia vincente t' in G', ella ha una strategia<br />

vincente in G.<br />

In <strong>con</strong>clusione, se G' ha un valore, lo ha anche G e si ha v(G') = v(G).<br />

Ora <strong>con</strong>sideriamo il gioco G'' che si ottiene da G' osservando che G' ha un<br />

unico nodo prefinale, precisamente d, e sostituendo il sottogioco G' 1 (di G')<br />

cha ha radice d <strong>con</strong> un nodo terminale etichettato col suo valore e cioè <strong>con</strong><br />

V (dal momento che II perde in G' 1 qualche che sia la sua scelta).<br />

9


Ragionando come prima si trae che se G'' ha un valore anche G' ha un<br />

valore e v(G'') = v(G').<br />

In <strong>con</strong>clusione se G'' ha un valore si ha<br />

v(G'') = v(G') = v(G).<br />

Ma G'' è un gioco ad un solo giocatore in cui I vince scegliendo r e dunque<br />

v(G'') = v(G') = v(G) = V.<br />

Il procedimento ora descritto può essere utilizzato nel caso di un qualsiasi<br />

gioco <strong>con</strong> informazione perfetta che abbia i due soli possibili esiti di<br />

vittoria e s<strong>con</strong>fitta.<br />

Un tale gioco ha necessariamente valore V oppure S.<br />

Generalizzeremo tale risultato ma ora ci proponiamo di determinare una<br />

strategia vincente di I in G.<br />

Il modo migliore di fare ciò <strong>con</strong>siste nell’evidenziare graficamente il<br />

procedimento di analisi a ritroso.<br />

A tale scopo riprendiamo l’albero del gioco G e cominciamo dai nodi<br />

prefinali b e c, marcando <strong>con</strong> una freccia gli archi corrispondenti a strategie<br />

ottimali. In alternativa si possono cancellare (“potare”) gli archi (“rami”)<br />

corrispondenti a strategie non ottimali. [In figura sono usati entrambi i<br />

procedimenti.]<br />

Poi, andando all’indietro e sostituendo mentalmente i nodi b e c coi loro<br />

valori (V ed S) marchiamo <strong>con</strong> la freccia, in corrispondenza ai nuovi nodi<br />

prefinali (in realtà uno solo), gli archi corrispondenti a strategie ottimali e<br />

così via fino a pervenire alla radice.<br />

10


Una strategia pura vincente di I si legge direttamente nella figura ed è rr.<br />

Per II le strategie ottimali sono tutte le strategie della forma RX (R nel nodo<br />

c, ma qualunque azione in d). Se, ad esempio, I sceglie rr e II sceglie RL ne<br />

deriva la partita [rLr].<br />

<strong>2.</strong>5. Risoluzione del gioco del Nim mediante <strong>con</strong>siderazioni di teoria dei<br />

numeri<br />

Il Nim è un gioco sequenziale <strong>con</strong> informazione perfetta che può<br />

terminare in due soli modi, vittoria o s<strong>con</strong>fitta di I e dunque ha valore V o<br />

S. Ciò dipende dal numero di file e di cerini nelle varie file.<br />

È facile tradurre in pratica il procedimento precedente nel caso del Nim 1-<br />

2-1 di cui abbiamo disegnato in precedenza l’albero. In realtà, basta al<br />

giocatore I togliere entrambi i cerini della fila <strong>con</strong> due per assicurarsi la<br />

vittoria.<br />

Però se ci sono almeno tre file e molti cerini per fila, l’albero è troppo<br />

grande per poterlo costruire manualmente.<br />

Tuttavia, nel caso del Nim, esiste un elegante metodo numerico che evita la<br />

necessità di costruire l’albero del gioco. Lo illustriamo nel caso del Nim 9-<br />

4-3, ma il procedimento ha carattere generale (C. Bouton, 1901).<br />

Nella figura seguente il numero di cerini di ogni fila viene indicato prima<br />

<strong>con</strong> file di punti, poi in notazione decimale, poi in notazione binaria.<br />

• • • • • • • • • 9 1 0 0 1<br />

• • • • 4 0 1 0 0<br />

• • • 3 0 0 1 1<br />

11


(Gli zeri che precedono 100 nella se<strong>con</strong>da riga ed 11 nella terza servono<br />

per far sì che ogni colonna abbia lo stesso numero di cifre.)<br />

Una posizione del Nim è detta bilanciata se ogni colonna della<br />

rappresentazione binaria ha un numero pari di 1, mentre è detta sbilanciata<br />

in caso <strong>con</strong>trario. La posizione iniziale del Nim 9-4-3 è sbilanciata perché<br />

la prima colonna (in realtà anche la se<strong>con</strong>da e la terza) ha un numero<br />

dispari di 1.<br />

Notiamo i seguenti fatti:<br />

a) Ogni mossa ammissibile del Nim trasforma una posizione bilanciata<br />

in una posizione sbilanciata. Infatti, nella rappresentazione binaria<br />

della fila dalla quale si tolgono cerini, almeno una cifra 1 viene<br />

trasformata nella cifra 0.<br />

b) Purché ci siano almeno due file di cerini (non vuote) è sempre<br />

possibile togliendo il numero giusto di cerini trasformare una<br />

posizione sbilanciata in una posizione bilanciata.<br />

c) Il giocatore che muove in una posizione bilanciata non può vincere<br />

in una sola mossa, dal momento che ci sono almeno due file non<br />

vuote di cerini.<br />

Ne segue che uno dei due giocatori ha una strategia vincente il cui filo<br />

logico <strong>con</strong>duttore è quello di lasciare costantemente l’avversario <strong>con</strong> una<br />

posizione bilanciata.<br />

Se la <strong>con</strong>figurazione iniziale dei cerini è sbilanciata (come nel caso del<br />

Nim 9-4-3) è I che ha una strategia vincente, mentre se è bilanciata è II che<br />

ha una strategia vincente.<br />

Di seguito indichiamo un possibile svolgimento di una partita del Nim 9-<br />

4-3, in cui I usa una strategia vincente mentre II fa delle <strong>mosse</strong> qualunque.<br />

1 0 0 1 0 1 1 1 0 1 1 1 0 0 1 0 0 0 1 0<br />

0 1 0 0 → I<br />

0 1 0 0 → II<br />

0 0 0 1 → I<br />

0 0 0 1 → II<br />

0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1<br />

0 0 0 1<br />

0 0 1 0<br />

↓ I<br />

0 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0<br />

vince ← I<br />

← II<br />

← I<br />

← II<br />

0 0 0 1 0 0 0 1 0 0 1 0<br />

<strong>2.</strong>6. Il teorema di Zermelo (1913)<br />

Abbiamo visto che il gioco G del nostro esempio guida ha un valore. È<br />

chiaro che l’argomentazione usata, e cioè l’uso dell’algoritmo di Zermelo,<br />

12


funziona <strong>con</strong> qualsiasi gioco <strong>con</strong> informazione perfetta strettamente<br />

competitivo <strong>con</strong> due soli possibili esiti (V, S) ed (S, V). Ci chiediamo se<br />

funziona anche nel caso in cui gli esiti siano più di due (per esempio negli<br />

scacchi e nel filetto gli esiti possibili sono tre).<br />

Intanto precisiamo il <strong>con</strong>cetto di gioco strettamente competitivo. In<br />

termini di preferenze ciò significa che, per ogni due esiti distinti a e b<br />

a I b<br />

⇔ a II b .<br />

[Se nel gioco interviene la Fortuna questa definizione va rafforzata.]<br />

Gli obiettivi dei due giocatori sono perciò diametralmente opposti.<br />

Valore di un gioco strettamente competitivo <strong>con</strong> k ≥ 2 esiti.<br />

Sia G un gioco finito, a due persone, <strong>con</strong> informazione perfetta,<br />

strettamente competitivo e senza intervento della Fortuna e U = {u1, u2, …,<br />

uk} l’insieme degli esiti che pensiamo etichettati in modo tale che u1 I u2 I … I uk (escludiamo, per semplicità, che ci siano degli esiti che I<br />

giudica equivalenti). Quindi dato che il gioco G è supposto strettamente<br />

competitivo si ha u1 II u2 II … II uk .<br />

Diciamo che un esito v ∈ U è il valore del gioco se I può forzare l’esito del<br />

gioco nell’insieme<br />

{u<br />

∈ U | u I v}<br />

e II può forzare l’esito del gioco nell’insieme<br />

{u<br />

∈ U | u II v} = {u<br />

come illustrato nello schema seguente<br />

∈ U | u I v}<br />

I può forzare l’esito qui<br />

<br />

u1 u2 … v = uj uj+1 … uk <br />

II può forzare l’esito qui<br />

13


Teorema. (Zermelo, 1913) Ogni gioco a due persone, finito 2 , strettamente<br />

competitivo, <strong>con</strong> informazione perfetta e senza intervento del caso, ha un<br />

valore.<br />

In realtà, Zermelo dimostrò il teorema nel caso particolare del gioco degli<br />

scacchi. In tale caso il senso del teorema di Zermelo è il seguente:<br />

• o il Bianco ha una strategia vincente;<br />

• o il Nero ha una strategia vincente;<br />

• o il Bianco ha una strategia che gli assicura almeno la patta e<br />

<strong>con</strong>temporaneamente il Nero ha una strategia che gli assicura almeno<br />

la patta.<br />

Se fosse possibile utilizzare l’algoritmo di Zermelo nell’albero degli<br />

scacchi, si potrebbe vedere quale di queste tre alternative è quella giusta e<br />

quindi se il valore del gioco degli scacchi è V, S oppure P (esiti riferiti al<br />

Bianco).<br />

Ma l’albero degli scacchi è così spropositatamente grande che, anche col<br />

più potente dei computer attuali, occorrerebbero miliardi di miliardi di<br />

miliardi … di anni per eseguire una tale analisi 3 .<br />

Esattamente come nel caso del nostro esempio guida, l’uso dell’algoritmo<br />

di Zermelo sull’albero di un gioco strettamente competitivo e <strong>con</strong><br />

informazione perfetta permette di individuare almeno un profilo di strategie<br />

pure (s, t) il cui uso <strong>con</strong>duce ad un nodo terminale il cui esito è il valore del<br />

gioco.<br />

[Se l’uso dell’algoritmo di Zermelo individua due o più profili di strategie<br />

ottimali (s, t), (s', t'), … essi possono determinare degli esiti v, v', … che<br />

non sono necessariamente coincidenti, ma che i giocatori <strong>con</strong>siderano<br />

equivalenti tra di loro e quindi aventi lo stesso valore.]<br />

Ebbene noi assumiamo come soluzione del gioco un tale profilo di strategie<br />

pure.<br />

<strong>2.</strong>7. L’uso dell’algoritmo di Zermelo in giochi <strong>sequenziali</strong> <strong>con</strong><br />

informazione perfetta, ma non strettamente competitivi<br />

Riprenderemo a più riprese nel seguito l’argomento dei giochi<br />

strettamente competitivi. Tuttavia la maggior parte dei giochi della vita<br />

2 Un gioco in forma estesa si dice finito se è finito il numero dei nodi dell’albero. (Cfr.<br />

es. <strong>2.</strong>1<strong>2.</strong>11 per un esempio di gioco infinito.)<br />

3 Cfr. E. Santi, Michail Botvinnik: un programma “intelligente” per giocare a scacchi,<br />

http://matematica.uni-boc<strong>con</strong>i.it/interventi/botvinnik/scacchi_botvinnik.htm.<br />

14


eale non sono strettamente competitivi ed offrono ai giocatori sia elementi<br />

di <strong>con</strong>flitto che elementi di cooperazione.<br />

Ci chiediamo ora cosa rimane valido dei risultati precedenti quando si<br />

passa a <strong>con</strong>siderare un generico gioco in forma estesa <strong>con</strong> informazione<br />

perfetta e (per ora) senza intervento della Fortuna.<br />

Per semplicità supporremo, negli esempi di questo capitolo, che gli esiti<br />

finali siano rappresentati da coppie (x, y) di pagamenti in denaro, per<br />

esempio in euro, e che l’utilità che un giocatore ne riceve coincida <strong>con</strong> la<br />

somma di denaro che egli riceve (o sborsa, se la somma è negativa).<br />

Il criterio di preferenza di ciascun giocatore è allora determinato dal fatto<br />

che egli preferisce avere più denaro che meno e che non è interessato a<br />

null’altro nel gioco che ad avere quanto più denaro è possibile.<br />

Si suppone che questo fatto sia <strong>con</strong>oscenza comune dei giocatori.<br />

Ebbene è facile <strong>con</strong>vincersi che si può <strong>con</strong>tinuare ad applicare<br />

l’algoritmo di Zermelo ad un qualunque gioco in forma estesa, finito e <strong>con</strong><br />

informazione perfetta, determinando <strong>con</strong> ciò almeno un profilo di strategie<br />

pure.<br />

In generale il profilo di strategie che viene individuato è unico come nel<br />

seguente esempio.<br />

In G1, nel nodo iniziale, I può<br />

uscire subito dal gioco <strong>con</strong><br />

pagamenti, in milioni di euro, 0<br />

per lui e 2 per II, oppure entrare<br />

ed allora II può reagire <strong>con</strong><br />

pagamenti (-1, -1) oppure subire<br />

l’ingresso di I coi pagamenti (1,<br />

1).<br />

L’uso dell’algoritmo di Zermelo,<br />

indicato <strong>con</strong> le frecce, determina<br />

il profilo di strategie pure (E, S)<br />

<strong>con</strong> pagamenti (1, 1).<br />

Altre volte però l’uso dell’algoritmo di Zermelo determina più di un profilo<br />

di strategie pure come nel seguente gioco G<strong>2.</strong><br />

15


Nei giochi strettamente competitivi si può lavorare <strong>con</strong> un singolo albero<br />

del gioco, indicando <strong>con</strong> la freccia tutti gli archi corrispondenti a scelte<br />

ottimali.<br />

Nei giochi che non sono strettamente competitivi <strong>con</strong>viene disegnare un<br />

diagramma per ciascuna scelta ottimale in un nodo (se ce n’è più di una)<br />

perché gli esiti finali determinati dai profili di strategia selezionati<br />

dall’algoritmo di Zermelo sono in genere diversi.<br />

Nel nostro caso, poiché II in b può scegliere indifferentemente L o R,<br />

abbiamo i due diagrammi<br />

Nel diagramma di sinistra viene individuato il profilo di strategie (l, L) <strong>con</strong><br />

pagamenti finali (2, 0), nel diagramma di destra viene individuato il profilo<br />

di strategie (r, R) <strong>con</strong> la coppia di pagamenti (1, 1).<br />

Come si vede da questo esempio, nel caso che il gioco non sia strettamente<br />

competitivo, non ha più senso la nozione di valore di un gioco.<br />

16


Inoltre dato che i due profili di strategie (l, L) ed (r, R) portano a<br />

pagamenti diversi ci possiamo chiedere se la TdG può dare indicazioni per<br />

scegliere uno di essi come soluzione del gioco. È giunto il momento di<br />

chiarire cosa pretendiamo da un profilo di strategie pure per poterlo<br />

assumere come “soluzione del gioco”.<br />

<strong>2.</strong>8. La forma strategica (o normale) del gioco G<br />

Riprendiamo il nostro esempio guida, cioè il gioco G, che è stato<br />

assegnato in forma estesa, mediante l’albero del gioco.<br />

Da tale albero si deduce la forma “strategica” o “normale” del gioco<br />

elencando le strategie di I e di II e indicando per ogni profilo di strategie<br />

l’esito del gioco. Adottando la <strong>con</strong>venzione di indicare semplicemente <strong>con</strong><br />

V l’esito (V, S) e <strong>con</strong> S l’esito (S, V) si ottiene allora la seguente matrice<br />

4x6 dove le strategie di I corrispondono alle righe e quelle di II alle<br />

colonne (ignora per ora le marcature degli esiti).<br />

ll<br />

lr<br />

LL LM LR RL RM RR<br />

V V V S S S<br />

V V V S S S<br />

rl S V V S<br />

rr<br />

V V<br />

V V V V V V<br />

La forma normale del gioco G<br />

Dalla forma normale del gioco G appare subito che rr è una strategia<br />

vincente di I (il giocatore delle righe) poiché nell’ultima riga compaiono<br />

solo delle V, che significa vittoria di I.<br />

La forma normale del gioco G1 (pag. 15) è invece<br />

R S<br />

U 0, 2 0, 2<br />

E -1, -1 1, 1<br />

dove, il primo dei due numeri di ciascuna riga e colonna rappresenta il<br />

pagamento di I (il giocatore delle righe) ed il se<strong>con</strong>do quello di II (il<br />

giocatore delle colonne). Una tale tabella viene chiamata bimatrice.<br />

17


<strong>2.</strong>9. Equilibri di Nash ed equilibri perfetti nei sottogiochi<br />

In TdG una richiesta minima che viene fatta ad un profilo di strategie<br />

pure perché esso possa essere assunto come soluzione del gioco è che esso<br />

sia un “equilibrio di Nash”.<br />

In un gioco a due persone dire che un profilo di strategie pure (s, t) è un<br />

“equilibrio di Nash” significa che s è una scelta ottimale di strategia per I<br />

ove II scelga t e che, <strong>con</strong>temporaneamente, t è una scelta ottimale di<br />

strategia di II ove I scelga s.<br />

Ossia, ciascuna delle strategie della coppia (s, t) è una risposta ottimale<br />

all’uso dell’altra da parte dell’avversario.<br />

È facile leggere tutti gli equilibri di Nash sulla forma normale (di un<br />

gioco a due persone).<br />

Dalla forma normale del gioco G si evince che, giocando rr, I vince<br />

qualunque strategia scelga II. Tutti i profili di strategie pure (rr, XY) sono<br />

equilibri di Nash.<br />

Il criterio per determinare gli equilibri di Nash nella forma normale del<br />

gioco è semplice.<br />

Per esempio, (rr, LL) è un equilibrio di Nash perché leggendo l’esito nella<br />

casella corrispondente alla scelta della riga e della colonna si vede che<br />

<strong>con</strong>temporaneamente:<br />

• rr è una risposta ottimale di I all’uso di LL da parte di II (il giocatore<br />

delle colonne), cosa che è stata evidenziata sottosegnando l’esito;<br />

• LL è una risposta ottimale di II all’uso di rr da parte di I (l’esito è<br />

infausto per II, ma non c’è di meglio, se I sceglie rr).<br />

In pratica basta (sotto)segnare in ogni colonna l’esito migliore per I e<br />

(sopra)segnare in ogni riga l’esito migliore per II (che nel caso del gioco G<br />

è il peggiore per I).<br />

Si noti che non tutti gli equilibri di Nash del gioco G (rr, XY) possono<br />

<strong>con</strong>siderarsi equivalenti tra loro.<br />

Consideriamo ad esempio l’equilibrio di Nash (rr, LL). Esso non<br />

costituisce un profilo di strategie che venga selezionato, nella forma estesa<br />

del gioco G, dall’algoritmo di Zermelo. Come abbiamo visto in precedenza<br />

l’algoritmo sceglie rr per I e una qualunque strategia della forma RX per II<br />

e tra di esse non c’è LL.<br />

La ragione per cui l’algoritmo di Zermelo non sceglie LL è che tale<br />

strategia propone a II la scelta irrazionale L nel nodo c. Tale scelta è<br />

irrazionale perché, se il nodo c venisse raggiunto, II potrebbe vincere<br />

giocando R mentre <strong>con</strong> L perde.<br />

18


Il fatto che la strategia LL incorpori una tale scelta irrazionale non è<br />

messo in luce dalla nozione di equilibrio di Nash perché, se I sceglie la sua<br />

strategia di equilibrio rr, allora il nodo c non verrà raggiunto e quindi II<br />

non sarà chiamato ad utilizzare la sua scelta in c.<br />

Il punto qui è che restringere l’attenzione alle strategie degli equilibri di<br />

Nash assicura soltanto che i giocatori si comporteranno razionalmente nei<br />

nodi del cammino di equilibrio (cioè nella partita che viene giocata se i<br />

giocatori seguono fedelmente la strategia di equilibrio). Fuori dal cammino<br />

di equilibrio, le strategie di equilibrio di Nash possono suggerire scelte<br />

assurde.<br />

È perciò importante che un profilo di strategia che venga proposto come<br />

soluzione di un gioco, oltre ad essere un equilibrio di Nash, goda di qualche<br />

ulteriore proprietà. In particolare, nei giochi <strong>sequenziali</strong> <strong>con</strong> informazione<br />

perfetta, i profili di strategie (s, t) che vengono scelti dall’algoritmo di<br />

Zermelo non soltanto sono equilibri di Nash dell’intero gioco, ma di più<br />

essi generano equilibri di Nash in ogni sottogioco. Un profilo di strategie<br />

che gode di questa proprietà è detto “equilibrio perfetto nei sottogiochi”.<br />

Come ulteriore esempio, riprendiamo in esame il gioco di pag. 15.<br />

R S<br />

U 0, 2 0, 2<br />

E -1, -1 1, 1<br />

Nella forma normale di tale gioco, sottolineiamo in ogni colonna della<br />

bimatrice il miglior pagamento del giocatore delle righe (I) ed in ogni riga<br />

il miglior pagamento del giocatore delle colonne. In questo modo si vede<br />

che ci sono due equilibri di Nash (U, R) ed (E, S), ma soltanto (E, S) è<br />

perfetto nei sottogiochi.<br />

<strong>2.</strong>10. Equilibri multipli nei giochi <strong>con</strong> informazione perfetta<br />

Abbiamo detto in precedenza che una <strong>con</strong>dizione necessaria, ma in<br />

generale non sufficiente, perché un profilo di strategie pure possa essere<br />

assunto come soluzione di un gioco è che esso sia un equilibrio di Nash.<br />

19


In particolare, nel caso di un gioco sequenziale <strong>con</strong> informazione perfetta,<br />

noi pretendiamo perché un profilo di strategie pure possa essere assunto<br />

come soluzione che esso sia un equilibrio perfetto nei sottogiochi.<br />

Tuttavia può verificarsi che un gioco <strong>con</strong> informazione perfetta possieda<br />

più di un equilibrio perfetto nei sottogiochi. Ciò può creare un problema di<br />

scelta tra equilibri non semplice da affrontare. 4<br />

A titolo di esempio, riprendiamo in esame il gioco G2 di pag. 16<br />

che possiede i due equilibri perfetti (l, L) ed (r, R).<br />

I preferirebbe l’equilibrio (l, L) che gli dà 2 anziché 1 e II preferirebbe (r,<br />

R) che le dà 1 anziché 0.<br />

Se le regole del gioco permettono a I ed a II di comunicare tra di loro, II<br />

può assumere l’impegno di giocare R. Tale “minaccia” di II è credibile,<br />

poiché II non ha alcunchè da perdere a metterla in esecuzione al momento<br />

di giocare. Si perviene allora all’equilibrio (r, R) <strong>con</strong> pagamenti (1, 1).<br />

Se invece non è possibile la comunicazione pre-gioco, può capitare che si<br />

pervenga al non-equilibrio (l, R) dannoso per entrambi. Infetti, se I sceglie<br />

l, egli si può aspettare che II, se è razionale, scelga indifferentemente L<br />

oppure R e dunque I si può aspettare di ottenere, in media, 1€. Se però I<br />

sospetta un pizzico di irrazionalità (leggi desiderio di vendetta) in II, ciò<br />

dovrebbe suggerire a I la scelta r, che gli dà 1€ <strong>con</strong> certezza.<br />

In altri casi la natura del problema può indicare tra più equilibri, uno di essi<br />

come “equilibrio focale”, cioè come un equilibrio sul quale sono portati ad<br />

operare le loro scelte entrambi (se sono due) i giocatori, per qualche<br />

caratteristica speciale ed evidente del problema. Ritorneremo su questo<br />

punto in seguito.<br />

4 Il problema non si presenta se il gioco è strettamente competitivo. Si può dimostrare,<br />

ricorrendo alla forma normale, che in un gioco strettamente competitivo, se (s, t) ed (s',<br />

t') sono equilibri di Nash anche (s, t') ed (s', t) lo sono e tutti e quattro portano agli stessi<br />

pagamenti (Cfr. es. 7.6.4).<br />

20


<strong>2.</strong>11. Esempio di un gioco <strong>con</strong> <strong>mosse</strong> <strong>sequenziali</strong> ed informazione<br />

imperfetta<br />

All’inizio di questo gioco, che chiameremo G3, I e II pongono 1 € sul<br />

piatto. Poi I sceglie una carta coperta da un mazzo ben mescolato, in cui<br />

metà delle carte sono rosse (cuori e quadri) e metà sono nere (fiori e<br />

picche). I guarda in privato la carta e decide se chiudere il gioco o<br />

rilanciare.<br />

Se I chiude allora egli mostra la carta a II e il gioco finisce; in tale caso I<br />

prende il denaro nel piatto se la carta è rossa, ma II prende il denaro nel<br />

piatto se la carta è nera.<br />

Se I rilancia, allora egli aggiunge un altro euro nel piatto e II deve decidere<br />

se passare o vedere.<br />

Se II passa il gioco finisce e I prende il denaro nel piatto. Se II vede, anche<br />

ella deve mettere un altro euro nel piatto ed allora I mostra la carta a II e il<br />

gioco finisce. Di nuovo I prende il denaro nel piatto se la carta è rossa, ma<br />

II prende il denaro nel piatto se la carta è nera.<br />

Siamo tentati di rappresentare il gioco ora descritto mediante il seguente<br />

albero, la cui radice è stata indicata <strong>con</strong> un quadratino per indicare che ivi<br />

la mossa spetta alla Fortuna (“giocatore zero”).<br />

Tuttavia questa non è una rappresentazione adeguata del gioco. Nella figura<br />

non appare in alcun modo il fatto cruciale che I <strong>con</strong>osce il colore della<br />

21


carta mentre II non lo <strong>con</strong>osce. Guardando l’albero ora disegnato ci si<br />

aspetta che II passi se I rilancia <strong>con</strong> una carta rossa, ma che II veda se I<br />

rilancia <strong>con</strong> una carta nera.<br />

Ma questo è in<strong>con</strong>gruo col fatto che ella non <strong>con</strong>osce il colore della carta<br />

quando deve scegliere tra vedere e passare e che dunque non sa se si trova<br />

in c o in d; in altre parole il comportamento atteso di II deve essere lo<br />

stesso in c e in d.<br />

Un albero che rappresenta fedelmente la situazione è il seguente.<br />

Nella figura i nodi c, d sono racchiusi entro una stessa curva chiusa: si dice<br />

che l’insieme {c, d} è un “insieme di informazioni”.<br />

Un “insieme di informazioni” è un insieme, E, di uno o più nodi<br />

dell’albero, <strong>con</strong> le seguenti proprietà:<br />

i) tutti i nodi di E appartengono ad uno stesso giocatore i;<br />

ii) non c’è alcuna relazione di precedenza tra i nodi di E;<br />

iii) in ciascuno dei nodi di E, i dispone delle stesse azioni;<br />

iv) i non è in grado di distinguere tra i nodi di E;<br />

ed inoltre<br />

v) se x è un nodo che non appartiene ad E, l’insieme E∪ {x} non<br />

soddisfa almeno una delle proprietà i), ii), iii), iv).<br />

Nel gioco G3, gli insiemi di informazioni di I sono i singoletti {a} e {b},<br />

mentre l’unico insieme di informazioni di II è {c, d}. Utilizzando la<br />

22


nozione di “insieme di informazioni” possiamo così riformulare le<br />

definizioni di informazione perfetta, di informazione imperfetta e di<br />

strategia pura.<br />

Un gioco in forma estesa ha informazione perfetta se tutti i suoi insiemi<br />

di informazioni sono singoletti.<br />

Un gioco in forma estesa ha informazione imperfetta se almeno un suo<br />

insieme di informazioni possiede più di un elemento 5 .<br />

Una strategia pura del giocatore i, in un gioco in forma estesa, è una<br />

regola (o un piano di azione) che indica la scelta di un’azione di i in ogni<br />

suo insieme di informazioni.<br />

Le strategie pure di I, nel gioco G3, sono quattro: RR, RC, CR, CC. Le<br />

strategie pure di II sono soltanto due: V e P.<br />

Della risoluzione del gioco G3 ci occuperemo nel seguito.<br />

Un caso particolare di informazione imperfetta: ricordo imperfetto.<br />

Nel suo se<strong>con</strong>do insieme di informazioni {c, d} I non si ricorda se nella<br />

mossa iniziale della Fortuna è uscito Testa (<strong>con</strong> mossa a lui) o Croce (<strong>con</strong><br />

mossa a II).<br />

5 N.B. Un gioco può avere informazione imperfetta anche senza la presenza della<br />

Fortuna (e pur essendo tutte le <strong>mosse</strong> di tipo sequenziale).<br />

23


Tutti i giochi <strong>con</strong>siderati nel corso (tranne questo!) hanno ricordo perfetto<br />

ossia i giocatori non sono mai smemorati.<br />

Nota storico-filologica<br />

Nei paragrafi precedenti (ed anche nel mio articolo su Botvinnik, citato<br />

nella nota a piede di pagina 14) ho parlato di algoritmo di Zermelo. Tale<br />

locuzione non è appropriata e ciò ha la seguente spiegazione. Fino a pochi<br />

anni or sono quasi nessuno aveva letto il lavoro di Zermelo del 1913 (sul<br />

gioco degli scacchi), perché scritto in lingua tedesca, e tutti ritenevano che<br />

Zermelo, nella dimostrazione del suo risultato avesse utilizzato il<br />

procedimento di induzione a ritroso (cfr. ad esempio [B], Fun and Games,<br />

cap. 1). Nel 2001 due storici, Ulrich Schwalbe e Paul Walker, in appendice<br />

ad un loro articolo dal titolo "Zermelo and the early history of game<br />

theory", hanno pubblicato una versione in lingua inglese del lavoro di<br />

Zermelo. Si è visto allora che Zermelo ha utilizzato solo argomentazioni di<br />

teoria degli insiemi.<br />

In realtà, ad utilizzare per la prima volta (in teoria dei giochi) l'algoritmo di<br />

induzione a ritroso è stato Harold Kuhn nel 1953, allorché ha provato la<br />

seguente importante estensione del teorema di Zermelo: "Ogni gioco finito<br />

<strong>con</strong> informazione perfetta ammette (almeno) un equilibrio di Nash, in<br />

strategie pure."<br />

Nell'enunciato di Kuhn non compare, come ci si aspetterebbe, il termine<br />

"equilibrio perfetto nei sottogiochi" semplicemente perché tale nozione è<br />

stata introdotta (da Reinhard Selten) nel 1965.<br />

24


<strong>2.</strong>1<strong>2.</strong> Esercizi<br />

1) L’albero disegnato qui di seguito rappresenta un gioco G <strong>con</strong> due<br />

giocatori I e II, strettamente competitivo e <strong>con</strong> informazione perfetta.<br />

[V sta per (V, S) e significa vittoria di I e s<strong>con</strong>fitta di II, S sta per (S,<br />

V), P sta per (P, P) ed indica la patta.]<br />

a) Quante e quali strategie ha ciascun giocatore?<br />

b) Quale partita risulta dall’uso del profilo di strategie (rll, LM)?<br />

c) Elenca tutti i profili di strategie pure che danno luogo alla<br />

partita [rRl].<br />

d) Applica l’algoritmo di Zermelo al gioco G.<br />

e) Quali sono il valore del sottogioco che parte dal nodo b, il<br />

valore del sottogioco che parte dal nodo c, e il valore del gioco<br />

G stesso?<br />

2) Consideriamo di nuovo il gioco G del precedente esercizio.<br />

a) Scrivi la forma normale del gioco G.<br />

b) Determina tutti gli equilibri di Nash (in strategie pure) del<br />

gioco G e precisa quali di essi sono perfetti nei sottogiochi.<br />

c) Mostra che la strategia pura rrr di I garantisce a I il valore del<br />

gioco o meglio. Perché tale strategia pura non è scelta<br />

dall’algoritmo di Zermelo?<br />

25


3) Considera il gioco del Nim 13-9-8.<br />

a) Mostra che tale gioco ha valore V (ossia che la posizione<br />

iniziale è vincente per I, il giocatore che ha la mossa).<br />

b) È unica la mossa iniziale vincente?<br />

c) Dai un esempio di un’intera partita del Nim 13-9-8, in cui I fa<br />

sempre <strong>mosse</strong> ottimali mentre II risponde in un modo<br />

qualunque, fino a che I vince.<br />

4) Il Nim negativo. Le regole del Nim negativo sono le stesse del Nim,<br />

salvo il fatto che l’ultimo giocatore a togliere cerini perde. Le<br />

questioni che seguono si riferis<strong>con</strong>o al Nim negativo.<br />

a) Se c’è una sola fila di cerini, quando la situazione iniziale è<br />

vincente per I (il giocatore che ha la mossa iniziale) e quando<br />

è vincente per II?<br />

b) Descrivi tutte le situazioni vincenti quando ci sono<br />

esattamente due file. [Suggerimento: comincia <strong>con</strong> file piccole<br />

per capire cosa succede in generale.]<br />

c) Vero o Falso: una posizione del Nim negativo è una posizione<br />

vincente se e solo se essa è una posizione perdente del Nim.<br />

5) Nel “Nim del Povero” c’è una sola fila di cerini e i due giocatori, a<br />

<strong>mosse</strong> alternate, tolgono 1 oppure 2 oppure 3 cerini della fila. Chi<br />

toglie l’ultimo cerino perde.<br />

a) Chi vincerà partendo da una fila di 5 cerini?<br />

b) Chi vincerà partendo da una fila di n cerini? Descrivi una<br />

strategia vincente.<br />

6) Il gioco del Hex 6 . Si gioca tra due giocatori su una scacchiera<br />

romboidale di nxn celle esagonali (in figura n = 7). I due lati opposti<br />

del rombo <strong>con</strong>trassegnati <strong>con</strong> le croci appartengono a un giocatore<br />

che ha a disposizione pedine marcate <strong>con</strong> la croce. Gli altri due lati<br />

6 Il gioco del Hex è stato inventato da Piet Hein nel 1942 e riproposto, in versione un<br />

po’ diversa, da J. F. Nash nel 1947. Si dimostra che il primo giocatore ha una strategia<br />

vincente, ma essa è nota solo per piccoli valori di n.<br />

26


del rombo <strong>con</strong>trassegnati <strong>con</strong> cerchietti appartengono all’altro<br />

giocatore che dispone di pedine marcate col cerchio.<br />

I due giocatori si alternano a collocare una propria pedina in una<br />

cella (tra quelle ancora vuote) e vince uno che riesca per primo a<br />

creare <strong>con</strong> le sue pedine una catena ininterrotta che colleghi i due lati<br />

opposti che gli appartengono. Nella figura (b) è presentata una<br />

situazione in cui il giocatore delle croci ha vinto.<br />

a) Sapresti, <strong>con</strong> <strong>con</strong>siderazioni intuitive, notare che il gioco non<br />

può terminare <strong>con</strong> un pareggio? [Una prova formale è<br />

difficile.]<br />

b) Indica, nel caso del Hex 3x3, una strategia vincente del<br />

giocatore che ha la prima mossa.<br />

7) Determina tutti gli equilibri perfetti nei sottogiochi del gioco<br />

seguente (pagamenti in euro).<br />

27


8) Due giocatori, I e II, si alternano scegliendo ogni volta un numero<br />

intero compreso tra 1 e 10 (inclusi). Col procedere della partita viene<br />

calcolato ogni volta il totale cumulativo di tutti i numeri scelti (ossia<br />

la loro somma). Il giocatore che <strong>con</strong> la sua ultima scelta raggiunge il<br />

totale di 100 è il vincitore.<br />

a) Chi vincerà a gioco corretto?<br />

b) Quali sono strategie ottimali per entrambi?<br />

9) L’e<strong>con</strong>omista Martin Shubik propose una volta a due suoi studenti, I<br />

e II, di fare offerte alternate per ottenere un dollaro.<br />

Le offerte vanno fatte in multipli di 10 centesimi a crescere (ossia<br />

l’offerta iniziale di I è di almeno 10 centesimi e ogni eventuale rialzo<br />

è di almeno 10 centesimi) fino a che uno si ritiri e <strong>con</strong> una soglia<br />

massima per le offerte di <strong>2.</strong>50 dollari.<br />

Il maggior offerente ottiene il dollaro, ma (ove ci sia almeno un<br />

rialzo dopo la prima offerta) Martin Shubik incassa entrambe le due<br />

ultime offerte.<br />

È <strong>con</strong>oscenza comune che I e II sono giocatori razionali.<br />

a) Come si comporteranno I e II, se sono in grado di mettersi<br />

d’accordo?<br />

b) Come si comporteranno I e II, se<strong>con</strong>do la TdG, se essi giocano<br />

in modo non cooperativo?<br />

28


c) Hai compreso il motivo per cui è stata posta una limitazione<br />

superiore al rialzo massimo?<br />

10) (Il gioco dei centopiedi di Rosenthal)<br />

Vengono scelti due giocatori e indicati <strong>con</strong> I e II.<br />

Uno sperimentatore pone 1 € sul tavolo. Il giocatore I può prendere<br />

l’euro o passare. Se I prende l’euro, il gioco è finito, <strong>con</strong> I che prende<br />

1 € e II che non riceve nulla. Se I passa, lo sperimentatore aggiunge<br />

1 €, ed ora II ha la scelta tra prendere i 2 € o passare. I turni si<br />

alternano, fino a raggiungere, diciamo 10 €, il che è noto in anticipo<br />

ai giocatori.<br />

L’albero del gioco è disegnato qui di seguito.<br />

a) Determina l’unico equilibrio perfetto nei sottogiochi di questo<br />

gioco.<br />

b) Le sperimentazioni <strong>con</strong>dotte su questo tipo di gioco, hanno<br />

mostrato che spesso i giocatori vanno avanti per almeno<br />

qualche turno (ossia rifiutano le offerte iniziali).<br />

Che spiegazione ne dai, in relazione ai suggerimenti della TdG<br />

(che in questo caso raccomanda a giocatori razionali l’uso<br />

dell’unico equilibrio perfetto nei sottogiochi del gioco stesso)?<br />

11) I e II scelgono a <strong>mosse</strong> alternate la cifra 0 oppure la cifra 1<br />

<strong>con</strong>tinuando idealmente all’infinito. Una partita di questo gioco<br />

infinito può allora essere identificata <strong>con</strong> una successione di elementi<br />

dell’insieme {0, 1}. 7<br />

Una tale successione sarà ora vista come l’espansione binaria (la<br />

parte dopo la zero e la virgola) di un numero reale x compreso tra 0 e 1. 8<br />

1 _<br />

7<br />

Per esempio, la partita 10 ≡ 1011111… significa che I inizia scegliendo 1, poi II<br />

sceglie 0, e poi entrambi i giocatori scelgono sempre 1.<br />

8<br />

Per esempio 101<br />

_<br />

1 1 1<br />

sarà 0,1011111… = 1 · + 0 · + 2<br />

2 2 2 k<br />

+∞<br />

1<br />

∑ =<br />

2 +<br />

1<br />

4 =<br />

3<br />

4 .<br />

k= 3<br />

29


Fissato un sottoinsieme proprio e non vuoto E di [0, 1] = {x∈R<br />

| 0 ≤<br />

x ≤ 1}, si stabilisce che I vince se è in grado di indicare una regola<br />

per le sue infinite scelte tale che x ∈E, quali che siano le scelte di II e<br />

che I perde se II è in grado di indicare una regola per le sue infinite<br />

scelte tale che x ∉E, quali che siano le scelte di I.<br />

• Spiega perché, se E =<br />

⎤ 1 ⎤<br />

, 1<br />

⎦ ⎥<br />

2 ⎦ ⎥ , I vince facilmente.<br />

⎡ 2 ⎤<br />

• Mostra che, se E = , 1<br />

⎣ ⎢<br />

3 ⎦ ⎥ , I ha una ed una sola strategia<br />

vincente <strong>con</strong>tro la strategia ottimale di II.<br />

⎤ 2 ⎤<br />

• Mostra che, se E = , 1<br />

⎦ ⎥<br />

3 ⎦ ⎥ , è II che ha una (ed una sola, se I<br />

gioca in modo ottimale) strategia vincente.<br />

• Spiega perché II ha sempre una strategia vincente, <strong>con</strong>tro la<br />

strategia adottata da I, se E è l’insieme dei numeri razionali<br />

compresi tra 0 e 1. 9<br />

12) (Un programma semplice per il filetto). Nel gioco del filetto 3x3, è<br />

facile vedere che se il giocatore che muove per primo (I) occupa il<br />

quadrato centrale, egli ha una strategia semplice che gli assicura<br />

almeno la patta. Tale strategia di I <strong>con</strong>siste nello scegliere, in ogni<br />

sua mossa dopo la prima, un quadrato d’angolo o di lato che<br />

determini due suoi simboli in una riga o colonna o diagonale,<br />

minacciando filetto alla mossa successiva.<br />

Allora II è costretta a bloccare per non perdere.<br />

Scrivi un programma in cui il computer (giocatore I) muove per<br />

primo e utilizza una tale strategia. Per la rappresentazione della<br />

tavola da gioco utilizza la tabella seguente.<br />

1 2 3<br />

8 9 4<br />

7 6 5<br />

Tale rappresentazione (“circolare”) permette di determinare la mossa<br />

del computer in funzione della precedente mossa del giocatore<br />

9 Questa questione è più difficile e necessita, per la sua soluzione, di alcune <strong>con</strong>oscenze<br />

su numeri razionali e numeri irrazionali.<br />

30


umano (II) e/o della propria mossa precedente, usando una speciale<br />

funzione di tipo modulare.<br />

I due esempi che seguono chiaris<strong>con</strong>o la <strong>con</strong>catenazione delle<br />

successive <strong>mosse</strong> del computer e il tipo di dialogo interattivo che si<br />

chiede di realizzare nel programma. Nella se<strong>con</strong>da partita, il<br />

giocatore umano erroneamente sceglie un quadrato di lato (nella sua<br />

prima mossa) e perde.<br />

run<br />

Il computer gioca 9<br />

Tua mossa? 3<br />

Il computer gioca 4<br />

Tua mossa? 8<br />

Il computer gioca 6<br />

Tua mossa? 2<br />

Il computer gioca 1<br />

Tua mossa? 5<br />

Il computer gioca 7 (patta)<br />

run<br />

Il computer gioca 9<br />

Tua mossa? 2<br />

Il computer gioca 3<br />

Tua mossa? 7<br />

Il computer gioca 5<br />

Tua mossa? 1<br />

Il computer gioca 4 (e vince)<br />

13) (Esercizio di ripasso.) Rispondi, in modo accurato, alle seguenti<br />

questioni:<br />

a. Cos’è un insieme di informazioni?<br />

b. In un gioco rappresentato in forma estesa, qual è la differenza<br />

tra “informazione perfetta” e “informazione imperfetta”?<br />

c. Descrivi a parole, per un generico gioco in forma estesa <strong>con</strong><br />

informazione perfetta, il procedimento di analisi a ritroso.<br />

d. Enuncia il Teorema di Zermelo, chiarendo il significato dei<br />

termini utilizzati.<br />

e. La nozione di “valore di un gioco” si dà per un qualsiasi gioco<br />

<strong>con</strong> informazione perfetta?<br />

f. Enuncia una proposizione che estenda il Teorema di Zermelo<br />

al caso di un qualsiasi gioco (finito) <strong>con</strong> informazione perfetta.<br />

14) La logica dell’analisi a ritroso può palesare aspetti paradossali nel<br />

caso che, sullo stesso percorso dalla radice ad una foglia, più di un<br />

nodo di decisione appartenga ad uno stesso giocatore. Ecco un<br />

31


esempio. Il gioco descritto dall’albero in basso ha l’unico equilibrio<br />

perfetto nei sottogiochi (ll, R). Ora, se II fosse realmente chiamata a<br />

giocare nel nodo b, ciò avverrebbe perché I, in a, ha fatto la scelta<br />

“sbagliata”. Ed allora II può ancora <strong>con</strong>fidare che, se ella sceglie R in<br />

b, poi I sceglierà l in c? Cosa ne pensi?<br />

15) Il test a sorpresa. Anna, l’insegnante di matematica, ha<br />

preannunciato un questionario per la prossima settimana ma ha anche<br />

detto che il test deve cogliere di sorpresa gli alunni. Le lezioni di<br />

matematica si tengono il lunedì, mercoledì e venerdì. Bruno, che<br />

<strong>con</strong>osce l’argomentazione dell’induzione a ritroso, catechizza così i<br />

suoi compagni:<br />

“Se giovedì prossimo il test non è ancora stato assegnato, venerdì<br />

non può costituire una sorpresa e quindi il venerdì può essere<br />

scartato. Perciò rimangono lunedì e mercoledì. Mercoledì può essere<br />

scartato <strong>con</strong> lo stesso tipo di argomentazione. Resta solo il lunedì,<br />

ma allora un test assegnato lunedì non può costituire una sorpresa.<br />

Dunque il test non sarà assegnato.”<br />

Perciò Bruno e i suoi compagni evitano di studiare nel weekend.<br />

E lunedì Anna entra in aula e assegna il questionario e Bruno e i suoi<br />

compagni sono colti di sorpresa.<br />

Esprimi le tue valutazioni su questa storia.<br />

32

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!