download(PDF) - Dipartimento di Ingegneria dell'Informazione

Nome e Cognome: 

Matricola: 

Nickname: 

Intelligenza Artificiale 

Compito - 12 Marzo 2007 

ESERCIZIO N° 1 – Ricerca Informata A* 4 punti 

Stabilite se un’euristica monotona permette ad A* di espandere sempre meno nodi rispetto alla ricerca a costo 

uniforme. Motivate la risposta. 

Sì. A*, usando un’euristica monotona, espanderà sempre meno nodi della ricerca UCS. UCS 

rappresenta un caso particolare di A* in cui hUSC(n) = 0 ∀n . A* sfrutta un’euristica 

monotona, quindi ammissibile, hA*(n) ≤ h*(n) ∀n. Ipotizzando che al nodo goal l’euristica 

abbia valore pari a 0, ne consegue che: 0 = hUSC(n) ≤ hA*(n) ≤ h*(n) ∀n. Questo coincide con 

la definizione di dominanza: hA*(n) domina hUCS(n) ogni nodo espanso da A* è anche 

espanso da UCS. Infatti fA*(n) ≥ fUCS(n) ∀n, quindi il numero di nodi espansi da UCS, in cui 

fUCS(n) ≤ f*, è maggiore dei nodi espansi da A*, in cui fA*(n) ≤ f*. 

ESERCIZIO N° 2 – Quiz “Vero o Falso” (+0,5 per ogni risposta corretta, -0,25 per ogni risposta errata) 6 punti 

1. Usando una versione di WA* in cui f(n)=g(n)+wh(n) e w=3, se h*(xo) = 20 allora il costo delle 

soluzioni ottenute sarà superiore a 60. 

2. 

3. 

Un algoritmo di ricerca ad approfondimenti iterativi trova la stessa soluzione di un algoritmo di 

ricerca depth-first. 

Nella ricerca bidirezionale le euristiche front-to-front valutano la distanza tra un nodo della 

frontiera “forward” e un nodo della frontiera “backward”. 

4. Con lookahead infinito gli algoritmi real-time coincidono con gli algoritmi off-line. V F 

5. La ricerca ad approfondimenti iterativi visita sempre più nodi della ricerca in ampiezza. V F 

6. Alfa-Beta Pruning trova mosse migliori di Minimax (a parità di taglio di profondità). V F 

7. 

8. 

9. 

10. 

11. 

12. 

I pattern databases permettono di calcolare un’euristica più informata sfruttando l’informazione 

ottenuta dalla risoluzione previa di porzioni del problema. 

Aggiungendo a IDA* una tabella hash che conserva i nodi già espansi si diminuisce sia il costo 

temporale e sia il costo spaziale della ricerca. 

L’Alfa-beta pruning pota solo i rami dell’albero di ricerca che non influenzano la decisione 

minimax. 

A differenza di LRTA* l’algoritmo Online Depth First Search ha bisogno unicamente di una 

pila di nodi per effettuare la scelta di un operatore. 

Nel caso di giochi multiplayer in cui le alleanze non sono ammesse non è possibile determinare 

la mossa ottima (secondo il criterio minimax) per l’agente intelligente. 

L’algoritmo minimax potrebbe essere reso più efficiente usando la ricerca ad approfondimenti 

iterativi, invece che la ricerca in profondità. 

V F 

V F 

V F 

V F 

V F 

V F 

V F 

V F 

V F

ESERCIZIO N° 3 – Ricerca Informata 8 punti 

2 

C 

3 

G1 

0 

1 

6 

Iterative deepening search 

Percorso risolvente: 

S B G2 

Nodi espansi: {} / S / S,A,B / S,A,C,D,B,E,G2 

Uniformed Cost search 


Nodi espansi: 

Greedy search 


S B E G2 

In questo grafo vengono riportati sugli archi i costi 

di cammino da uno stato all’altro e all’interno dei 

nodi una valutazione euristica della distanza da 

uno stato goal. 

Lo stato di partenza è S, gli stati goal sono G1 e 

G2. 

Per ognuno degli algoritmi proposti riportate: a) il 

percorso risolvente; b) la lista ordinata di nodi 

espansi. In caso di algoritmo iterativo separare con 

“/” le varie iterazioni. 

NOTA: il test di terminazione viene effettuato in 

fase di espansione. In caso di dubbio la scelta tra i 

nodi avviene in ordine alfabetico. 

(with CLOSED list) S,A,C,B,D,E,G2 

(without CLOSED list) S,A,C,S,B,D,E,A,D,C,B,B,E,S,B,E,G2 

S A D G1 

Nodi espansi: S,A,D,G1 

A* search 

2 


S B E G2 

Nodi espansi: S,A,C,D,B,E,G2 

IDA* search 

A 

5 

4 6 

D 

2 


3 

S 

10 

3 

7 

B 

5 

1 

E 

4 

9 

8 

5 

S B E G2 

Nodi espansi: {} / S,A,C,D / S,A,C,D,D / S,A,C,D,D,B,E / S,A,C,D,D,B,E,G2 

G2 

0

ESERCIZIO N° 4 – Game Playing 5 punti 

Osservate il seguente albero in cui MAX muove per primo. 

v=4 

β=3 

A) Qual è la mossa che MAX dovrà effettuare? E quale sarà probabilmente la mossa di MIN? Nel caso in cui MIN 

non muova in modo ottimo, quale potrebbe essere l’utilità finale di MAX? 

MAX effettuerà la mossa che porta a D. MIN dovrebbe rispondere con J. 

In caso contrario (configurazione K) MAX muoverebbe su U e quindi l’utilità finale sarebbe 

pari a 7 (maggiore dell’utilità minimax teorica: U(A)=4). 

B) Riportate in modo ordinato i nodi visitati da MINIMAX. 

v=3 

α=3 

A,B,C,D,E,F,G,L,M,N,O,P,H,Q,I,R,S,W,X,Y,Z,J,T,K,U,V,X2,Y2,Z2 

oppure (nodi “espansi”) 

A,B,E,L,M,F,N,O,G,P,C,H,Q,I,R,W,X,S,Y,Z,D,J,T,K,U,X2,V,Y2,Z2 

C) Riportate, nodo per nodo, i valori di utilità calcolati da MINIMAX. 

E=3; F=4; G=5; H=3; R=1; S=-1; I=1; J=4; U=7; V=-2; K=7; B=3; C=1; D=4; A=4; 

D) Quali sono i nodi che la potatura alfa-beta non visita? Motivate la risposta mostrando sull’albero i valor assunti 

da v, alfa e beta nel caso di potature. 

La potatura alfa-beta evita la visita dei nodi: 

O; I; R; W; X; S; Y; Z; V; Y2; Z2. 

v=7 

β=4

ESERCIZIO N° 5 – Torre di Hanoi 10 punti 

Considerate il problema della Torre di Hanoi (Figura A). Avete 3 paletti sui quali infilare 3 dischi di diverse 

dimensioni. Lo scopo del gioco è quello di portare i dischi dalla configurazione S (dove tutti i dischi si trovano sul 

paletto sinistro) alla configurazione G (tutti i dischi sul paletto destro). Potete muovere un solo disco per volta. Un 

disco non può essere collocato sopra un disco di dimensioni inferiori. NOTA: come nei riquadri in Figura A, i 

dischi possono essere rappresentati usando i numeri 1 (piccolo), 2 (medio), 3 (grande). 

(S) 

(n) 

A) Analizzate la dimensione dello spazio degli stati e dite come questa cambia al variare del numero di dischi. 

Per generare configurazioni legali della Torre di Hanoi partiamo da una configurazione priva di 

dischi e li inseriamo partendo da quello più grande fino al più piccolo. Grazie all’inserimento 

ordinato siamo liberi di posizionare ogni disco su qualsiasi paletto. Sia il disco “3”, sia il disco “2”, 

sia il disco “1” potranno essere inseriti in 3 paletti diversi. Il numero di configurazioni legali è 

quindi pari a 3x3x3 = 27. Nel caso generale, dati N dischi il numero di configurazioni legali è 3 N . 

B) Analizzate il branching factor minimo e massimo dell’albero di ricerca e dite come questi cambiano al 

variare del numero di dischi. 

Indipendentemente dal numero di dischi, il problema presenta 3 “torri” con un totale di 3 dischi di 

dimensioni diverse su cui applicare l’operatore di spostamento: D1 < D2 < D3 (la torre vuota è come un 

disco di dimensioni infinite). Qualunque sia l’ordine, D1 potrà essere mosso su D2 e D3; D2 su D3; 

mentre D3 non potrà essere mosso. In totale si hanno al massimo 3 mosse. Il branch factor minimo si 

ha quando 2 torri sono nulle, quindi vale solo: D1 muove su D2 e D3. Il branching factor minimo è di 2 

mosse. Durante la ricerca, possiamo imporre che non venga mai rivisitato il nodo padre (più in generale 

che non venga mai rimosso due volte di seguito lo stesso disco).: quindi bMAX= 2; bMIN=1. Al variare del 

numero di dischi il branching factor rimane invariato. 

C) Provate a proporre 2 euristiche garantitamente ammissibili h1 e h2 usando le tecniche viste a lezione. 

Obiettivo: portare tutti i dischi sul paletto “target” in modo ordinato. 

I vincoli sugli operatori sono i seguenti: A) si muove un disco per volta da t1 a t2; B) si preleva un disco 

dalla cima della torre t1; C) si inserisce un disco sulla cima di una torre t2; D) si muove un disco da t1 a 

t2 se il disco in t2 è più grande; E) il numero di paletti su cui fare un inserimento è pari a 2. 

Si possono ottenere molte euristiche diverse a seconda della combinazione dei vincoli rilassati. Ad es: 

h1 = euristica che deriva dal rilassamento di B, C, D, E. Questa euristica equivale al numero di dischi 

“fuori posto”. 

(G) 

1 X X 

2 X X 

3 X X 

X X 1 

X X 2 

X X 3 

1 

2 3 X 

Figura A: Torre di Hanoi. 

(S) configurazione iniziale 

(G) configurazione goal 

(n) configurazione di prova per l’esercizio D 

Un disco può essere spostato da un paletto ad un 

altro solo se nel paletto di arrivo non è presente un 

disco più piccolo. 

Ogni mossa ha costo pari a 1 (indipendentemente 

dalla distanza tra il paletto di origine e quello di 

arrivo). 

h2 = rilassamento di D ed E. Per calcolarla si può effettuare una ricerca nello spazio degli stati del 

problema rilassato. E’ equivalente a dire: numero dischi fuori posto + 2 mosse per ogni disco sul paletto 

target che non è al livello giusto (perché il disco andrà “tolto e rimesso” effetto del vincolo C) + 1 

mossa per ogni disco non sul target che ha sotto di sé un disco più grande (il disco dovrà essere 

portato su un altro paletto non target per lasciar “uscire” il disco più grande effetto del vincolo B).

D) Applicate A* partendo dalla configurazione n (Figura A). Mostrate sul retro del foglio gli alberi di ricerca di 

A* considerando che a parità di f(n) si preferisce il nodo con minor h(n). Quale delle due euristiche domina 

l’altra? Motivate. 

Dopo aver applicato A* usando l’euristica h1 e l’euristica h2 osserviamo che il numero di 

nodi espansi nella ricerca è minore per h2. Di più, con h2 A* espande i nodi in modo 

verticale verso la soluzione: nel caso della configurazione n l’euristica h2 risulta 

perfettamente informata. Entrambe le euristiche sono ammissibili perché ottenute da 

tecnica di astrazione e rilassamento dei vincoli. Contemporaneamente vale la 

disuguaglianza h2(n) ≥ h1(n) ∀n. Quindi h2 domina h1. 

ESERCIZIO N° 6 (FACOLTATIVO) – Game Playing 5 punti 

Immaginate di giocare una versione di Tic-Tac-Toe (tris) in cui: 

a) i giocatori non vedono le mosse dell’avversario; 

b) una segnalazione acustica vi avverte quando inserite la crocetta (o cerchio) in una cella dove si trova già 

l’avversario. In caso di segnalazione potrete ripetere la mossa. 

Analizzate le caratteristiche di questo gioco e provate ad adattare l’algoritmo minimax in modo opportuno. 

Illustrate il vostro ragionamento tramite una configurazione di esempio. 

Si tratta di un gioco ad informazione imperfetta (non conosciamo completamente lo stato 

del gioco). Data la mancanza di conoscenza sulle mosse dell’avversario la segnalazione 

acustica può essere considerata come un evento di natura stocastica. 

Dobbiamo quindi adattare minimax in modo da gestire questi due fattori. 

La mancanza di conoscenza sulla configurazione può essere gestita associando ad ogni nodo 

dell’albero di ricerca minimax un doppio stato, ciascuno composto da una matrice 3x3. Lo 

stato A conterrà in ogni cella la probabilità (determinata dalle informazioni in possesso di 

MAX) che la cella sia occupata da MAX e la probabilità che sia occupata da MIN. [1;0] se 

MAX l’ha occupata, [0;1] se MAX ha scoperto che MIN l’ha occupata, [0;p] se MIN ha la 

probabilità p di averla occupata. Lo stato B conterrà in ogni cella le probabilità 

determinate dalle informazioni (stimate da MAX) in possesso di MIN. Vedi figura di 

esempio dove MAX muove O. 

L’euristica usata dovrà tenere 

conto delle probabilità interne 

alla configurazione. 

Il fattore stocastico potrà essere modellato con Expectiminimax. Ad ogni mossa saranno 

associati N possibili eventi: N sarà pari al numero di volte che può essere stata emessa la 

segnalazione acustica prima di aver completato la mossa, cioè pari al numero di mosse 

fatte “ignote”. Ad esempio, nella configurazione sopra, dove tocca a MIN muovere e dove 

sono state fatte 5 mosse di cui tre “ignote”: p0=4/7 sarà la probabilità dell’evento “non 

sentire la segnalazione acustica”; p1=(3/7)x(2/6)x(1/5) sarà la probabilità di “scoprire 

tutte le mosse ignote”; p2=(3/7)*(4/6) la probabilità di “scoprire solo una mossa ignota”; 

p3=(3/7)*(2/6)*(4/5) sarà la probabilità di “scoprire solo due mosse”.

download(PDF) - Dipartimento di Ingegneria dell'Informazione

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?