Cognitive Assemblages
Thesis project by Alessandro Mintrone - advisor: Alessio Erioli - Thesis project done @ Università di Bologna - 2020
Thesis project by Alessandro Mintrone - advisor: Alessio Erioli - Thesis project done @ Università di Bologna - 2020
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
pione mondiale di Go. In particolare AlphaZero, è capace
di apprendere, senza mutare architettura, anche gli scacchi
e lo Shogi, battendo in entrambi i casi motori di gioco rappresnetanti
lo stato dell’arte.
Questa capacità di generalizzare, unita alla possibilità di
modificare l’ambiente in cui sono situati rendono questo
tipo di sistemi capaci di dotarsi di un maggior grado di autonomia.
Inoltre, poiché l’ambiente giunge alla rete neurale sotto forma
di una serie fissa di input, è possibile addestrare il sistema
in un ambiente virtuale per poi proseguire il percorso di
In alto.
AlphaGo, primo software capace
di battere un campione di Go. Il
sistema combina il Reinforcement
Learning, con un modello del
gioco e un algorito di tree search
delle mosse.
Reinforcement Learning
A sinistra.
AlphaZero, evoluzione di AlphaGo,
può imparare, giocando
contro se stesso, diversi giochi,
mantenendo la medesima architettura.
70