31.10.2023 Views

Cognitive Assemblages

Thesis project by Alessandro Mintrone - advisor: Alessio Erioli - Thesis project done @ Università di Bologna - 2020

Thesis project by Alessandro Mintrone - advisor: Alessio Erioli - Thesis project done @ Università di Bologna - 2020

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

pione mondiale di Go. In particolare AlphaZero, è capace

di apprendere, senza mutare architettura, anche gli scacchi

e lo Shogi, battendo in entrambi i casi motori di gioco rappresnetanti

lo stato dell’arte.

Questa capacità di generalizzare, unita alla possibilità di

modificare l’ambiente in cui sono situati rendono questo

tipo di sistemi capaci di dotarsi di un maggior grado di autonomia.

Inoltre, poiché l’ambiente giunge alla rete neurale sotto forma

di una serie fissa di input, è possibile addestrare il sistema

in un ambiente virtuale per poi proseguire il percorso di

In alto.

AlphaGo, primo software capace

di battere un campione di Go. Il

sistema combina il Reinforcement

Learning, con un modello del

gioco e un algorito di tree search

delle mosse.

Reinforcement Learning

A sinistra.

AlphaZero, evoluzione di AlphaGo,

può imparare, giocando

contro se stesso, diversi giochi,

mantenendo la medesima architettura.

70

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!