Monte Carlo tree search for Sokoban

Biblioteche e Archivi
POLITesi - Archivio digitale delle tesi di laurea e di dottorato

Monte Carlo Tree Search (MCTS) is one of the most used algo- rithm in the ﬁeld of Artiﬁcial Intelligence applied to board and card games. The aim of this thesis is to evaluate the performance of MCTS algorithm applied to the puzzle game Sokoban, comparing it to another well known algorithm, Iterative Deepening A*, which has been proven to be quite successful in this puzzle game. In this thesis we apply MCTS and IDA* to Sokoban and Samegame, another puzzle game. We also develop a series of known optimiza- tions to MCTS and IDA* and present some new ones. Finally, we evaluate the eﬀects of the optimizations on both domains. Our re- sults show that in Samegame the UCB1-Tuned formula performs better than SP-MCTS, a single player version of MCTS that ob- tained good results in that domain in the past. In Sokoban, the best MCTS conﬁguration uses the standard UCT with the addi- tion of the proposed optimizations called Node Elimination and Cycles Avoidance, which lead to a drastic increase in the number of levels solved. Despite this, even with a set of enhancements that can be found in the literature, which have been widely used and have achieved successful results, the MCTS algorithm could not match IDA* performance in terms of number of solved levels. For this reason IDA* still remains the best algorithm for Sokoban.

Monte Carlo Tree Search (MCTS) `e uno degli algoritmi piu` uti- lizzati nel campo dell’intelligenza artiﬁciale applicata ai giochi da tavolo e ai giochi di carte. Lo scopo di questa tesi `e di valutare le prestazioni dell’algoritmo MCTS applicato al puzzle game Sokoban, confrontandolo con un altro algoritmo ben noto, Iterative Deepen- ing A*, che ha dimostrato di avere un discreto successo in questo puzzle game. In questa tesi applichiamo MCTS e IDA* a Sokoban e Samegame, un altro puzzle game. Sviluppiamo anche una serie di ottimizzazioni conosciute per MCTS e IDA* e ne presentiamo alcune nuove. Inﬁne, valutiamo gli eﬀetti delle ottimizzazioni su entrambi i domini. I nostri risultati mostrano che in Samegame la formula UCB1-Tuned ottiene prestazioni migliori rispetto a SP- MCTS, una versione single player di MCTS che ha ottenuto buoni risultati in quel dominio in passato. In Sokoban, la migliore conﬁgu- razione del MCTS usa l’UCT standard con l’aggiunta delle ottimiz- zazioni proposte denominate Node Elimination e Cycles Avoidance, che portano ad un drastico aumento del numero di livelli risolti dall’algoritmo MCTS in Sokoban. Nonostante ci` o, anche con una serie di miglioramenti che possono essere trovati in letteratura, che sono stati ampiamente utilizzati e hanno raggiunto risultati di suc- cesso, l’algoritmo MCTS non ha potuto eguagliare le prestazioni di IDA* in termini di numero di livelli risolti. Per questo motivo IDA* rimane ancora il miglior algoritmo per Sokoban.

Monte Carlo tree search for Sokoban

CRIPPA, MATTIA;MAROCCHI, FABIO

2016/2017

Abstract

Monte Carlo Tree Search (MCTS) is one of the most used algo- rithm in the ﬁeld of Artiﬁcial Intelligence applied to board and card games. The aim of this thesis is to evaluate the performance of MCTS algorithm applied to the puzzle game Sokoban, comparing it to another well known algorithm, Iterative Deepening A*, which has been proven to be quite successful in this puzzle game. In this thesis we apply MCTS and IDA* to Sokoban and Samegame, another puzzle game. We also develop a series of known optimiza- tions to MCTS and IDA* and present some new ones. Finally, we evaluate the eﬀects of the optimizations on both domains. Our re- sults show that in Samegame the UCB1-Tuned formula performs better than SP-MCTS, a single player version of MCTS that ob- tained good results in that domain in the past. In Sokoban, the best MCTS conﬁguration uses the standard UCT with the addi- tion of the proposed optimizations called Node Elimination and Cycles Avoidance, which lead to a drastic increase in the number of levels solved. Despite this, even with a set of enhancements that can be found in the literature, which have been widely used and have achieved successful results, the MCTS algorithm could not match IDA* performance in terms of number of solved levels. For this reason IDA* still remains the best algorithm for Sokoban.

Scheda breve

Scheda completa

	Relatore
	
				LANZI, PIER LUCA
			
	Scuola / Dip.
	
				ING  - Scuola di Ingegneria Industriale e dell'Informazione
			
	Data
	
				19-apr-2018
			
	Anno accademico
	
				2016/2017
			
	Abstract in italiano
	
				Monte Carlo Tree Search (MCTS) `e uno degli algoritmi piu` uti-
lizzati nel campo dell’intelligenza artiﬁciale applicata ai giochi da
tavolo e ai giochi di carte. Lo scopo di questa tesi `e di valutare le
prestazioni dell’algoritmo MCTS applicato al puzzle game Sokoban,
confrontandolo con un altro algoritmo ben noto, Iterative Deepen-
ing A*, che ha dimostrato di avere un discreto successo in questo
puzzle game. In questa tesi applichiamo MCTS e IDA* a Sokoban
e Samegame, un altro puzzle game. Sviluppiamo anche una serie
di ottimizzazioni conosciute per MCTS e IDA* e ne presentiamo
alcune nuove. Inﬁne, valutiamo gli eﬀetti delle ottimizzazioni su
entrambi i domini. I nostri risultati mostrano che in Samegame
la formula UCB1-Tuned ottiene prestazioni migliori rispetto a SP-
MCTS, una versione single player di MCTS che ha ottenuto buoni
risultati in quel dominio in passato. In Sokoban, la migliore conﬁgu-
razione del MCTS usa l’UCT standard con l’aggiunta delle ottimiz-
zazioni proposte denominate Node Elimination e Cycles Avoidance,
che portano ad un drastico aumento del numero di livelli risolti
dall’algoritmo MCTS in Sokoban. Nonostante ci`

o, anche con una
serie di miglioramenti che possono essere trovati in letteratura, che
sono stati ampiamente utilizzati e hanno raggiunto risultati di suc-
cesso, l’algoritmo MCTS non ha potuto eguagliare le prestazioni
di IDA* in termini di numero di livelli risolti. Per questo motivo
IDA* rimane ancora il miglior algoritmo per Sokoban.
			
	Tipo di documento
	
				Tesi di laurea Magistrale
			
	Appare nelle tipologie:
	
				Tesi di laurea Magistrale

File allegati

File	Dimensione	Formato
2018_04_Marocchi_Crippa.pdf accessibile in internet per tutti Descrizione: Thesis text Dimensione 2.54 MB Formato Adobe PDF Visualizza/Apri	2.54 MB	Adobe PDF	Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/140141