Apprendimento off-line nel poker (batch learning)

Biblioteche e Archivi
POLITesi - Archivio digitale delle tesi di laurea e di dottorato

The aim of this project is to determinate an efficient strategy (policy), from a given database of plays. It will be done the machine learning with Reinforcement Learning, with Fitted Q-Iterations utilizing a regressor Extremely Randomized Trees.

Lo scopo del progetto è determinare strategie (politiche) efficace, a partire di uno specifico database di giocate. Sarà realizzato il machine learning col apprendimento per rinforzo, in particolare con iterazione del tipo Fitted Q-iteration e con l'utilizzo del regressore Extremly Randomized Trees.

Apprendimento off-line nel poker (batch learning)

VILELLA, RAFAEL DOMINGUES SANTOS

2009/2010

Abstract

The aim of this project is to determinate an efficient strategy (policy), from a given database of plays. It will be done the machine learning with Reinforcement Learning, with Fitted Q-Iterations utilizing a regressor Extremely Randomized Trees.

Scheda breve

Scheda completa

	Relatore
	
				RESTELLI, MARCELLO
			
	Scuola / Dip.
	
				ING V - Facolta' di Ingegneria dell'Informazione
			
	Data
	
				22-ott-2010
			
	Anno accademico
	
				2009/2010
			
	Abstract in italiano
	
				Lo scopo del progetto è determinare strategie (politiche) efficace, a partire di uno specifico database di giocate. Sarà realizzato il machine learning col apprendimento per rinforzo, in particolare con iterazione del tipo Fitted Q-iteration e con l'utilizzo del regressore Extremly Randomized Trees.
			
	Tipo di documento
	
				Tesi di laurea Magistrale
			
	Appare nelle tipologie:
	
				Tesi di laurea Magistrale

File allegati

File	Dimensione	Formato
Tesi_Vilella_1409.pdf accessibile in internet per tutti Descrizione: Tesina Rafael Dimensione 1.36 MB Formato Adobe PDF Visualizza/Apri	1.36 MB	Adobe PDF	Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/5622