The aim of this project is to determinate an efficient strategy (policy), from a given database of plays. It will be done the machine learning with Reinforcement Learning, with Fitted Q-Iterations utilizing a regressor Extremely Randomized Trees.

Lo scopo del progetto è determinare strategie (politiche) efficace, a partire di uno specifico database di giocate. Sarà realizzato il machine learning col apprendimento per rinforzo, in particolare con iterazione del tipo Fitted Q-iteration e con l'utilizzo del regressore Extremly Randomized Trees.

Apprendimento off-line nel poker (batch learning)

VILELLA, RAFAEL DOMINGUES SANTOS
2009/2010

Abstract

The aim of this project is to determinate an efficient strategy (policy), from a given database of plays. It will be done the machine learning with Reinforcement Learning, with Fitted Q-Iterations utilizing a regressor Extremely Randomized Trees.
ING V - Facolta' di Ingegneria dell'Informazione
22-ott-2010
2009/2010
Lo scopo del progetto è determinare strategie (politiche) efficace, a partire di uno specifico database di giocate. Sarà realizzato il machine learning col apprendimento per rinforzo, in particolare con iterazione del tipo Fitted Q-iteration e con l'utilizzo del regressore Extremly Randomized Trees.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Tesi_Vilella_1409.pdf

accessibile in internet per tutti

Descrizione: Tesina Rafael
Dimensione 1.36 MB
Formato Adobe PDF
1.36 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/5622