The aim of this project is to determinate an efficient strategy (policy), from a given database of plays. It will be done the machine learning with Reinforcement Learning, with Fitted Q-Iterations utilizing a regressor Extremely Randomized Trees.
Lo scopo del progetto è determinare strategie (politiche) efficace, a partire di uno specifico database di giocate. Sarà realizzato il machine learning col apprendimento per rinforzo, in particolare con iterazione del tipo Fitted Q-iteration e con l'utilizzo del regressore Extremly Randomized Trees.
Apprendimento off-line nel poker (batch learning)
VILELLA, RAFAEL DOMINGUES SANTOS
2009/2010
Abstract
The aim of this project is to determinate an efficient strategy (policy), from a given database of plays. It will be done the machine learning with Reinforcement Learning, with Fitted Q-Iterations utilizing a regressor Extremely Randomized Trees.File allegati
File | Dimensione | Formato | |
---|---|---|---|
Tesi_Vilella_1409.pdf
accessibile in internet per tutti
Descrizione: Tesina Rafael
Dimensione
1.36 MB
Formato
Adobe PDF
|
1.36 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
Utilizza questo identificativo per citare o creare un link a questo documento:
https://hdl.handle.net/10589/5622