Naviga POLITesi

Sfoglia per Relatore

Opzioni

Ordina per:

In ordine:

Risultati/Pagina

Vai a: 0-9 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

o inserisci le iniziali:

Mostrati risultati da 159 a 178 di 181

Safe policy iteration : a monotonically improving approximate policy iteration approach

2011/2012 PECORINO, ALESSIO

Safe policy optimization

2020/2021 Papini, Matteo

Sales funnel simulation and sales forecasting with Markov chains

2020/2021 Fontana, Fabio

Scalable power network control with reinforcement learning

2021/2022 Paletti, Daniele

Solving time-varying maze with deep reinforcement learning for tiny devices

2021/2022 Colella, Stefano

Stochastic multi-armed bandit with switching costs : an empirical analysis

2017/2018 SCANNAPIECO, LUCA

Stochastic variance reduced policy gradient

2017/2018 CANONACO, GIUSEPPE

Studio e analisi di algoritmi di apprendimento per rinforzo policy gradient per la risoluzione di problemi decisionali multiobiettivo

2012/2013 PARISI, SIMONE

TargExp: an Algorithm for Audience Expansion and Profit Maximization for Online Advertising

2022/2023 EL KHOURY, JANA

TargOpt: a targeting optimization algorithm for online advertising

2021/2022 Gentile, Nicole

Task-agnostic exploration via maximum state entropy policy optimization

2019/2020 Pratissoli, Lorenzo

Teaching a learner driver using reinforcement learning and planning strategies

2020/2021 VALERIANI, ANGELICA SOFIA

Time-variant distribution learning with importance sampling regularization: the Forex case study

2023/2024 Lunardi, Chiara

Time-variant variational transfer for value functions

2019/2020 Soprani, Andrea

Tourism analysis on a large scale using mobile location data

2018/2019 TULLII, FRANCESCO

Towards Automated Reinforcement Learning

2020/2021 Lombarda, Davide

Towards making importance sampling practical

2020/2021 Russo, Alessio

Towards robust machine learning applications : a framework for monitoring, retraining, and online model selection

2021/2022 Fabris, Matteo

Transfer in policy gradients via multiple importance sampling

2018/2019 SALVINI, MATTIA

Transfer learning for actor-critic methods in Lipschitz Markov decision processes

2016/2017 VACCA MANRIQUE, DANIEL FELIPE

Data	Tipo	Titolo	Autore (i)
2012-10-04	Tesi di laurea Magistrale	Safe policy iteration : a monotonically improving approximate policy iteration approach	PECORINO, ALESSIO; PIROTTA, MATTEO
2021-03-11	Tesi di Dottorato	Safe policy optimization	Papini, Matteo
2021-12-21	Tesi di laurea Magistrale	Sales funnel simulation and sales forecasting with Markov chains	Fontana, Fabio
2022-12-20	Tesi di laurea Magistrale	Scalable power network control with reinforcement learning	Paletti, Daniele
2022-12-20	Tesi di laurea Magistrale	Solving time-varying maze with deep reinforcement learning for tiny devices	Colella, Stefano
2018-12-20	Tesi di laurea Magistrale	Stochastic multi-armed bandit with switching costs : an empirical analysis	SCANNAPIECO, LUCA
2018-04-19	Tesi di laurea Magistrale	Stochastic variance reduced policy gradient	CANONACO, GIUSEPPE; BINAGHI, DAMIANO
2014-04-29	Tesi di laurea Magistrale	Studio e analisi di algoritmi di apprendimento per rinforzo policy gradient per la risoluzione di problemi decisionali multiobiettivo	PARISI, SIMONE; SMACCHIA, NICOLA
2023-12-19	Tesi di laurea Magistrale	TargExp: an Algorithm for Audience Expansion and Profit Maximization for Online Advertising	EL KHOURY, JANA
2022-12-20	Tesi di laurea Magistrale	TargOpt: a targeting optimization algorithm for online advertising	Gentile, Nicole
2020-07-24	Tesi di laurea Magistrale	Task-agnostic exploration via maximum state entropy policy optimization	Pratissoli, Lorenzo
2021-10-07	Tesi di laurea Magistrale	Teaching a learner driver using reinforcement learning and planning strategies	VALERIANI, ANGELICA SOFIA
2024-04-09	Tesi di laurea Magistrale	Time-variant distribution learning with importance sampling regularization: the Forex case study	Lunardi, Chiara
2020-07-24	Tesi di laurea Magistrale	Time-variant variational transfer for value functions	Soprani, Andrea
2019-04-16	Tesi di laurea Magistrale	Tourism analysis on a large scale using mobile location data	TULLII, FRANCESCO
2022-04-28	Tesi di laurea Magistrale	Towards Automated Reinforcement Learning	Lombarda, Davide
2021-10-07	Tesi di laurea Magistrale	Towards making importance sampling practical	Russo, Alessio
2023-05-04	Tesi di laurea Magistrale	Towards robust machine learning applications : a framework for monitoring, retraining, and online model selection	Fabris, Matteo
2019-04-16	Tesi di laurea Magistrale	Transfer in policy gradients via multiple importance sampling	SALVINI, MATTIA
2017-12-21	Tesi di laurea Magistrale	Transfer learning for actor-critic methods in Lipschitz Markov decision processes	VACCA MANRIQUE, DANIEL FELIPE

Mostrati risultati da 159 a 178 di 181

Legenda icone accesso al fulltext

File accessibili da tutti
File accessibili dagli utenti autorizzati
File accessibili da tutti o solo dagli utenti autorizzati, a partire dalla la data indicata nella scheda
File non accessibili