Sfoglia per Relatore
Mostrati risultati da 1 a 6 di 6
Best model selection via stochastic rising bandits
2022/2023 MONTENEGRO, ALESSANDRO
Exploiting sub-optimal expert behaviors in inverse reinforcement learning
2022/2023 Curti, Gabriele
On the sample complexity of inverse reinforcement learning
2022/2023 Lazzati, Filippo
Online learning for PID controller tuning
2023/2024 Abbattista, Valentina
Smoothed OMD: an Algorithm for No-regret Learning in Adversarial MDPs with Revealed Transitions
2023/2024 Corso, Federico
Towards fully-adaptive regret minimization in heavy-tailed bandits
2022/2023 Marsigli, Lupo
Fulltext | Data | Tipo | Titolo | Autore (i) |
---|---|---|---|---|
2023-05-04 | Tesi di laurea Magistrale | Best model selection via stochastic rising bandits | MONTENEGRO, ALESSANDRO | |
2023-12-19 | Tesi di laurea Magistrale | Exploiting sub-optimal expert behaviors in inverse reinforcement learning | Curti, Gabriele | |
2023-05-04 | Tesi di laurea Magistrale | On the sample complexity of inverse reinforcement learning | Lazzati, Filippo | |
2024-10-10 | Tesi di laurea Magistrale | Online learning for PID controller tuning | Abbattista, Valentina | |
2024-07-16 | Tesi di laurea Magistrale | Smoothed OMD: an Algorithm for No-regret Learning in Adversarial MDPs with Revealed Transitions | Corso, Federico | |
2023-10-05 | Tesi di laurea Magistrale | Towards fully-adaptive regret minimization in heavy-tailed bandits | Marsigli, Lupo |
Mostrati risultati da 1 a 6 di 6
Legenda icone accesso al fulltext
- File accessibili da tutti
- File accessibili dagli utenti autorizzati
- File accessibili da tutti o solo dagli utenti autorizzati, a partire dalla la data indicata nella scheda
- File non accessibili