Sfoglia per Correlatore TOSCHI, FEDERICO
Mostrati risultati da 1 a 2 di 2
| Fulltext | Data | Tipo | Titolo | Autore (i) |
|---|---|---|---|---|
| 2025-10-23 | Tesi di laurea Magistrale | Do we really need GRPO? Rethinking reinforcement learning for reasoning in LLMs | Carrino, Gabriele | |
| 2025-12-10 | Tesi di laurea Magistrale | Don't overthink it: intermittent self-evaluation in reasoning language models playing textual games | Dimaglie, Gregorio |
Mostrati risultati da 1 a 2 di 2
Legenda icone accesso al fulltext
- File accessibili da tutti
- File accessibili dagli utenti autorizzati
- File accessibili da tutti o solo dagli utenti autorizzati, a partire dalla la data indicata nella scheda
- File non accessibili