Serverless autoscaling with reinforcement learning across the computing continuum

Serverless computing has become a popular paradigm in cloud systems, as it enables developers to deploy applications without managing the underlying infrastructure. With the evolution of serverless platforms towards the edge, cloud providers require new autoscaling mechanisms to ensure that applications meet performance constraints while minimizing resource usage. Traditional scaling strategies are often too rigid for the high dynamicity and heterogeneity that characterize the cloud-edge continuum, motivating the use of reinforcement learning (RL) approaches. This thesis presents an architecture that combines Serverledge, a decentralized Function-as-a-Service (FaaS) framework, with FIGARO, a RL-based autoscaling agent, to provide adaptive scaling decisions for serverless functions. A controller is developed to integrate the two frameworks, manage metric collection, and enforce scaling actions. VideoSearcher, an AI workflow composed of six functions, is implemented as a benchmark application, and a workload generator is used to produce realistic utilization patterns. The experimental results demonstrate that service times of each function are deterministic, justifying the adoption of an M/D/1 queueing model for accurate offline agent training. The impact analysis of different agent decision intervals identifies a period of 120 seconds as an effective trade-off between responsiveness and stability. The validation of agents' conservative behavior shows that the learned policy provisions exactly the minimum number of resources required to respect both local and global Quality of Service constraints. Overall, this work confirms the feasibility of integrating RL-based autoscaling into a real serverless platform, and provides a foundation for extending autoscaling across the computing continuum.

Il serverless computing è diventato un paradigma diffuso nei sistemi cloud poiché consente agli sviluppatori di distribuire applicazioni senza doverne gestire l'infrastruttura sottostante. Con l'evoluzione delle piattaforme serverless verso l'edge, i cloud provider ricercano nuovi meccanismi di autoscaling per garantire che le applicazioni rispettino i vincoli prestazionali, minimizzando al contempo l'utilizzo delle risorse. Le strategie tradizionali di scalabilità sono spesso troppo rigide rispetto all'elevata dinamicità ed eterogeneità che caratterizzano il continuum cloud-edge, motivando l'uso di approcci basati sul reinforcement learning (RL). Questa tesi presenta un'architettura che combina Serverledge, un framework decentralizzato Function-as-a-Service (FaaS), con FIGARO, un agente di autoscaling basato su RL, per fornire decisioni di scalabilità adattive per le funzioni serverless. Viene sviluppato un controller per integrare i due framework, gestire la raccolta di metriche e applicare le azioni di scalabilità. VideoSearcher, un workflow AI composto da sei funzioni, è implementato come applicazione di benchmark, e un generatore di richieste viene utilizzato per produrre simulazioni realistiche di utilizzo. I risultati sperimentali dimostrano che i tempi di servizio di ciascuna funzione sono deterministici e giustificano l'adozione di un modello M/D/1 basato sulla teoria delle code per il pre-addestramento degli agenti. L'analisi dell'impatto di diversi intervalli di decisione degli agenti risulta in un periodo di 120 secondi come compromesso efficace tra reattività e stabilità. Lo studio del comportamento conservativo degli agenti mostra che la policy appresa fornisce esattamente il numero minimo di risorse necessarie per rispettare i vincoli di Qualità del Servizio sia locali che globali. Nel complesso, questo lavoro conferma la fattibilità dell'integrazione dell'autoscaling basato su RL in una piattaforma serverless reale, e fornisce le basi per estendere l'autoscaling all'intero continuum computazionale.