The widespread adoption of Artificial Intelligence (AI) and Machine Learning interacts with the necessity of a more collaborative world, where decentralization and distribution of the systems towards a developed edge in the Internet of Things environment has become a dominant field. A novel computational paradigm has been innovated as the Fog Computing model. The constant collection of huge amount of data within edge devices, the persistent demand for improving data privacy and the adaptation of Deep Learning approaches into distributed context has led to innovative Federated Learning (FL) solutions. AI computational growth coincides with a non-negligible environmental impact in terms of carbon emissions which is mirrored also in FL settings. The persecution of state of the art results has left more space for the advancement of Green AI approaches enhancing the efficiency of AI models, in particular reducing energy consumption. This thesis focuses its efforts on contributing to Green AI by devising a data-centric approach for Green Federated Learning. To achieve this objective, a comprehensive methodology has been proposed, which involves analyzing the influence of various data-centric characteristics, including data quality and data volume, on FL training performance and the resulting carbon emissions. Leveraging the insights gained, an interactive recommendation system for FL configurations, based on data reduction, has been developed to minimize the environmental impact during the training phase. The application of this methodology to time series classification has demonstrated a reduction in carbon emissions by up to 90%.

La diffusa adozione dell’Intelligenza Artificiale (IA) e del Machine Learning interagisce con la necessità di un mondo più collaborativo, dove la decentralizzazione e la distribuzione dei sistemi verso un edge sviluppato nell’ambiente dell’Internet of Things sono diventati un campo dominante. Un nuovo paradigma computazionale è stato innovato come modello di Fog Computing. La costante raccolta di enormi quantità di dati nei dispositivi periferici, la persistente richiesta di migliorare la privacy dei dati e l’adattamento di approcci di Deep Learning in contesti distribuiti hanno portato a soluzioni innovative di Federated Learning (FL). La crescita computazionale dell’IA coincide con un impatto ambientale non trascurabile in termini di emissioni di carbonio, che si riflette anche nelle configurazioni FL. La ricerca dei risultati di ultima generazione ha lasciato più spazio per lo sviluppo di approcci di Green AI che migliorano l’efficienza dei modelli di IA, in particolare riducendo il consumo energetico. Questa tesi focalizza i suoi sforzi nel contribuire alla Green AI ideando un approccio centrato sui dati per il Green Federated Learning. Per raggiungere questo obiettivo, è stata proposta una metodologia completa che coinvolge l’analisi dell’influenza di varie caratteristiche centrate sui dati, tra cui la qualità e il volume dei dati, sulle prestazioni di modelli di FL e sulle relative emissioni di carbonio. Sfruttando le intuizioni acquisite, è stato sviluppato un sistema interattivo per la raccomandazione di configurazioni di FL, basato sulla riduzione dei dati, al fine di minimizzare l’impatto ambientale durante la fase di training. L’applicazione di questa metodologia alla classificazione delle serie temporali ha dimostrato una riduzione delle emissioni di carbonio fino al 90%.

Green Federated Learning: a data-centric approach in the cloud continuum

SABELLA, MATTIA
2022/2023

Abstract

The widespread adoption of Artificial Intelligence (AI) and Machine Learning interacts with the necessity of a more collaborative world, where decentralization and distribution of the systems towards a developed edge in the Internet of Things environment has become a dominant field. A novel computational paradigm has been innovated as the Fog Computing model. The constant collection of huge amount of data within edge devices, the persistent demand for improving data privacy and the adaptation of Deep Learning approaches into distributed context has led to innovative Federated Learning (FL) solutions. AI computational growth coincides with a non-negligible environmental impact in terms of carbon emissions which is mirrored also in FL settings. The persecution of state of the art results has left more space for the advancement of Green AI approaches enhancing the efficiency of AI models, in particular reducing energy consumption. This thesis focuses its efforts on contributing to Green AI by devising a data-centric approach for Green Federated Learning. To achieve this objective, a comprehensive methodology has been proposed, which involves analyzing the influence of various data-centric characteristics, including data quality and data volume, on FL training performance and the resulting carbon emissions. Leveraging the insights gained, an interactive recommendation system for FL configurations, based on data reduction, has been developed to minimize the environmental impact during the training phase. The application of this methodology to time series classification has demonstrated a reduction in carbon emissions by up to 90%.
ING - Scuola di Ingegneria Industriale e dell'Informazione
19-dic-2023
2022/2023
La diffusa adozione dell’Intelligenza Artificiale (IA) e del Machine Learning interagisce con la necessità di un mondo più collaborativo, dove la decentralizzazione e la distribuzione dei sistemi verso un edge sviluppato nell’ambiente dell’Internet of Things sono diventati un campo dominante. Un nuovo paradigma computazionale è stato innovato come modello di Fog Computing. La costante raccolta di enormi quantità di dati nei dispositivi periferici, la persistente richiesta di migliorare la privacy dei dati e l’adattamento di approcci di Deep Learning in contesti distribuiti hanno portato a soluzioni innovative di Federated Learning (FL). La crescita computazionale dell’IA coincide con un impatto ambientale non trascurabile in termini di emissioni di carbonio, che si riflette anche nelle configurazioni FL. La ricerca dei risultati di ultima generazione ha lasciato più spazio per lo sviluppo di approcci di Green AI che migliorano l’efficienza dei modelli di IA, in particolare riducendo il consumo energetico. Questa tesi focalizza i suoi sforzi nel contribuire alla Green AI ideando un approccio centrato sui dati per il Green Federated Learning. Per raggiungere questo obiettivo, è stata proposta una metodologia completa che coinvolge l’analisi dell’influenza di varie caratteristiche centrate sui dati, tra cui la qualità e il volume dei dati, sulle prestazioni di modelli di FL e sulle relative emissioni di carbonio. Sfruttando le intuizioni acquisite, è stato sviluppato un sistema interattivo per la raccomandazione di configurazioni di FL, basato sulla riduzione dei dati, al fine di minimizzare l’impatto ambientale durante la fase di training. L’applicazione di questa metodologia alla classificazione delle serie temporali ha dimostrato una riduzione delle emissioni di carbonio fino al 90%.
File allegati
File Dimensione Formato  
Green_Federated_Learning__a_Data_Centric_Approach_in_the_Cloud_Continuum.pdf

accessibile in internet per tutti

Dimensione 4.15 MB
Formato Adobe PDF
4.15 MB Adobe PDF Visualizza/Apri
Green_Federated_Learning__a_Data_Centric_Approach_in_the_Cloud_Continuum_Extended_Summary.pdf

accessibile in internet per tutti

Dimensione 1.19 MB
Formato Adobe PDF
1.19 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/215701