A new infrastructure paradigm known as the Compute Continuum has emerged in the era of Edge Computing, connecting IoT sensors to Cloud Data Centers with a variety of intermediate devices. This new approach brought about a series of challenges related to managing diverse computing resources, abstracting complexity, and achieving efficient data management. Another critical aspect of the Compute Continua is multi-tenancy, which can threaten the privacy of the sensitive data used especially in Machine Learning workflows, thus introducing the need of enhanced security measures. Noteworthy solutions to tackle these new issues are COMPSs, a framework developed by the Barcelona Supercomputing Center with the aim of making application development easier for the Cloud-Edge-IoT Continuum, and SCONE, a framework that employs the SGX trusted execution support of Intel CPUs to safeguard in-memory application data from unauthorized access. This thesis focuses on analyzing the execution times of an application that adopts COMPs to orchestrate the execution of a Random Forest model to classify ECGs in a medical setting, and SCONE to protect the sensitive data handled by the classifier itself. The study aims to make use of the tools provided by aMLLibrary to build regression models capable of predicting the average execution time of the application given the number of cores used to run it, effectively aiding decision-makers in resource allocation and performance optimization while identifying potential problems before they impact user experience or cost-efficiency.

Nell'era dell'Edge Computing è emerso un nuovo paradigma infrastrutturale, noto come Compute Continuum, che collega i sensori IoT ai centri dati cloud con una serie di dispositivi intermedi. Questo nuovo approccio ha comportato una serie di sfide legate alla gestione di risorse informatiche eterogenee, all'astrazione della complessità e alla gestione efficiente dei dati. Un altro aspetto critico della Compute Continua è la multi-tenancy, che può minacciare la privacy dei dati sensibili utilizzati soprattutto nei flussi di lavoro di Machine Learning, introducendo così la necessità di misure di sicurezza avanzate. Soluzioni degne di nota per affrontare questi nuovi problemi sono COMPSs, un framework sviluppato dal Barcelona Supercomputing Center con l'obiettivo di facilitare lo sviluppo di applicazioni per il Cloud-Edge-IoT Continuum, e SCONE, un framework che impiega il supporto per la trusted execution di SGX delle CPU Intel per salvaguardare i dati nella memoria delle applicazioni da accessi non autorizzati. Questa tesi si concentra sull'analisi dei tempi di esecuzione di un'applicazione che adotta COMPSs per orchestrare l'esecuzione di un modello Random Forest per classificare gli ECG in ambito medico e SCONE per proteggere i dati sensibili trattati dal classificatore stesso. Lo studio si propone di utilizzare gli strumenti forniti da aMLLibrary per costruire modelli di regressione in grado di prevedere il tempo medio di esecuzione dell'applicazione in base al numero di core utilizzati per eseguirla, allo scopo di aiutare i decision maker nell'allocazione delle risorse e nell'ottimizzazione delle prestazioni e identificando potenziali problemi prima che abbiano un impatto sull'esperienza dell'utente o sull'efficienza dei costi.

A Data-Driven regression analysis for predicting the execution time of a COMPSs application enhanced with SCONE

Onorati, Christian
2022/2023

Abstract

A new infrastructure paradigm known as the Compute Continuum has emerged in the era of Edge Computing, connecting IoT sensors to Cloud Data Centers with a variety of intermediate devices. This new approach brought about a series of challenges related to managing diverse computing resources, abstracting complexity, and achieving efficient data management. Another critical aspect of the Compute Continua is multi-tenancy, which can threaten the privacy of the sensitive data used especially in Machine Learning workflows, thus introducing the need of enhanced security measures. Noteworthy solutions to tackle these new issues are COMPSs, a framework developed by the Barcelona Supercomputing Center with the aim of making application development easier for the Cloud-Edge-IoT Continuum, and SCONE, a framework that employs the SGX trusted execution support of Intel CPUs to safeguard in-memory application data from unauthorized access. This thesis focuses on analyzing the execution times of an application that adopts COMPs to orchestrate the execution of a Random Forest model to classify ECGs in a medical setting, and SCONE to protect the sensitive data handled by the classifier itself. The study aims to make use of the tools provided by aMLLibrary to build regression models capable of predicting the average execution time of the application given the number of cores used to run it, effectively aiding decision-makers in resource allocation and performance optimization while identifying potential problems before they impact user experience or cost-efficiency.
Sala, Roberto
ING - Scuola di Ingegneria Industriale e dell'Informazione
19-dic-2023
2022/2023
Nell'era dell'Edge Computing è emerso un nuovo paradigma infrastrutturale, noto come Compute Continuum, che collega i sensori IoT ai centri dati cloud con una serie di dispositivi intermedi. Questo nuovo approccio ha comportato una serie di sfide legate alla gestione di risorse informatiche eterogenee, all'astrazione della complessità e alla gestione efficiente dei dati. Un altro aspetto critico della Compute Continua è la multi-tenancy, che può minacciare la privacy dei dati sensibili utilizzati soprattutto nei flussi di lavoro di Machine Learning, introducendo così la necessità di misure di sicurezza avanzate. Soluzioni degne di nota per affrontare questi nuovi problemi sono COMPSs, un framework sviluppato dal Barcelona Supercomputing Center con l'obiettivo di facilitare lo sviluppo di applicazioni per il Cloud-Edge-IoT Continuum, e SCONE, un framework che impiega il supporto per la trusted execution di SGX delle CPU Intel per salvaguardare i dati nella memoria delle applicazioni da accessi non autorizzati. Questa tesi si concentra sull'analisi dei tempi di esecuzione di un'applicazione che adotta COMPSs per orchestrare l'esecuzione di un modello Random Forest per classificare gli ECG in ambito medico e SCONE per proteggere i dati sensibili trattati dal classificatore stesso. Lo studio si propone di utilizzare gli strumenti forniti da aMLLibrary per costruire modelli di regressione in grado di prevedere il tempo medio di esecuzione dell'applicazione in base al numero di core utilizzati per eseguirla, allo scopo di aiutare i decision maker nell'allocazione delle risorse e nell'ottimizzazione delle prestazioni e identificando potenziali problemi prima che abbiano un impatto sull'esperienza dell'utente o sull'efficienza dei costi.
File allegati
File Dimensione Formato  
2023_12_Onorati.pdf

accessibile in internet solo dagli utenti autorizzati

Dimensione 3.72 MB
Formato Adobe PDF
3.72 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/214192