The use of virtualization technologies in High Performance Computing and RealTime applications has become an accepted practice. Indeed, the majority of the HPC applications are moving to the infrastructures offered by the Cloud, thanks to the cost savings and flexibility they bring. Exceptions come primarily from security-sensitive applications such as those in the Defense field or applications with nanosecond-level latencies that can be found, for example, in high frequency trading. At the same time, the use of virtual machines have gained popularity in Real-Time systems for the ease offered in integrating and supporting mixedcriticality systems. Finally, with the advent of 5G technology, Network Function Virtualization is gaining traction, with low-latency network services deployed on top of virtual machines. The scientific community has demonstrated how these kinds of workload achieve comparable performance when run on top of a virtual machine and on bare-metal. However, the standard tools and benchmarks used to debug the systems where these kind of applications need to run, do not focus on the impact that virtualization has on the overall performance, and do not provide the causes of performance degradations that virtualization introduces, when encountered. This work highlights the role virtualization plays in the performance deficits experienced by low-latency applications and improves the debugging of the systems where these workloads are executed. It does so by extending the Osnoise tracer, an in-kernel tracer in the Linux operating system, that allows both the measurement and the tracing of the Operating System Noise, a well-known problem in the HPC domain, with impact on Real-Time applications as well. Osnoise provides both the measurements and the tracing of the sources of the noise, in an integrated manner, facilitating the analysis and debugging of the system. Starting from this contribution, the work extends the tool following a similar approach, by first allowing to measure the impact that the virtualization has on the overall Operating System Noise experienced by a workload, and then providing the tracing information, to reconstruct the events that lead to the virtualization noise measured. It finally shows how the extension is practically useful to speed-up the debugging of the system where a virtual machine is under execution.

Ad oggi, è prassi consolidata l’utilizzo delle tecnologie di virtualizzazione nelle applicazioni di High Performance Computing e Real-Time. La maggior parte delle applicazioni HPC si sta infatti spostando verso le infrastrutture offerte dal Cloud, grazie alla riduzione dei costi e alla flessibilità che esse comportano. Fanno eccezione le applicazioni sensibili alla sicurezza, come quelle del settore della Difesa, o le applicazioni con latenze nell’ordine dei nanosecondi, come quelle che si possono trovare, ad esempio, nel trading ad alta frequenza. Allo stesso tempo, l’uso di macchine virtuali ha guadagnato popolarità nei sistemi Real-Time per la facilità di integrazione e supporto nei sistemi a criticità mista. Infine, con l’avvento della tecnologia 5G, la virtualizzazione delle funzioni di networking sta guadagnando terreno, con servizi di rete a bassa latenza distribuiti su macchine virtuali. La comunità scientifica ha dimostrato come questi tipi di carichi di lavoro raggiungano prestazioni comparabili quando vengono eseguiti su una macchina virtuale e su bare-metal. Tuttavia, gli strumenti e i benchmark utilizzati per il debug dei sistemi in cui devono essere eseguite questo tipo di applicazioni non si concentrano sull’impatto che la virtualizzazione ha sulle prestazioni complessive e non forniscono le cause dei deterioramenti delle prestazioni che la virtualizzazione introduce. Questo lavoro evidenzia il ruolo della virtualizzazione nei deficit di prestazioni delle applicazioni a bassa latenza e migliora il debugging dei sistemi in cui vengono eseguiti questi carichi di lavoro. Lo fa estendendo Osnoise, un tracer del sistema operativo Linux, che consente di misurare e tracciare il rumore del sistema operativo, un problema ben noto nel settore HPC, con un impatto anche sulle applicazioni real-time. Osnoise fornisce sia le misure che l’identificazione delle sorgenti del rumore, in modo integrato, facilitando l’analisi e il debug del sistema. Partendo da questo contributo, questo lavoro estende osnoise seguendo un approccio simile, consentendo innanzitutto di misurare l’impatto che la virtualizzazione ha sul rumore complessivo del sistema operativo sperimentato da un carico di lavoro, e fornendo poi le informazioni per ricostruire gli eventi che portano al rumore di virtualizzazione misurato. Infine, viene mostrato come l’estensione sia utilizzabile per accelerare il debugging del sistema in cui è in esecuzione una macchina virtuale.

Characterization of virtualization-induced noise in high-performance computing and real-time virtual machines

Aristei, Francesco
2022/2023

Abstract

The use of virtualization technologies in High Performance Computing and RealTime applications has become an accepted practice. Indeed, the majority of the HPC applications are moving to the infrastructures offered by the Cloud, thanks to the cost savings and flexibility they bring. Exceptions come primarily from security-sensitive applications such as those in the Defense field or applications with nanosecond-level latencies that can be found, for example, in high frequency trading. At the same time, the use of virtual machines have gained popularity in Real-Time systems for the ease offered in integrating and supporting mixedcriticality systems. Finally, with the advent of 5G technology, Network Function Virtualization is gaining traction, with low-latency network services deployed on top of virtual machines. The scientific community has demonstrated how these kinds of workload achieve comparable performance when run on top of a virtual machine and on bare-metal. However, the standard tools and benchmarks used to debug the systems where these kind of applications need to run, do not focus on the impact that virtualization has on the overall performance, and do not provide the causes of performance degradations that virtualization introduces, when encountered. This work highlights the role virtualization plays in the performance deficits experienced by low-latency applications and improves the debugging of the systems where these workloads are executed. It does so by extending the Osnoise tracer, an in-kernel tracer in the Linux operating system, that allows both the measurement and the tracing of the Operating System Noise, a well-known problem in the HPC domain, with impact on Real-Time applications as well. Osnoise provides both the measurements and the tracing of the sources of the noise, in an integrated manner, facilitating the analysis and debugging of the system. Starting from this contribution, the work extends the tool following a similar approach, by first allowing to measure the impact that the virtualization has on the overall Operating System Noise experienced by a workload, and then providing the tracing information, to reconstruct the events that lead to the virtualization noise measured. It finally shows how the extension is practically useful to speed-up the debugging of the system where a virtual machine is under execution.
BONZINI, PAOLO
BRISTOT DE OLIVEIRA, DANIEL
ING - Scuola di Ingegneria Industriale e dell'Informazione
19-dic-2023
2022/2023
Ad oggi, è prassi consolidata l’utilizzo delle tecnologie di virtualizzazione nelle applicazioni di High Performance Computing e Real-Time. La maggior parte delle applicazioni HPC si sta infatti spostando verso le infrastrutture offerte dal Cloud, grazie alla riduzione dei costi e alla flessibilità che esse comportano. Fanno eccezione le applicazioni sensibili alla sicurezza, come quelle del settore della Difesa, o le applicazioni con latenze nell’ordine dei nanosecondi, come quelle che si possono trovare, ad esempio, nel trading ad alta frequenza. Allo stesso tempo, l’uso di macchine virtuali ha guadagnato popolarità nei sistemi Real-Time per la facilità di integrazione e supporto nei sistemi a criticità mista. Infine, con l’avvento della tecnologia 5G, la virtualizzazione delle funzioni di networking sta guadagnando terreno, con servizi di rete a bassa latenza distribuiti su macchine virtuali. La comunità scientifica ha dimostrato come questi tipi di carichi di lavoro raggiungano prestazioni comparabili quando vengono eseguiti su una macchina virtuale e su bare-metal. Tuttavia, gli strumenti e i benchmark utilizzati per il debug dei sistemi in cui devono essere eseguite questo tipo di applicazioni non si concentrano sull’impatto che la virtualizzazione ha sulle prestazioni complessive e non forniscono le cause dei deterioramenti delle prestazioni che la virtualizzazione introduce. Questo lavoro evidenzia il ruolo della virtualizzazione nei deficit di prestazioni delle applicazioni a bassa latenza e migliora il debugging dei sistemi in cui vengono eseguiti questi carichi di lavoro. Lo fa estendendo Osnoise, un tracer del sistema operativo Linux, che consente di misurare e tracciare il rumore del sistema operativo, un problema ben noto nel settore HPC, con un impatto anche sulle applicazioni real-time. Osnoise fornisce sia le misure che l’identificazione delle sorgenti del rumore, in modo integrato, facilitando l’analisi e il debug del sistema. Partendo da questo contributo, questo lavoro estende osnoise seguendo un approccio simile, consentendo innanzitutto di misurare l’impatto che la virtualizzazione ha sul rumore complessivo del sistema operativo sperimentato da un carico di lavoro, e fornendo poi le informazioni per ricostruire gli eventi che portano al rumore di virtualizzazione misurato. Infine, viene mostrato come l’estensione sia utilizzabile per accelerare il debugging del sistema in cui è in esecuzione una macchina virtuale.
File allegati
File Dimensione Formato  
2023_12_Aristei_Executive_Summary_02.pdf

accessibile in internet per tutti

Descrizione: Executive Summary
Dimensione 350.32 kB
Formato Adobe PDF
350.32 kB Adobe PDF Visualizza/Apri
2023_12_Aristei_Tesi_01.pdf

accessibile in internet per tutti

Descrizione: Thesis
Dimensione 1.56 MB
Formato Adobe PDF
1.56 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/214236