Nowadays, the amount of available computing resources is limitless and the energy consumption in IT is assuming an increasing importance due to the huge number of compute-intensive applications used in business and scientific fields. In 2014 the IT infrastructures in United States consumed about 70 billion kWh and this data has been estimated to grow to 73 billion kWh by 2020. Besides the significant amounts of money (e.g., 7.4 billion dollars in 2011), large energy consumption values also come with enormous volume of greenhouse gases released into the atmosphere. While several efforts have been done to improve the data-centers’ energy efficiency, their energy consumption must be further reduced, for example, taking into consideration the workload heterogeneity. In this thesis, new techniques to evaluate and improve the energy efficiency of data-centers are proposed. To this end, performance modeling approaches such as queuing networks, Petri nets and stochastic processes are applied, and analytical and discrete event simulation techniques are used. To investigate the data-centers energy consumption problem, four different paths are followed: i) a new power model is proposed for better characterize current systems’ architecture; ii) a new energy metric is introduced to account for data-centers’ workload heterogeneity; iii) a new framework is adopted to study Big data applications; iv) epistemic uncertainty is propagated into a model to improve the accuracy of its output measures. The power model proposed in this thesis accounts for both dynamic voltage/frequency scaling and simultaneous multi-threading, two widespread energy saving techniques used in multi-core architectures. The energy per time-unit of execution is the new energy-performance trade-off metric that also considers the heterogeneity of the workload. Pool depletion systems is the framework proposed to analyze all the applications that generate a large number of tasks which must be executed by one or more subsystems with limited capacity (e.g., Big Data applications), and investigate new scheduling strategies to decrease their execution time. Finally, since stochastic models are fundamental in this thesis, epistemic uncertainty propagation is studied. It allows the modeler to take into account the impact of uncertain input parameters on the output measures of the model.

Calcolatori più performanti e un maggior numero di operazioni complesse eseguite sia dalle industrie sia nel campo scientifico hanno portato a un elevato consumo energetico nel settore delle tecnologie dell'informazione. Negli Stati Uniti, tale consumo energetico ammontava a 70 TWh nel 2014 e lo si stima crescere fino a 73 TWh entro il 2020. Il consumo di grandi quantità di energia è un problema per il settore dell'informazione a causa degli ingenti costi economici e ambientali. Nonostante siano stati fatti molti sforzi per diminuire il consumo energetico di queste infrastrutture, ancora molto può essere fatto tenendo in considerazione, per esempio, l'eterogeneità delle applicazioni eseguite. In questa tesi vengono proposti nuovi metodi per valutare e migliorare l'efficienza energetica dei data-center, ricorrendo ad approcci analitici e simulativi per la modellazione delle prestazioni, quali le reti di code, le reti di Petri e i processi stocastici. Per affrontare questo problema abbiamo fatto ricorso a diverse metodologie come: i) un nuovo modello per la miglior caratterizzazione dell'architettura e del consumo energetico dei nuovi sistemi; ii) una nuova metrica che considera l'eterogeneità del carico di lavoro di questi sistemi per valutare con più precisione le loro prestazioni; iii) un nuovo framework per studiare le applicazioni Big Data; iv) l'incertezza epistemica usata per migliorare l'accuratezza dei modelli. Diversamente dai modelli di potenza attualmente disponibili, quello proposto in questa tesi tiene in considerazione, contemporaneamente, due tecniche per il risparmio energetico molto diffuse: il dynamic voltage/frequency scaling e il simultaneous multi-threading. L'energia per unità di tempo di esecuzione, la nuova metrica proposta in questa tesi, valuta anche l'eterogeneità delle applicazioni per studiare il trade-off tra le performance del sistema e il suo consumo energetico. Pool depletion systems è il framework proposto sia per studiare tutte le applicazioni che generano un gran numero di richieste poi eseguite da uno o più sottosistemi con capacità limitata, sia per proporre una nuova strategia di pianificazione in grado di diminuire il tempo di esecuzione di queste applicazioni. Infine, poiché i modelli stocastici sono di fondamentale importanza in questa tesi, è stata considerata anche la propagazione dell'incertezza epistemica, in quanto permette di studiare come i risultati di un modello vengano influenzati dall'incertezza dei suoi parametri in ingresso.

Energy efficiency in large data-centers using performance evaluation techniques

PINCIROLI, RICCARDO

Abstract

Nowadays, the amount of available computing resources is limitless and the energy consumption in IT is assuming an increasing importance due to the huge number of compute-intensive applications used in business and scientific fields. In 2014 the IT infrastructures in United States consumed about 70 billion kWh and this data has been estimated to grow to 73 billion kWh by 2020. Besides the significant amounts of money (e.g., 7.4 billion dollars in 2011), large energy consumption values also come with enormous volume of greenhouse gases released into the atmosphere. While several efforts have been done to improve the data-centers’ energy efficiency, their energy consumption must be further reduced, for example, taking into consideration the workload heterogeneity. In this thesis, new techniques to evaluate and improve the energy efficiency of data-centers are proposed. To this end, performance modeling approaches such as queuing networks, Petri nets and stochastic processes are applied, and analytical and discrete event simulation techniques are used. To investigate the data-centers energy consumption problem, four different paths are followed: i) a new power model is proposed for better characterize current systems’ architecture; ii) a new energy metric is introduced to account for data-centers’ workload heterogeneity; iii) a new framework is adopted to study Big data applications; iv) epistemic uncertainty is propagated into a model to improve the accuracy of its output measures. The power model proposed in this thesis accounts for both dynamic voltage/frequency scaling and simultaneous multi-threading, two widespread energy saving techniques used in multi-core architectures. The energy per time-unit of execution is the new energy-performance trade-off metric that also considers the heterogeneity of the workload. Pool depletion systems is the framework proposed to analyze all the applications that generate a large number of tasks which must be executed by one or more subsystems with limited capacity (e.g., Big Data applications), and investigate new scheduling strategies to decrease their execution time. Finally, since stochastic models are fundamental in this thesis, epistemic uncertainty propagation is studied. It allows the modeler to take into account the impact of uncertain input parameters on the output measures of the model.
BONARINI, ANDREA
PERNICI, BARBARA
6-feb-2018
Calcolatori più performanti e un maggior numero di operazioni complesse eseguite sia dalle industrie sia nel campo scientifico hanno portato a un elevato consumo energetico nel settore delle tecnologie dell'informazione. Negli Stati Uniti, tale consumo energetico ammontava a 70 TWh nel 2014 e lo si stima crescere fino a 73 TWh entro il 2020. Il consumo di grandi quantità di energia è un problema per il settore dell'informazione a causa degli ingenti costi economici e ambientali. Nonostante siano stati fatti molti sforzi per diminuire il consumo energetico di queste infrastrutture, ancora molto può essere fatto tenendo in considerazione, per esempio, l'eterogeneità delle applicazioni eseguite. In questa tesi vengono proposti nuovi metodi per valutare e migliorare l'efficienza energetica dei data-center, ricorrendo ad approcci analitici e simulativi per la modellazione delle prestazioni, quali le reti di code, le reti di Petri e i processi stocastici. Per affrontare questo problema abbiamo fatto ricorso a diverse metodologie come: i) un nuovo modello per la miglior caratterizzazione dell'architettura e del consumo energetico dei nuovi sistemi; ii) una nuova metrica che considera l'eterogeneità del carico di lavoro di questi sistemi per valutare con più precisione le loro prestazioni; iii) un nuovo framework per studiare le applicazioni Big Data; iv) l'incertezza epistemica usata per migliorare l'accuratezza dei modelli. Diversamente dai modelli di potenza attualmente disponibili, quello proposto in questa tesi tiene in considerazione, contemporaneamente, due tecniche per il risparmio energetico molto diffuse: il dynamic voltage/frequency scaling e il simultaneous multi-threading. L'energia per unità di tempo di esecuzione, la nuova metrica proposta in questa tesi, valuta anche l'eterogeneità delle applicazioni per studiare il trade-off tra le performance del sistema e il suo consumo energetico. Pool depletion systems è il framework proposto sia per studiare tutte le applicazioni che generano un gran numero di richieste poi eseguite da uno o più sottosistemi con capacità limitata, sia per proporre una nuova strategia di pianificazione in grado di diminuire il tempo di esecuzione di queste applicazioni. Infine, poiché i modelli stocastici sono di fondamentale importanza in questa tesi, è stata considerata anche la propagazione dell'incertezza epistemica, in quanto permette di studiare come i risultati di un modello vengano influenzati dall'incertezza dei suoi parametri in ingresso.
Tesi di dottorato
File allegati
File Dimensione Formato  
PINCIROLI_thesis_PhD.pdf

Open Access dal 17/01/2019

Descrizione: Testo della tesi
Dimensione 6.38 MB
Formato Adobe PDF
6.38 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/137637