The current trend to increase the performance of computing systems is to shift from instruction level parallelism to task level parallelism, with multi core architectures being mainstream, and many-core systems already used for specialized tasks and expected in the near future to become widely deployed. This, coupled with the continuous technology scaling has exacerbated a reliability issue caused by the power consumption of heavy loaded functional units which cause severe temperature gradients in the silicon die, the so called "hot spots", as well as thermal cycles caused by highly varying processor workloads. These problems will all lead to the issue of dark silicon, where the limited ability to dissipate heat reduces the portion of a chip that can be turned on as technology scaling progresses, significantly reducing the achievable performance despite the progress achieved thanks to Moore's Law scaling continues. It is thus expected that in the near future, with the introduction of new techniques such as 3D stacking to further increase system performance, these issues will become increasingly significant, and will require much more elaborate thermal control techniques than the ones currently employed. The aim of this thesis is twofold. First, novel thermal and power control strategies have been developed to face the needs of future multicore architectures, based on the application of control theory. Second, a state of the art simulation framework has been developed that is able to perform the assessment of dynamic thermal management and power-performance policies comprising a cycle accurate simulator and accurate sensor and actuator models, being thus able to test policies in a realistic setting. Experimental results using the proposed simulation framework and standard benchmark suites such as MiBench have been used to evaluate the proposed policies, and assessing the resulted performance improvements beyond the state of the art.

La strada attualmente perseguita per incrementare la potenza di calcolo dei sistemi di computazione consiste nel passare dall'incremento del parallelismo a livello di istruzione all'introduzione di più flussi di esecuzione paralleli, con architetture multiprocessore già affermate e diffuse, mentre architetture con un numero elevato di processori, dette many-core già utilizzate come acceleratori per applicazioni specifiche, quali il calcolo scientifico. Ci si aspetta che queste architetture diventeranno sempre più affermate anche per applicazioni generali nel breve futuro. Questo fatto, unito alla progressiva riduzione delle dimensioni dei transistor sta causando problemi di affidabilità in quanto la densità di potenza delle architetture attuali, unita alla disuniforme distribuzione del consumo tra i vari processori e le loro unità funzionali genera dei "punti caldi" e cicli termici causati da dei carichi di CPU variabili. Queste ed altre considerazioni portano al cosiddetto problema del dark silicon, dove la ridotta capacità di dissipare il calore generato forza a ridurre il numero di transistor che possono essere tenuti operativi alla massima frequenza ad una frazione che si riduce con il progredire dell scaling tecnologico. Questo porta ad una riduzione dell'incremento di prestazioni nel passaggio da una generazione alla successiva, nonstante il suddetto scaling secondo la legge di Moore continui. Inoltre, ci si aspetta che l'introduzione di tecnologie innovative per incrementare la capacità di calcolo quali il 3D stacking, che consiste nel costruire un circuito integrato con più strati di silicio dotati di componenti attivi, causino un ulteriore incremento della densità di potenza, richiedendo quindi tecniche molto più elaborate di quelle utilizzate attualente in produzione per controllare la dissiapzione di potenza all'interno dei futuri sistemi multiprocessore. Lo scopo della presente tesi di dottorato è duplice. Innanzitutto, sono state sviluppate delle innovative tecniche per controllare la temperatura dei futuri sistemi multiprocessore, nonchè la potenza dissipata, basandosi sulla teoria del controllo. Inoltre, un flusso di simulazione è stato sviluppato, in grado di verificare le prestazioni delle suddette politiche di controllo. Il simulatore può simulare una architettura multiprocessore a livello del singolo ciclo macchina ed è dotato di accurati modelli per quanto riguarda sensori e attuatori, essendo quindi in grado di simulare le politiche in un ambiente realistico, tenendo conto delle non idealità degli attuatori e dei sensori, nonchè dei costi di attuazione. Risultati sperimentali ottenuti grazie al flusso di simulazione e benchmark standard sono stati utilizzati per validare le politiche presentate, validando gli incrementi di prestazioni ottenuti rispetto allo stato dell'arte.

Thermal and energy management techniques for multi-core and many-core systems

TERRANEO, FEDERICO

Abstract

The current trend to increase the performance of computing systems is to shift from instruction level parallelism to task level parallelism, with multi core architectures being mainstream, and many-core systems already used for specialized tasks and expected in the near future to become widely deployed. This, coupled with the continuous technology scaling has exacerbated a reliability issue caused by the power consumption of heavy loaded functional units which cause severe temperature gradients in the silicon die, the so called "hot spots", as well as thermal cycles caused by highly varying processor workloads. These problems will all lead to the issue of dark silicon, where the limited ability to dissipate heat reduces the portion of a chip that can be turned on as technology scaling progresses, significantly reducing the achievable performance despite the progress achieved thanks to Moore's Law scaling continues. It is thus expected that in the near future, with the introduction of new techniques such as 3D stacking to further increase system performance, these issues will become increasingly significant, and will require much more elaborate thermal control techniques than the ones currently employed. The aim of this thesis is twofold. First, novel thermal and power control strategies have been developed to face the needs of future multicore architectures, based on the application of control theory. Second, a state of the art simulation framework has been developed that is able to perform the assessment of dynamic thermal management and power-performance policies comprising a cycle accurate simulator and accurate sensor and actuator models, being thus able to test policies in a realistic setting. Experimental results using the proposed simulation framework and standard benchmark suites such as MiBench have been used to evaluate the proposed policies, and assessing the resulted performance improvements beyond the state of the art.
FIORINI, CARLO ETTORE
AMIGONI, FRANCESCO
16-feb-2015
La strada attualmente perseguita per incrementare la potenza di calcolo dei sistemi di computazione consiste nel passare dall'incremento del parallelismo a livello di istruzione all'introduzione di più flussi di esecuzione paralleli, con architetture multiprocessore già affermate e diffuse, mentre architetture con un numero elevato di processori, dette many-core già utilizzate come acceleratori per applicazioni specifiche, quali il calcolo scientifico. Ci si aspetta che queste architetture diventeranno sempre più affermate anche per applicazioni generali nel breve futuro. Questo fatto, unito alla progressiva riduzione delle dimensioni dei transistor sta causando problemi di affidabilità in quanto la densità di potenza delle architetture attuali, unita alla disuniforme distribuzione del consumo tra i vari processori e le loro unità funzionali genera dei "punti caldi" e cicli termici causati da dei carichi di CPU variabili. Queste ed altre considerazioni portano al cosiddetto problema del dark silicon, dove la ridotta capacità di dissipare il calore generato forza a ridurre il numero di transistor che possono essere tenuti operativi alla massima frequenza ad una frazione che si riduce con il progredire dell scaling tecnologico. Questo porta ad una riduzione dell'incremento di prestazioni nel passaggio da una generazione alla successiva, nonstante il suddetto scaling secondo la legge di Moore continui. Inoltre, ci si aspetta che l'introduzione di tecnologie innovative per incrementare la capacità di calcolo quali il 3D stacking, che consiste nel costruire un circuito integrato con più strati di silicio dotati di componenti attivi, causino un ulteriore incremento della densità di potenza, richiedendo quindi tecniche molto più elaborate di quelle utilizzate attualente in produzione per controllare la dissiapzione di potenza all'interno dei futuri sistemi multiprocessore. Lo scopo della presente tesi di dottorato è duplice. Innanzitutto, sono state sviluppate delle innovative tecniche per controllare la temperatura dei futuri sistemi multiprocessore, nonchè la potenza dissipata, basandosi sulla teoria del controllo. Inoltre, un flusso di simulazione è stato sviluppato, in grado di verificare le prestazioni delle suddette politiche di controllo. Il simulatore può simulare una architettura multiprocessore a livello del singolo ciclo macchina ed è dotato di accurati modelli per quanto riguarda sensori e attuatori, essendo quindi in grado di simulare le politiche in un ambiente realistico, tenendo conto delle non idealità degli attuatori e dei sensori, nonchè dei costi di attuazione. Risultati sperimentali ottenuti grazie al flusso di simulazione e benchmark standard sono stati utilizzati per validare le politiche presentate, validando gli incrementi di prestazioni ottenuti rispetto allo stato dell'arte.
Tesi di dottorato
File allegati
File Dimensione Formato  
2015_02_PhD_Terraneo.pdf

Open Access dal 27/01/2018

Descrizione: Thesis text
Dimensione 3.98 MB
Formato Adobe PDF
3.98 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/100468