JOREK is a widely used 3D nonlinear, extended magneto-hydrodynamic and hybrid fluid-kinetic code for investigating large scale transient plasma dynamics in realistic tokamak and stellarator fusion plasmas. In high current tokamaks such as ITER, the loss of plasma confinement in a so-called disruption can generate highly energetic ``runaway`` electrons (REs), which can pose a serious threat to plasma-facing components. Understanding and predicting RE dynamics is therefore essential for the safe operation of future fusion reactors. %To capture these dynamics, a novel hybrid fluid-kinetic model was recently introduced. While JOREK already supports MPI + OpenMP parallelization on CPUs, hybrid RE simulations span widely different timescales, making them computationally prohibitively expensive on conventional CPU based architectures. This thesis addresses that challenge by porting the kinetic component of hybrid RE simulations to GPUs, exploiting their massive parallelism. We detail the optimization strategies employed and present a comprehensive performance and verification study on NVIDIA H100 GPUs by benchmarking realistic RE test cases. The new version achieved a speedup of approximately 4.5x over the best CPU implementation. Performance was shown to depend strongly on memory access patterns, with particle ordering emerging as a key factor. This work enables novel high-fidelity nonlinear 3D hybrid simulations of runaway electrons and opens the path for future extensions to other particle species and different physics applications.

JOREK è un ampiamente utilizzato codice 3D non lineare di magnetoidrodinamica estesa (MHD) e fluido-cinetico ibrido, impiegato per studiare le dinamiche transitorie del plasma su larga scala in configurazioni realistiche di tokamak e stellarator per la fusione nucleare. Nei tokamak ad alta corrente, come ITER, la perdita di confinamento del plasma in una cosiddetta disruption può generare elettroni altamente energetici detti runaway (RE), che rappresentano una seria minaccia per i componenti a contatto con il plasma. Comprendere e prevedere la dinamica degli elettroni runaway è quindi essenziale per il funzionamento sicuro dei futuri reattori a fusione. Sebbene JOREK supporti già la parallelizzazione ibrida MPI + OpenMP su CPU, le simulazioni ibride di RE coprono scale temporali molto diverse, risultando così computazionalmente proibitive sulle architetture tradizionali basate su CPU. Questa tesi affronta tale sfida portando la componente cinetica delle simulazioni ibride di RE su GPU, sfruttando il massiccio parallelismo offerto da queste architetture. Vengono illustrate in dettaglio le strategie di ottimizzazione adottate e presentato uno studio completo di prestazioni e verifica su GPU NVIDIA H100, attraverso il benchmarking di casi di test realistici di RE. La nuova versione ha raggiunto un’accelerazione di circa 4.5x rispetto alla migliore implementazione su CPU. Le prestazioni si sono rivelate fortemente dipendenti dai pattern di accesso alla memoria, con l’ordinamento delle particelle che emerge come fattore chiave. Questo lavoro abilita nuove simulazioni ibride non lineari 3D ad alta fedeltà degli elettroni runaway e apre la strada a future estensioni verso altre specie di particelle e differenti applicazioni fisiche.

GPU acceleration of 3D hybrid fluid-kinetic simulations of runaway electrons in JOREK

Carra', Edoardo
2024/2025

Abstract

JOREK is a widely used 3D nonlinear, extended magneto-hydrodynamic and hybrid fluid-kinetic code for investigating large scale transient plasma dynamics in realistic tokamak and stellarator fusion plasmas. In high current tokamaks such as ITER, the loss of plasma confinement in a so-called disruption can generate highly energetic ``runaway`` electrons (REs), which can pose a serious threat to plasma-facing components. Understanding and predicting RE dynamics is therefore essential for the safe operation of future fusion reactors. %To capture these dynamics, a novel hybrid fluid-kinetic model was recently introduced. While JOREK already supports MPI + OpenMP parallelization on CPUs, hybrid RE simulations span widely different timescales, making them computationally prohibitively expensive on conventional CPU based architectures. This thesis addresses that challenge by porting the kinetic component of hybrid RE simulations to GPUs, exploiting their massive parallelism. We detail the optimization strategies employed and present a comprehensive performance and verification study on NVIDIA H100 GPUs by benchmarking realistic RE test cases. The new version achieved a speedup of approximately 4.5x over the best CPU implementation. Performance was shown to depend strongly on memory access patterns, with particle ordering emerging as a key factor. This work enables novel high-fidelity nonlinear 3D hybrid simulations of runaway electrons and opens the path for future extensions to other particle species and different physics applications.
Hölzl, Matthias
ING - Scuola di Ingegneria Industriale e dell'Informazione
10-dic-2025
2024/2025
JOREK è un ampiamente utilizzato codice 3D non lineare di magnetoidrodinamica estesa (MHD) e fluido-cinetico ibrido, impiegato per studiare le dinamiche transitorie del plasma su larga scala in configurazioni realistiche di tokamak e stellarator per la fusione nucleare. Nei tokamak ad alta corrente, come ITER, la perdita di confinamento del plasma in una cosiddetta disruption può generare elettroni altamente energetici detti runaway (RE), che rappresentano una seria minaccia per i componenti a contatto con il plasma. Comprendere e prevedere la dinamica degli elettroni runaway è quindi essenziale per il funzionamento sicuro dei futuri reattori a fusione. Sebbene JOREK supporti già la parallelizzazione ibrida MPI + OpenMP su CPU, le simulazioni ibride di RE coprono scale temporali molto diverse, risultando così computazionalmente proibitive sulle architetture tradizionali basate su CPU. Questa tesi affronta tale sfida portando la componente cinetica delle simulazioni ibride di RE su GPU, sfruttando il massiccio parallelismo offerto da queste architetture. Vengono illustrate in dettaglio le strategie di ottimizzazione adottate e presentato uno studio completo di prestazioni e verifica su GPU NVIDIA H100, attraverso il benchmarking di casi di test realistici di RE. La nuova versione ha raggiunto un’accelerazione di circa 4.5x rispetto alla migliore implementazione su CPU. Le prestazioni si sono rivelate fortemente dipendenti dai pattern di accesso alla memoria, con l’ordinamento delle particelle che emerge come fattore chiave. Questo lavoro abilita nuove simulazioni ibride non lineari 3D ad alta fedeltà degli elettroni runaway e apre la strada a future estensioni verso altre specie di particelle e differenti applicazioni fisiche.
File allegati
File Dimensione Formato  
Article_format_thesis_EC.pdf

accessibile in internet per tutti

Dimensione 4.23 MB
Formato Adobe PDF
4.23 MB Adobe PDF Visualizza/Apri
Executive_summary_EC.pdf

accessibile in internet solo dagli utenti autorizzati

Dimensione 636.06 kB
Formato Adobe PDF
636.06 kB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/246613