The resolving power of Computational Fluid Dynamics (CFD) is ultimately bounded by the fraction of nominal peak performance that can be extracted from the underlying computing hardware. We present a solver development approach that sustains 50\% of nominal peak performance over more than half of the computational duty cycle, yielding over 30\% of peak performance overall. Relative to Hypersonic Task-based research (HTR) solver, a state of the art solver featuring high order numerical schemes for supersonic and turbu-lent flows, this corresponds to an approximately 10X reduction in time to solution for the same underlying numerical schemes, implemented through a substantially different software and kernel design. These results hold across multiple exascale systems, both CPU based and GPU based. The techniques that enabled this result require rethinking how HPC software is built, from performance modeling and kernel synthesis to how design decisions are explored.

Il potere risolutivo della Fluidodinamica Computazionale (CFD) è in ultima analisi limitato dalla frazione della performance nominale di picco che può essere effettivamente estratta dall’hardware di calcolo sottostante. Presentiamo un approccio allo sviluppo di solver che mantiene il 50% della performance nominale di picco per oltre metà del ciclo computazionale, raggiungendo complessivamente oltre il 30% della performance di picco. Rispetto al solver Hypersonic Task-based Research (HTR), uno solver all’avanguardia che utilizza schemi numerici di alto ordine per flussi supersonici e turbolenti, questo corrisponde a una riduzione del tempo di soluzione di circa 10 volte per gli stessi schemi numerici sottostanti, implementati tramite un design software e dei kernel sostanzialmente diversi. Questi risultati sono validi su più sistemi exascale, sia basati su CPU sia su GPU. Le tecniche che hanno reso possibile questo risultato richiedono di ripensare il modo in cui il software HPC viene costruito, dalla modellizzazione delle prestazioni e sintesi dei kernel fino all’esplorazione delle decisioni di progettazione.

Boosting performance of compressible CFD on exascale systems

Trabacchin, Tommaso
2024/2025

Abstract

The resolving power of Computational Fluid Dynamics (CFD) is ultimately bounded by the fraction of nominal peak performance that can be extracted from the underlying computing hardware. We present a solver development approach that sustains 50\% of nominal peak performance over more than half of the computational duty cycle, yielding over 30\% of peak performance overall. Relative to Hypersonic Task-based research (HTR) solver, a state of the art solver featuring high order numerical schemes for supersonic and turbu-lent flows, this corresponds to an approximately 10X reduction in time to solution for the same underlying numerical schemes, implemented through a substantially different software and kernel design. These results hold across multiple exascale systems, both CPU based and GPU based. The techniques that enabled this result require rethinking how HPC software is built, from performance modeling and kernel synthesis to how design decisions are explored.
ING - Scuola di Ingegneria Industriale e dell'Informazione
26-mar-2026
2024/2025
Il potere risolutivo della Fluidodinamica Computazionale (CFD) è in ultima analisi limitato dalla frazione della performance nominale di picco che può essere effettivamente estratta dall’hardware di calcolo sottostante. Presentiamo un approccio allo sviluppo di solver che mantiene il 50% della performance nominale di picco per oltre metà del ciclo computazionale, raggiungendo complessivamente oltre il 30% della performance di picco. Rispetto al solver Hypersonic Task-based Research (HTR), uno solver all’avanguardia che utilizza schemi numerici di alto ordine per flussi supersonici e turbolenti, questo corrisponde a una riduzione del tempo di soluzione di circa 10 volte per gli stessi schemi numerici sottostanti, implementati tramite un design software e dei kernel sostanzialmente diversi. Questi risultati sono validi su più sistemi exascale, sia basati su CPU sia su GPU. Le tecniche che hanno reso possibile questo risultato richiedono di ripensare il modo in cui il software HPC viene costruito, dalla modellizzazione delle prestazioni e sintesi dei kernel fino all’esplorazione delle decisioni di progettazione.
File allegati
File Dimensione Formato  
ThesisTrabacchin.pdf

accessibile in internet per tutti

Descrizione: tesi
Dimensione 38.25 MB
Formato Adobe PDF
38.25 MB Adobe PDF Visualizza/Apri
executive_summaryTrabacchin.pdf

accessibile in internet per tutti

Descrizione: executive summary
Dimensione 8.81 MB
Formato Adobe PDF
8.81 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/253715