From generation to detection: machine learning frameworks for modeling cyclone activity

Extreme weather and climate events are shifting in frequency and intensity as the planet warms, amplifying risks to people, infrastructure, and economies. Credible adaptation therefore needs tools that characterize hazards under data scarcity and translate environmental conditions into reliable, interpretable estimates of event occurrence. This thesis advances both aims for cyclone hazards through two complementary studies and a supporting causal analysis. First, to mitigate scarce records of intense extratropical cyclones, the thesis trains a progressive growing generative adversarial network on reanalysis and historical tracks to synthesize maps of mean sea level pressure, 10 m wind speed, and rainfall over the North Atlantic. Diversity and fidelity evaluations show the generator reproduces synoptic organization and the observed link between pressure gradients and surface winds, with credible wind distributions near cyclone centers and realistic rainfall patterns. Shortfalls remain for the most localized rainfall extremes and for pressure spatial homogeneity in a few regions of high natural variability. Because the system produces large, physically plausible samples quickly, it enables augmentation for training and testing detection, intensity, and impact models when real events are rare. Second, the thesis develops an interpretable learning framework for tropical cyclogenesis (XAI-GPI) that estimates annual genesis counts by basin and explains their drivers. A feature selection isolates informative, basin-specific predictors; a compact neural model yields counts; explainable artificial intelligence quantifies contributions. Across six basins, XAI-GPI tracks interannual variability better than current methods while clarifying the roles of vertical wind shear, mid-tropospheric humidity, sea surface temperature, maximum potential intensity, and El Niño Southern Oscillation. It slightly underestimates extreme years in some basins and has modest skill where samples are sparse, but produces compact, transferable predictor sets. A complementary causal analysis of the Emanuel and Nolan genesis potential index components uses transfer entropy and graph-based tests at pixel and basin scales. Results align with the predictive view: absolute vorticity is the dominant driver, humidity and shear are secondary, and maximum potential intensity adds limited information. Basin-level aggregation improves stability for rare events. Together, these contributions show how machine learning can provide physically credible, statistically robust, and explainable tools for cyclone risk analysis. They deliver richer hazard datasets and clearer links from environment to annual event numbers, supporting climate services, early-action planning, and long-term adaptation.

Gli eventi meteorologici e climatici estremi stanno cambiando in frequenza e intensità con il riscaldamento del pianeta, amplificando i rischi per le persone, le infrastrutture e le economie. Un adattamento credibile richiede quindi strumenti in grado di caratterizzare i pericoli in condizioni di scarsità di dati e di tradurre le condizioni ambientali in stime affidabili e interpretabili dell’occorrenza degli eventi. Questa tesi persegue entrambi gli obiettivi nel contesto dei rischi legati ai cicloni attraverso due studi complementari e un’analisi causale di supporto. In primo luogo, per mitigare la scarsità di osservazioni di cicloni extratropicali intensi, la tesi addestra una progressive growing generative adversarial network su dati di rianalisi e tracciati storici, al fine di sintetizzare mappe di pressione, velocità del vento a 10 m e precipitazioni sull’Atlantico settentrionale. Le valutazioni di diversità e fedeltà mostrano che il generatore riproduce l’organizzazione sinottica e il legame osservato tra il gradiente di pressione e venti superficiali, con distribuzioni di vento credibili in prossimità dei centri ciclonici e pattern di precipitazione realistici. Permangono tuttavia delle criticità per gli estremi di precipitazione più localizzati e per l’omogeneità spaziale della pressione in alcune regioni caratterizzate da elevata variabilità naturale. Poiché il sistema produce rapidamente grandi campioni fisicamente plausibili, esso consente l’augmentazione dei dati per l’addestramento e la validazione di modelli di rilevamento, intensità e impatto quando gli eventi reali sono rari. In secondo luogo, la tesi sviluppa un framework di apprendimento interpretabile per la genesi dei cicloni tropicali (XAI-GPI), in grado di stimare i conteggi annuali di genesi per bacino e di spiegarne i drivers. Una procedura di selezione delle variabili isola predittori informativi e specifici per bacino; un modello neurale compatto fornisce le stime dei conteggi; tecniche di explainable artificial intelligence quantificano i contributi dei singoli fattori. Su sei bacini, XAI-GPI riproduce la variabilità interannuale meglio dei metodi attualmente in uso, chiarendo al contempo i ruoli della vertical wind shear, dell’umidità della media troposfera, della temperatura superficiale del mare, dell’intensità potenziale massima e dell’El Niño Southern Oscillation. Il modello tende a sottostimare leggermente gli anni più estremi in alcuni bacini e mostra abilità modesta dove i campioni sono scarsi, ma produce insiemi di predittori compatti e trasferibili. Un’analisi causale complementare dei componenti dell’Emanuel e Nolan genesis potential index utilizza l’entropia di trasferimento e test basati su grafi a scala di pixel e di bacino. I risultati sono coerenti con la prospettiva predittiva: la vorticità assoluta emerge come fattore dominante, mentre l’umidità e il wind shear hanno un ruolo secondario e l’intensità potenziale massima fornisce informazioni aggiuntive limitate. L’aggregazione a livello di bacino migliora la stabilità in presenza di eventi rari. Nel complesso, questi contributi mostrano come il machine learning possa fornire strumenti fisicamente credibili, statisticamente robusti e interpretabili per l’analisi del rischio ciclonico. Essi permettono di ottenere dataset di pericolosità più ricchi e collegamenti più chiari tra ambiente e numero annuale di eventi, a supporto dei servizi climatici, della pianificazione di azioni preventive e dell’adattamento di lungo periodo.