Humans have endeavored to forecast the weather since the dawn of their existence. While for decades computers have primarily been employed to run numerical weather prediction models, there is now a growing tendency to leverage artificial intelligence techniques for the same purpose. This thesis aims to investigate the capabilities of Machine Learning models, developed by leading global companies and research institutions, in generating realistic weather forecasts that rival those produced by the existing numerical, physicsbased models. Numerical methods, which rely on approximations of the Partial Differential Equations governing atmospheric physics, are known for their accuracy and reliability. Nonetheless, these methods necessitate lengthy computations across multiple CPU nodes. In contrast, Machine Learning models, once trained, can produce comparable predictions within minutes and with significantly lower energy consumption. This efficiency is attributable to their lower computational complexity during the inference phase, which allows for straightforward management and parallelization on GPU architectures. The strategies for weather prediction can either be deterministic or stochastic, focusing on short-term or long-term forecasts, extreme weather events, and enhancing spatial resolution. In this thesis, the focus is on short-term deterministic predictions on a global scale encompassing the entire planet. To address this research objective, the study evaluates the performance of four prominent machine learning weather prediction models: PanguWeather, SFNO, FourCastNet, and DLWP. Recognizing the strengths and weaknesses of each model, the thesis proposes the development of a meta-model that combines them to achieve optimal results. This meta-model generates hybrid forecasts that leverage the strengths of the four individual models, with a particular focus on the analysis of weather patterns in Italy. By doing so, the dataset size is reduced, enabling computations to be more manageable within computing environments similar to those used for local weather predictions.

Sin dagli albori della loro esistenza, gli esseri umani hanno cercato di prevedere il tempo atmosferico. Se per decenni i computer sono stati impiegati principalmente per l’esecuzione di modelli numerici di previsione meteorologica, oggi si registra una crescente tendenza a sfruttare tecniche di intelligenza artificiale per lo stesso scopo. Questa tesi si propone di indagare le potenzialità dei modelli di Machine Learning, sviluppati da aziende e istituzioni di ricerca di livello internazionale, nel generare previsioni meteorologiche realistiche, in grado di competere con quelle prodotte dagli attuali modelli numerici basati sulla fisica. I metodi numerici, che si fondano su approssimazioni delle Equazioni Differenziali alle Derivate Parziali che governano la fisica dell’atmosfera, sono noti per precisione e affidabilità. Tuttavia, tali metodi richiedono lunghe elaborazioni su più nodi CPU. Al contrario, i modelli di Machine Learning, una volta addestrati, sono in grado di produrre previsioni comparabili in pochi minuti e con un consumo energetico significativamente inferiore. Questa efficienza è attribuibile alla minore complessità computazionale durante la fase di inferenza, che consente una gestione agevole e una parallelizzazione ottimale sulle architetture GPU. Le strategie di previsione meteorologica possono essere di tipo deterministico o stocastico, con applicazioni che spaziano dalle previsioni a breve o lungo termine agli eventi meteorologici estremi, fino al miglioramento della risoluzione spaziale. In questa tesi l’attenzione è rivolta alle previsioni deterministiche a breve termine su scala globale, comprendente l’intero pianeta. Per raggiungere questo obiettivo, lo studio valuta le prestazioni di quattro tra i più rilevanti modelli di Machine Learning per la previsione meteorologica: PanguWeather, SFNO, FourCastNet e DLWP. Riconoscendo punti di forza e limiti di ciascun modello, la tesi propone lo sviluppo di un meta-modello che li combini per ottenere risultati ottimali. Questo meta-modello genera previsioni ibride che sfruttano i punti di forza dei quattro modelli, con particolare attenzione all’analisi dei pattern meteorologici in Italia. In questo modo, la dimensione del dataset viene ridotta, rendendo le elaborazioni più gestibili in ambienti di calcolo simili a quelli impiegati per le previsioni locali.

A metamodel approach integrating machine learning-based weather prediction frameworks

Desantis, Filippo
2024/2025

Abstract

Humans have endeavored to forecast the weather since the dawn of their existence. While for decades computers have primarily been employed to run numerical weather prediction models, there is now a growing tendency to leverage artificial intelligence techniques for the same purpose. This thesis aims to investigate the capabilities of Machine Learning models, developed by leading global companies and research institutions, in generating realistic weather forecasts that rival those produced by the existing numerical, physicsbased models. Numerical methods, which rely on approximations of the Partial Differential Equations governing atmospheric physics, are known for their accuracy and reliability. Nonetheless, these methods necessitate lengthy computations across multiple CPU nodes. In contrast, Machine Learning models, once trained, can produce comparable predictions within minutes and with significantly lower energy consumption. This efficiency is attributable to their lower computational complexity during the inference phase, which allows for straightforward management and parallelization on GPU architectures. The strategies for weather prediction can either be deterministic or stochastic, focusing on short-term or long-term forecasts, extreme weather events, and enhancing spatial resolution. In this thesis, the focus is on short-term deterministic predictions on a global scale encompassing the entire planet. To address this research objective, the study evaluates the performance of four prominent machine learning weather prediction models: PanguWeather, SFNO, FourCastNet, and DLWP. Recognizing the strengths and weaknesses of each model, the thesis proposes the development of a meta-model that combines them to achieve optimal results. This meta-model generates hybrid forecasts that leverage the strengths of the four individual models, with a particular focus on the analysis of weather patterns in Italy. By doing so, the dataset size is reduced, enabling computations to be more manageable within computing environments similar to those used for local weather predictions.
BENACCHIO, TOMMASO
FORMAGGIA, LUCA
VICICONTE, GIOVANNI
ING - Scuola di Ingegneria Industriale e dell'Informazione
23-ott-2025
2024/2025
Sin dagli albori della loro esistenza, gli esseri umani hanno cercato di prevedere il tempo atmosferico. Se per decenni i computer sono stati impiegati principalmente per l’esecuzione di modelli numerici di previsione meteorologica, oggi si registra una crescente tendenza a sfruttare tecniche di intelligenza artificiale per lo stesso scopo. Questa tesi si propone di indagare le potenzialità dei modelli di Machine Learning, sviluppati da aziende e istituzioni di ricerca di livello internazionale, nel generare previsioni meteorologiche realistiche, in grado di competere con quelle prodotte dagli attuali modelli numerici basati sulla fisica. I metodi numerici, che si fondano su approssimazioni delle Equazioni Differenziali alle Derivate Parziali che governano la fisica dell’atmosfera, sono noti per precisione e affidabilità. Tuttavia, tali metodi richiedono lunghe elaborazioni su più nodi CPU. Al contrario, i modelli di Machine Learning, una volta addestrati, sono in grado di produrre previsioni comparabili in pochi minuti e con un consumo energetico significativamente inferiore. Questa efficienza è attribuibile alla minore complessità computazionale durante la fase di inferenza, che consente una gestione agevole e una parallelizzazione ottimale sulle architetture GPU. Le strategie di previsione meteorologica possono essere di tipo deterministico o stocastico, con applicazioni che spaziano dalle previsioni a breve o lungo termine agli eventi meteorologici estremi, fino al miglioramento della risoluzione spaziale. In questa tesi l’attenzione è rivolta alle previsioni deterministiche a breve termine su scala globale, comprendente l’intero pianeta. Per raggiungere questo obiettivo, lo studio valuta le prestazioni di quattro tra i più rilevanti modelli di Machine Learning per la previsione meteorologica: PanguWeather, SFNO, FourCastNet e DLWP. Riconoscendo punti di forza e limiti di ciascun modello, la tesi propone lo sviluppo di un meta-modello che li combini per ottenere risultati ottimali. Questo meta-modello genera previsioni ibride che sfruttano i punti di forza dei quattro modelli, con particolare attenzione all’analisi dei pattern meteorologici in Italia. In questo modo, la dimensione del dataset viene ridotta, rendendo le elaborazioni più gestibili in ambienti di calcolo simili a quelli impiegati per le previsioni locali.
File allegati
File Dimensione Formato  
Tesi_Filippo_Desantis.pdf

accessibile in internet per tutti

Descrizione: Thesis work on Machine Learning models for Weather Prediction.
Dimensione 9.68 MB
Formato Adobe PDF
9.68 MB Adobe PDF Visualizza/Apri
Executive_Summary___Filippo_Desantis.pdf

accessibile in internet per tutti

Descrizione: Executive summary of the thesis work on Machine Learning models for Weather Prediction.
Dimensione 523.33 kB
Formato Adobe PDF
523.33 kB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/243446