Awareness of the ongoing changes enables more effective preparation for the challenges of climate change, facilitating the adoption of appropriate mitigation and adaptation strategies. For this reason, climate datasets of meteorological variables have become increasingly important in recent years and are likely to become even more relevant in the future. The objective of this thesis is to develop a methodology for the reconstruction of climatologies for the period 1991-2020 of the Citizen Science Meteonetwork stations, utilising daily data of maximum, minimum, mean temperature and cumulative precipitation. The datasets of NNW stations are incomplete, or lack sufficient observation periods, to allow for the calculation of climate trends over a minimum period of 30 years. The proposed methodology employs machine learning (ML) techniques to establish relationships between the observed data and the reanalysis datasets, thereby enabling the generation of synthetic time series that are conducive to the calculation of climatologies. The process commenced with an initial comparison of various reanalysis datasets to identify the most suitable one for use as input. This was followed by a comparison of two algorithms, Support Vector Regression (SVR) and Random Forest (RF), to determine the optimal algorithm for each variable. Subsequently, the models were optimised for each station and variable, and the series were reconstructed for the period 1991-2020. Ultimately, monthly climatologies were calculated for each variable and station. The results demonstrate that the CERRA dataset and the SVR model with a linear kernel yielded the most optimal results for temperature, whereas MSWEP and SVR with a radial kernel exhibited the highest degree of accuracy for precipitation. The temperature models demonstrated excellent performance, with coefficients of determination exceeding 0.9. In contrast, the precipitation models exhibited considerable variability, with some models failing to achieve the desired level of accuracy. The comparison between the reconstructed and observed climatologies corroborates the efficacy of the methodology for temperature, whereas the results for precipitation are less precise. The methodology shows promise in addressing the scarcity of observational data, but requires refinement, particularly in regard to precipitation, with an enhancement in the quality of data employed for model training.

La consapevolezza dei cambiamenti in atto permette di prepararsi in modo più efficace ad affrontare le sfide del cambiamento climatico, favorendo l'adozione di strategie adeguate di mitigazione e adattamento. Per questo motivo, i dataset di climatologie di variabili meteorologiche hanno acquisito crescente importanza negli ultimi anni e diventeranno probabilmente ancora più rilevanti in futuro. L’obiettivo di questa tesi è sviluppare una metodologia per ricostruire le climatologie del periodo 1991-2020 delle stazioni della rete Citizen Science Meteonetwork, utilizzando dati giornalieri di temperatura massima, minima, media e precipitazioni cumulate. Le stazioni presentano lacune nei dati o periodi di osservazione insufficienti per calcolare trend climatici su almeno 30 anni. La metodologia proposta si avvale di tecniche di machine learning (ML) per stabilire relazioni tra i dati osservati e i dataset di rianalisi, consentendo la creazione di serie storiche sintetiche utili al calcolo delle climatologie. Il processo ha inizialmente confrontato diversi dataset di rianalisi per identificare quello più adatto da usare come input per i modelli, seguito da un confronto tra due algoritmi, Support Vector Regression (SVR) e Random Forest (RF), per determinarne il migliore per ciascuna variabile. Successivamente, i modelli sono stati ottimizzati per ogni stazione e variabile e sono state ricostruite le serie per il periodo 1991-2020. Infine, sono state calcolate le climatologie mensili per ogni variabile e stazione. I risultati mostrano che il dataset CERRA e il modello SVR con kernel lineare hanno fornito le migliori prestazioni per la temperatura, mentre MSWEP e SVR con kernel radiale si sono rivelati più accurati per le precipitazioni. I modelli di temperatura hanno dato prestazioni eccellenti con coefficienti di determinazione superiori a 0.9, mentre quelli per le precipitazioni mostrano variazioni significative, con alcuni che non raggiungono una precisione sufficiente. Il confronto tra le climatologie ricostruite e osservate conferma l'efficacia della metodologia per la temperatura, mentre i risultati per le precipitazioni sono meno accurati. La metodologia è promettente per affrontare la mancanza di dati osservativi, ma richiede miglioramenti, soprattutto per la precipitazione, con un aumento nella qualità dei dati usati per calibrare i modelli.

Using machine learning to reconstruct temperature and precipitation climatologies in an italian citizen science weather station network

Rampinelli, Francesca
2023/2024

Abstract

Awareness of the ongoing changes enables more effective preparation for the challenges of climate change, facilitating the adoption of appropriate mitigation and adaptation strategies. For this reason, climate datasets of meteorological variables have become increasingly important in recent years and are likely to become even more relevant in the future. The objective of this thesis is to develop a methodology for the reconstruction of climatologies for the period 1991-2020 of the Citizen Science Meteonetwork stations, utilising daily data of maximum, minimum, mean temperature and cumulative precipitation. The datasets of NNW stations are incomplete, or lack sufficient observation periods, to allow for the calculation of climate trends over a minimum period of 30 years. The proposed methodology employs machine learning (ML) techniques to establish relationships between the observed data and the reanalysis datasets, thereby enabling the generation of synthetic time series that are conducive to the calculation of climatologies. The process commenced with an initial comparison of various reanalysis datasets to identify the most suitable one for use as input. This was followed by a comparison of two algorithms, Support Vector Regression (SVR) and Random Forest (RF), to determine the optimal algorithm for each variable. Subsequently, the models were optimised for each station and variable, and the series were reconstructed for the period 1991-2020. Ultimately, monthly climatologies were calculated for each variable and station. The results demonstrate that the CERRA dataset and the SVR model with a linear kernel yielded the most optimal results for temperature, whereas MSWEP and SVR with a radial kernel exhibited the highest degree of accuracy for precipitation. The temperature models demonstrated excellent performance, with coefficients of determination exceeding 0.9. In contrast, the precipitation models exhibited considerable variability, with some models failing to achieve the desired level of accuracy. The comparison between the reconstructed and observed climatologies corroborates the efficacy of the methodology for temperature, whereas the results for precipitation are less precise. The methodology shows promise in addressing the scarcity of observational data, but requires refinement, particularly in regard to precipitation, with an enhancement in the quality of data employed for model training.
CIONI, GUIDO
ING I - Scuola di Ingegneria Civile, Ambientale e Territoriale
10-ott-2024
2023/2024
La consapevolezza dei cambiamenti in atto permette di prepararsi in modo più efficace ad affrontare le sfide del cambiamento climatico, favorendo l'adozione di strategie adeguate di mitigazione e adattamento. Per questo motivo, i dataset di climatologie di variabili meteorologiche hanno acquisito crescente importanza negli ultimi anni e diventeranno probabilmente ancora più rilevanti in futuro. L’obiettivo di questa tesi è sviluppare una metodologia per ricostruire le climatologie del periodo 1991-2020 delle stazioni della rete Citizen Science Meteonetwork, utilizzando dati giornalieri di temperatura massima, minima, media e precipitazioni cumulate. Le stazioni presentano lacune nei dati o periodi di osservazione insufficienti per calcolare trend climatici su almeno 30 anni. La metodologia proposta si avvale di tecniche di machine learning (ML) per stabilire relazioni tra i dati osservati e i dataset di rianalisi, consentendo la creazione di serie storiche sintetiche utili al calcolo delle climatologie. Il processo ha inizialmente confrontato diversi dataset di rianalisi per identificare quello più adatto da usare come input per i modelli, seguito da un confronto tra due algoritmi, Support Vector Regression (SVR) e Random Forest (RF), per determinarne il migliore per ciascuna variabile. Successivamente, i modelli sono stati ottimizzati per ogni stazione e variabile e sono state ricostruite le serie per il periodo 1991-2020. Infine, sono state calcolate le climatologie mensili per ogni variabile e stazione. I risultati mostrano che il dataset CERRA e il modello SVR con kernel lineare hanno fornito le migliori prestazioni per la temperatura, mentre MSWEP e SVR con kernel radiale si sono rivelati più accurati per le precipitazioni. I modelli di temperatura hanno dato prestazioni eccellenti con coefficienti di determinazione superiori a 0.9, mentre quelli per le precipitazioni mostrano variazioni significative, con alcuni che non raggiungono una precisione sufficiente. Il confronto tra le climatologie ricostruite e osservate conferma l'efficacia della metodologia per la temperatura, mentre i risultati per le precipitazioni sono meno accurati. La metodologia è promettente per affrontare la mancanza di dati osservativi, ma richiede miglioramenti, soprattutto per la precipitazione, con un aumento nella qualità dei dati usati per calibrare i modelli.
File allegati
File Dimensione Formato  
2024_10_Rampinelli_Executive_Summary.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: executive summary
Dimensione 950.87 kB
Formato Adobe PDF
950.87 kB Adobe PDF   Visualizza/Apri
2024_10_Rampinelli_Tesi.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: testo tesi
Dimensione 5.3 MB
Formato Adobe PDF
5.3 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/227575