Drought monitoring plays a crucial role in providing essential data for understanding and mitigating this increasingly frequent climatic phenomenon. To this end, combined indices that consider various hydrological variables are often developed for specific basins through expert-based methods or applied as standardised tools. This thesis adopts a data-driven approach to define combined indices at the European scale. By following the FRamework for Index-based Drought Analysis (FRIDA) approach, a combined index is constructed by training a supervised learning model, where the target is a proxy for drought impacts. We use the satellite-derived Fraction of Absorbed Photosynthetically Active Radiation Anomaly (FAPAR Anomaly) to represent droughts impact on vegetation, utilising common indices and hydrological variables as predictors. Considering data from over 30,000 subbasins across Europe, we developed a combined index for each. Then, we explored two applications of multi-task learning. First, we grouped nearby subbasins to construct local indices using hierarchical clustering algorithms and a novel procedure, Non-Linear Correlated Target-Feature Aggregation (NonLinCTFA), to estimate an optimal regionalisation. Linear regression was sufficient to define local indices, as non-linear models did not prove more effective, resulting in simple and explainable indices. Second, we trained a single neural network model across all European subbasins to obtain a single global index. This approach outperformed local models, particularly in challenging areas. Our findings highlight the complementarity of the two multi-task learning methodologies in the context of drought impact monitoring. Local models can provide simple and interpretable combined indices, valuable for decision-making where understanding drivers is crucial. Conversely, a more complex global model offers higher accuracy by leveraging a broader data distribution, though at the expense of interpretability.

Il monitoraggio della siccità riveste un ruolo cruciale nel fornire dati essenziali per la comprensione e mitigazione di questo fenomeno climatico sempre più frequente. A tal fine, indici combinati che considerano diverse variabili idrologiche sono spesso sviluppati per specifici bacini tramite metodi expert-based o applicati come strumenti standardizzati. Questa tesi adotta un approccio data-driven per definire indici combinati su scala europea. Seguendo l’approccio FRamework for Index-based Drought Analysis (FRIDA), viene costruito un indice combinato addestrando un modello di apprendimento supervisionato, dove il target è una proxy degli impatti delle siccità. Utilizziamo l’anomalia della frazione di assorbimento della radiazione fotosinteticamente attiva (FAPAR Anomaly), derivata da rilevamenti satellitari, per rappresentare l’impatto delle siccità sulla vegetazione, impiegando come predittori indici e variabili idrologiche noti. Considerando i dati di oltre 30.000 sottobacini a livello europeo, abbiamo sviluppato un indice combinato per ciascuno di essi. Successivamente, abbiamo esplorato due applicazioni dell’apprendimento multi-task. In primo luogo, abbiamo raggruppato sottobacini vicini per costruire indici locali utilizzando algoritmi di clustering gerarchico e una nuova procedura, Non-Linear Correlated Target-Feature Aggregation (NonLinCTFA), per stimare una regionalizzazione ottimale. La regressione lineare è stata sufficiente per definire gli indici locali, in quanto i modelli non lineari non sono risultati più efficaci, ottenendo così indici semplici e interpretabili. In secondo luogo, abbiamo addestrato un singolo modello di rete neurale su tutti i sottobacini europei per ottenere un unico indice globale. Questo approccio ha superato in accuratezza i modelli locali, soprattutto nelle aree dove questi sono risultati meno efficaci. I nostri risultati evidenziano la complementarietà delle due metodologie di apprendimento multi-task nel contesto del monitoraggio degli impatti della siccità. I modelli locali possono fornire indici combinati semplici e interpretabili, preziosi per la presa di decisioni dove la comprensione delle cause è cruciale. Al contrario, l’indice globale singolo, sebbene più complesso, offre una maggiore precisione sfruttando una distribuzione più ampia di dati, a scapito dell’interpretabilità.

Multi-task learning for drought impact monitoring across Europe

Pasinetti, Andrés
2023/2024

Abstract

Drought monitoring plays a crucial role in providing essential data for understanding and mitigating this increasingly frequent climatic phenomenon. To this end, combined indices that consider various hydrological variables are often developed for specific basins through expert-based methods or applied as standardised tools. This thesis adopts a data-driven approach to define combined indices at the European scale. By following the FRamework for Index-based Drought Analysis (FRIDA) approach, a combined index is constructed by training a supervised learning model, where the target is a proxy for drought impacts. We use the satellite-derived Fraction of Absorbed Photosynthetically Active Radiation Anomaly (FAPAR Anomaly) to represent droughts impact on vegetation, utilising common indices and hydrological variables as predictors. Considering data from over 30,000 subbasins across Europe, we developed a combined index for each. Then, we explored two applications of multi-task learning. First, we grouped nearby subbasins to construct local indices using hierarchical clustering algorithms and a novel procedure, Non-Linear Correlated Target-Feature Aggregation (NonLinCTFA), to estimate an optimal regionalisation. Linear regression was sufficient to define local indices, as non-linear models did not prove more effective, resulting in simple and explainable indices. Second, we trained a single neural network model across all European subbasins to obtain a single global index. This approach outperformed local models, particularly in challenging areas. Our findings highlight the complementarity of the two multi-task learning methodologies in the context of drought impact monitoring. Local models can provide simple and interpretable combined indices, valuable for decision-making where understanding drivers is crucial. Conversely, a more complex global model offers higher accuracy by leveraging a broader data distribution, though at the expense of interpretability.
BONETTI, PAOLO
CASTELLETTI, ANDREA FRANCESCO
GIULIANI, MATTEO
Metelli, Alberto Maria
ING - Scuola di Ingegneria Industriale e dell'Informazione
16-lug-2024
2023/2024
Il monitoraggio della siccità riveste un ruolo cruciale nel fornire dati essenziali per la comprensione e mitigazione di questo fenomeno climatico sempre più frequente. A tal fine, indici combinati che considerano diverse variabili idrologiche sono spesso sviluppati per specifici bacini tramite metodi expert-based o applicati come strumenti standardizzati. Questa tesi adotta un approccio data-driven per definire indici combinati su scala europea. Seguendo l’approccio FRamework for Index-based Drought Analysis (FRIDA), viene costruito un indice combinato addestrando un modello di apprendimento supervisionato, dove il target è una proxy degli impatti delle siccità. Utilizziamo l’anomalia della frazione di assorbimento della radiazione fotosinteticamente attiva (FAPAR Anomaly), derivata da rilevamenti satellitari, per rappresentare l’impatto delle siccità sulla vegetazione, impiegando come predittori indici e variabili idrologiche noti. Considerando i dati di oltre 30.000 sottobacini a livello europeo, abbiamo sviluppato un indice combinato per ciascuno di essi. Successivamente, abbiamo esplorato due applicazioni dell’apprendimento multi-task. In primo luogo, abbiamo raggruppato sottobacini vicini per costruire indici locali utilizzando algoritmi di clustering gerarchico e una nuova procedura, Non-Linear Correlated Target-Feature Aggregation (NonLinCTFA), per stimare una regionalizzazione ottimale. La regressione lineare è stata sufficiente per definire gli indici locali, in quanto i modelli non lineari non sono risultati più efficaci, ottenendo così indici semplici e interpretabili. In secondo luogo, abbiamo addestrato un singolo modello di rete neurale su tutti i sottobacini europei per ottenere un unico indice globale. Questo approccio ha superato in accuratezza i modelli locali, soprattutto nelle aree dove questi sono risultati meno efficaci. I nostri risultati evidenziano la complementarietà delle due metodologie di apprendimento multi-task nel contesto del monitoraggio degli impatti della siccità. I modelli locali possono fornire indici combinati semplici e interpretabili, preziosi per la presa di decisioni dove la comprensione delle cause è cruciale. Al contrario, l’indice globale singolo, sebbene più complesso, offre una maggiore precisione sfruttando una distribuzione più ampia di dati, a scapito dell’interpretabilità.
File allegati
File Dimensione Formato  
2024_07_Pasinetti_Thesis.pdf

accessibile in internet per tutti

Descrizione: Thesis
Dimensione 6.7 MB
Formato Adobe PDF
6.7 MB Adobe PDF Visualizza/Apri
2024_07_Pasinetti_Executive_Summary.pdf

accessibile in internet per tutti

Descrizione: Executive Summary
Dimensione 2.51 MB
Formato Adobe PDF
2.51 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/223242