Worldwide, the phenomenon of urbanization led to an exponential increase in impervious surfaces. This worsened the problem of pollutant First Flush (FF) in urban regions, which was recognized as one of the most significant non-point source pollutions that can have detrimental effects on surface water quality. For years, this process was studied exclusively with physically-based simulators; however, the massive improvement in Machine Learning (ML) in the last few years led to the adoption of these techniques in a wide variety of fields, including hydrological modelling. The study of FF is an inherently complex task, being it a non-linear process influenced by several variables. For this reason, a great amount of effort was put into the process of establishing the relative importance of rainfall/runoff variables, to help researchers to capture insights on the physical process that lies behind the phenomenon. The purpose of this thesis is to apply ML methods to the study of the FF phenomenon. In particular, the performance of several implementations of the Random Forest and Neural Network algorithms were compared in terms of accuracy and computational effort required to (i) predict the FF occurrence based on two different FF definitions, and (ii) predict the Event Mean Load associated with a single rainfall event and pollutant. For the two tasks, the baselines and the state of the art were outperformed. Furthermore, a feature importance analysis was carried out, with results that are aligned with the ones available in the literature, in the sense that they can be explained in terms of the underlying physical phenomena that drive the rainfall-runoff process.

A livello mondiale, il fenomeno dell'urbanizzazione ha portato ad un aumento esponenziale delle superfici impermeabili. Ciò ha aggravato il problema delle acque di prima pioggia (First Flush (FF)) nelle aree urbane, che è stato riconosciuto come una delle più significative fonti diffuse di inquinamento che può avere effetti dannosi sulla qualità delle acque superficiali. Per anni questo processo è stato studiato esclusivamente con modelli fisicamente-basati; tuttavia, il massiccio miglioramento nell'apprendimento automatico (machine learning (ML)) negli ultimi anni ha portato all'adozione di queste tecniche in differenti campi, inclusa la modellazione idrologica. Lo studio del fenomeno di FF è intrinsecamente complesso, essendo un processo non lineare influenzato da diverse variabili. Per questo motivo, è stato profuso un grande sforzo nel processo di determinazione dell'importanza relativa delle variabili afflusso/deflusso, per aiutare i ricercatori a carpire informazioni sul processo fisico su cui si basa il fenomeno. L'obiettivo di questa tesi è l'applicazione di diversi modelli di ML per lo studio del fenomeno del FF. In particolare, abbiamo confrontato le prestazioni di diverse implementazioni degli algoritmi Random Forest e Neural Network in termini di accuratezza e sforzo computazionale necessari per (i) prevedere l'occorrenza di FF sulla base di due diverse definizioni di FF e (ii) prevedere la massa media dell'evento di un particolare inquinante associata a un singolo evento piovoso.

Machine learning aided algorithms for predicting pollutant first-flush in urban stormwater runoff

Russo, Cosimo
2020/2021

Abstract

Worldwide, the phenomenon of urbanization led to an exponential increase in impervious surfaces. This worsened the problem of pollutant First Flush (FF) in urban regions, which was recognized as one of the most significant non-point source pollutions that can have detrimental effects on surface water quality. For years, this process was studied exclusively with physically-based simulators; however, the massive improvement in Machine Learning (ML) in the last few years led to the adoption of these techniques in a wide variety of fields, including hydrological modelling. The study of FF is an inherently complex task, being it a non-linear process influenced by several variables. For this reason, a great amount of effort was put into the process of establishing the relative importance of rainfall/runoff variables, to help researchers to capture insights on the physical process that lies behind the phenomenon. The purpose of this thesis is to apply ML methods to the study of the FF phenomenon. In particular, the performance of several implementations of the Random Forest and Neural Network algorithms were compared in terms of accuracy and computational effort required to (i) predict the FF occurrence based on two different FF definitions, and (ii) predict the Event Mean Load associated with a single rainfall event and pollutant. For the two tasks, the baselines and the state of the art were outperformed. Furthermore, a feature importance analysis was carried out, with results that are aligned with the ones available in the literature, in the sense that they can be explained in terms of the underlying physical phenomena that drive the rainfall-runoff process.
CASTRO, ALBERTO
GORGOGLIONE, ANGELA
ING - Scuola di Ingegneria Industriale e dell'Informazione
21-dic-2021
2020/2021
A livello mondiale, il fenomeno dell'urbanizzazione ha portato ad un aumento esponenziale delle superfici impermeabili. Ciò ha aggravato il problema delle acque di prima pioggia (First Flush (FF)) nelle aree urbane, che è stato riconosciuto come una delle più significative fonti diffuse di inquinamento che può avere effetti dannosi sulla qualità delle acque superficiali. Per anni questo processo è stato studiato esclusivamente con modelli fisicamente-basati; tuttavia, il massiccio miglioramento nell'apprendimento automatico (machine learning (ML)) negli ultimi anni ha portato all'adozione di queste tecniche in differenti campi, inclusa la modellazione idrologica. Lo studio del fenomeno di FF è intrinsecamente complesso, essendo un processo non lineare influenzato da diverse variabili. Per questo motivo, è stato profuso un grande sforzo nel processo di determinazione dell'importanza relativa delle variabili afflusso/deflusso, per aiutare i ricercatori a carpire informazioni sul processo fisico su cui si basa il fenomeno. L'obiettivo di questa tesi è l'applicazione di diversi modelli di ML per lo studio del fenomeno del FF. In particolare, abbiamo confrontato le prestazioni di diverse implementazioni degli algoritmi Random Forest e Neural Network in termini di accuratezza e sforzo computazionale necessari per (i) prevedere l'occorrenza di FF sulla base di due diverse definizioni di FF e (ii) prevedere la massa media dell'evento di un particolare inquinante associata a un singolo evento piovoso.
File allegati
File Dimensione Formato  
thesis_russo.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: thesis_russo
Dimensione 10.32 MB
Formato Adobe PDF
10.32 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/183609