Water leakage represents an important concern in managing Water Distribution Systems (WDSs) as more than sixty countries are still facing high water stress risk. These leaks constitute major financial loss, soil contamination and other environmental hazards, all contributing to further water scarcity. Fast-expanding water supply networks need the development of better leak detection technologies, especially for smart building applications. Current technologies such as real-time monitoring of the WDSs and Machine Learning (ML) allow us to limit these losses by developing data-driven methods for leak detection. This thesis aims at contributing to this issue through a study of the capacity of ML methods to detect and classify types of leakage in WDSs by using acoustic measurements. For this purpose, we used a dataset generated by a laboratory-scale Water Distribution System (WDS) including three types of sensors (accelerometers, hydrophones, dynamic pressure sensors), no-leak conditions, four leak types, various background conditions, and two network topologies. This dataset consists of two hundred and eighty sensory measurements which will be exploited for training our ML models for leak detection and leak-type classification. The first step for this anomaly detection task will be to perform preprocessing on the data. Then, for each sensor and network topology, the best ML classifier will be evaluated using Lazypredict tool in Python. Only the best model will be considered, and the most relevant features selected. The last step will consist in using these features to train and test the model in order to evaluate its performance for binary classification and multi-class classification problems. A final experiment will be carried out and will consist of training the model using data from one network topology and testing it on the other network topology. The results achieved for the binary classification are very satisfactory, especially with the accelerometers, which allowed a 97.8% balanced accuracy. Multi-class classification tests gave lower results but still satisfactory. Finally, the cross-topology experiments did not show satisfactory results but represent a possible further work for our study.

Le perdite d’acqua rappresentano ancora un problema importante nella gestione del sis- tema di distribuzione idrica (Water Distribution System (WDS)), dato che più di sessanta Paesi stanno ancora affrontando un elevato rischio di stress idrico. Queste perdite rap- presentano un’importante perdita finanziaria, una contaminazione del suolo e altri rischi ambientali, che contribuiscono ad aumentare la scarsità d’acqua. Le reti di approvvigionamento idrico in rapida espansione richiedono lo sviluppo di migliori tecnologie di rilevamento delle perdite, soprattutto per le applicazioni di smart building. Le tecnologie attuali, come il monitoraggio in tempo reale del WDS e il ML, permettono di limitare queste perdite sviluppando metodi di analisi dei dati raccolti. Questa tesi propone un metodo per contribuire a questo tema attraverso lo studio della capacità dei metodi di ML di rilevare e classificare i tipi di perdite nelle WDS utilizzando misure acustiche. A tal fine, abbiamo utilizzato un set di dati generato da un WDS che comprende tre tipi di sensori (accelerometri, idrofoni, sensori di pressione dinamica), condizioni di assenza di perdite, quattro tipi di perdite, varie condizioni di sfondo e due topologie di rete. Questo set di dati è composto da duecentottanta misure sensoriali che verranno sfruttate per ad- destrare i nostri modelli ML per il rilevamento delle perdite e la classificazione del tipo di perdita. Il primo passo per il rilevamento delle anomalie sarà quello di eseguire una pre- elaborazione dei dati. Poi, per ogni sensore e topologia di rete, verrà valutato il miglior classificatore ML utilizzando lo strumento Lazypredict in Python. Verrà preso in considerazione solo il modello migliore e verranno selezionate le feature più rilevanti. L’ultimo passo sarà quello di utilizzare queste feature per addestrare e testare il modello, al fine di valutare le sue prestazioni per la classificazione binaria e multiclasse. L’esperimento finale consisterà nell’addestrare il modello utilizzando i dati di una topologia di rete e nel test sull’altra. I risultati ottenuti per la classificazione binaria sono molto soddisfacenti, soprattutto con i dati dell’accelerometro, che hanno permesso un’accuratezza bilanciata del 97, 8%. I test di classificazione multiclasse hanno dato risultati inferiori ma comunque soddisfacenti. Infine, gli esperimenti di cross-topologia non hanno dato risultati soddisfacenti ma rappresentano un lavoro futuro per il nostro studio.

Anomaly detection in water distribution systems using acoustic sensors and machine learning

ROESCH, APOLLINE
2021/2022

Abstract

Water leakage represents an important concern in managing Water Distribution Systems (WDSs) as more than sixty countries are still facing high water stress risk. These leaks constitute major financial loss, soil contamination and other environmental hazards, all contributing to further water scarcity. Fast-expanding water supply networks need the development of better leak detection technologies, especially for smart building applications. Current technologies such as real-time monitoring of the WDSs and Machine Learning (ML) allow us to limit these losses by developing data-driven methods for leak detection. This thesis aims at contributing to this issue through a study of the capacity of ML methods to detect and classify types of leakage in WDSs by using acoustic measurements. For this purpose, we used a dataset generated by a laboratory-scale Water Distribution System (WDS) including three types of sensors (accelerometers, hydrophones, dynamic pressure sensors), no-leak conditions, four leak types, various background conditions, and two network topologies. This dataset consists of two hundred and eighty sensory measurements which will be exploited for training our ML models for leak detection and leak-type classification. The first step for this anomaly detection task will be to perform preprocessing on the data. Then, for each sensor and network topology, the best ML classifier will be evaluated using Lazypredict tool in Python. Only the best model will be considered, and the most relevant features selected. The last step will consist in using these features to train and test the model in order to evaluate its performance for binary classification and multi-class classification problems. A final experiment will be carried out and will consist of training the model using data from one network topology and testing it on the other network topology. The results achieved for the binary classification are very satisfactory, especially with the accelerometers, which allowed a 97.8% balanced accuracy. Multi-class classification tests gave lower results but still satisfactory. Finally, the cross-topology experiments did not show satisfactory results but represent a possible further work for our study.
ING - Scuola di Ingegneria Industriale e dell'Informazione
4-mag-2023
2021/2022
Le perdite d’acqua rappresentano ancora un problema importante nella gestione del sis- tema di distribuzione idrica (Water Distribution System (WDS)), dato che più di sessanta Paesi stanno ancora affrontando un elevato rischio di stress idrico. Queste perdite rap- presentano un’importante perdita finanziaria, una contaminazione del suolo e altri rischi ambientali, che contribuiscono ad aumentare la scarsità d’acqua. Le reti di approvvigionamento idrico in rapida espansione richiedono lo sviluppo di migliori tecnologie di rilevamento delle perdite, soprattutto per le applicazioni di smart building. Le tecnologie attuali, come il monitoraggio in tempo reale del WDS e il ML, permettono di limitare queste perdite sviluppando metodi di analisi dei dati raccolti. Questa tesi propone un metodo per contribuire a questo tema attraverso lo studio della capacità dei metodi di ML di rilevare e classificare i tipi di perdite nelle WDS utilizzando misure acustiche. A tal fine, abbiamo utilizzato un set di dati generato da un WDS che comprende tre tipi di sensori (accelerometri, idrofoni, sensori di pressione dinamica), condizioni di assenza di perdite, quattro tipi di perdite, varie condizioni di sfondo e due topologie di rete. Questo set di dati è composto da duecentottanta misure sensoriali che verranno sfruttate per ad- destrare i nostri modelli ML per il rilevamento delle perdite e la classificazione del tipo di perdita. Il primo passo per il rilevamento delle anomalie sarà quello di eseguire una pre- elaborazione dei dati. Poi, per ogni sensore e topologia di rete, verrà valutato il miglior classificatore ML utilizzando lo strumento Lazypredict in Python. Verrà preso in considerazione solo il modello migliore e verranno selezionate le feature più rilevanti. L’ultimo passo sarà quello di utilizzare queste feature per addestrare e testare il modello, al fine di valutare le sue prestazioni per la classificazione binaria e multiclasse. L’esperimento finale consisterà nell’addestrare il modello utilizzando i dati di una topologia di rete e nel test sull’altra. I risultati ottenuti per la classificazione binaria sono molto soddisfacenti, soprattutto con i dati dell’accelerometro, che hanno permesso un’accuratezza bilanciata del 97, 8%. I test di classificazione multiclasse hanno dato risultati inferiori ma comunque soddisfacenti. Infine, gli esperimenti di cross-topologia non hanno dato risultati soddisfacenti ma rappresentano un lavoro futuro per il nostro studio.
File allegati
File Dimensione Formato  
2023_05_Roesch.pdf

solo utenti autorizzati dal 12/04/2024

Descrizione: Thesis text
Dimensione 3.4 MB
Formato Adobe PDF
3.4 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/205883