Water management is a critical topic in various parts of the world due to different environmental and anthropic factors affecting future water security. Globalization and demographic pressure are increasing water demand in highly urbanized regions, making water management in such areas critical for sustainable development. Despite infrastructure investments and technological advances, managing a city’s water resources remains a complex task due to various issues. One of the most significant issues is certainly the lack of reliable data on residential water consumption, which limits our knowledge on current and future water demands. Such data is essential for designing and implementing effective water management policies and programs, from reducing any losses to identifying high-demand areas or developing water conservation programs. Unfortunately, many countries lack adequate monitoring systems, and even when they exist, the collected data is often incomplete or unreliable. On the other hand, public water consumption data collected through censuses and surveys have low spatial resolution and temporal frequency, limiting the accuracy of analysis and progress in sustainable water resource management. This thesis proposes an innovative approach to address the lack of data: the daily water consumption of residential structures is estimated using only public data and machine learning techniques. After a careful analysis of different Convolutional Neural Networks and training techniques, two architectures were chosen: one for filtering Google Street View images of building’s facades and another for estimating the relative height. Combining that information with the building area and socio-demographic data, XGBoost reaches the best performance in predicting daily water consumption among various machine learning algorithms evaluated. The work demonstrated the validity of the machine learning techniques developed in the methodology overcoming the accuracy of approximative formulas and highlighting the potential of public data in supporting sustainable water management.

La gestione dell’acqua rappresenta un tema critico in varie zone del mondo dovuto a diversi fattori ambientali ed antropici. All’incapacità di accedere e distribuire l’acqua, sono soprattutto i paesi a basso reddito che non hanno la capacità economica di effettuare gli investimenti necessari per infrastrutture adatte. La globalizzazione e la crescente pressione demografica aumentano la domanda nelle regioni più urbanizzate, rendendo la gestione dell’acqua più rilevante ai fini di uno sviluppo sostenibile. Nonostante i progressi tecnologici, la gestione idrica di una città rimane ancora un compito complesso dovuto a problematiche di diversa natura. Tra queste una delle più significative è la mancanza di dati affidabili sui consumi d’acqua a livello residenziale. Essi sono fondamentali per progettare e implementare politiche e programmi efficaci per la gestione idrica: dalla riduzione di eventuali perdite all’identificazione di aree ad alta richiesta. Purtroppo, molti paesi non dispongono di sistemi di monitoraggio adeguati e i consumi idrici pubblici rilevati tramite censimento e sondaggi hanno una risoluzione spaziale e una frequenza temporale bassa che limita la precisione dell’analisi e i progressi nella gestione sostenibile delle risorse idriche. In tale contesto, il lavoro di tesi propone un approccio innovativo nella risoluzione della mancanza di dati: si è riusciti a stimare il consumo d’acqua giornaliero di strutture residenziali utilizzando dati pubblici e tecniche di Machine Learning. Dopo un’analisi di diverse Reti Neurali Convoluzionali e tecniche di addestramento, sono state selezionate due architetture: una per filtrare le immagini Google Street View raffiguranti edifici ed un’altra per estrarne la relativa altezza. Unendo tale informazione con l’area dell’edificio e dati socio-demografici, XGBoost raggiunge le migliori prestazioni nella stima del consumo d’acqua giornaliero tra i vari algoritmi analizzati. Lo studio svolto ha dimostrato la validità delle tecniche di Machine Learning superando l’accuratezza di formule approssimative ed evidenziando la potenzialità dei dati pubblici nel supporto ad una gestione sempre più sostenibile dell’acqua.

An open machine learning framework for residential water consumption estimation

Panza, Loris
2021/2022

Abstract

Water management is a critical topic in various parts of the world due to different environmental and anthropic factors affecting future water security. Globalization and demographic pressure are increasing water demand in highly urbanized regions, making water management in such areas critical for sustainable development. Despite infrastructure investments and technological advances, managing a city’s water resources remains a complex task due to various issues. One of the most significant issues is certainly the lack of reliable data on residential water consumption, which limits our knowledge on current and future water demands. Such data is essential for designing and implementing effective water management policies and programs, from reducing any losses to identifying high-demand areas or developing water conservation programs. Unfortunately, many countries lack adequate monitoring systems, and even when they exist, the collected data is often incomplete or unreliable. On the other hand, public water consumption data collected through censuses and surveys have low spatial resolution and temporal frequency, limiting the accuracy of analysis and progress in sustainable water resource management. This thesis proposes an innovative approach to address the lack of data: the daily water consumption of residential structures is estimated using only public data and machine learning techniques. After a careful analysis of different Convolutional Neural Networks and training techniques, two architectures were chosen: one for filtering Google Street View images of building’s facades and another for estimating the relative height. Combining that information with the building area and socio-demographic data, XGBoost reaches the best performance in predicting daily water consumption among various machine learning algorithms evaluated. The work demonstrated the validity of the machine learning techniques developed in the methodology overcoming the accuracy of approximative formulas and highlighting the potential of public data in supporting sustainable water management.
HAO, WENJIN
Cominola, Andrea
Chen, Siling
ING - Scuola di Ingegneria Industriale e dell'Informazione
4-mag-2023
2021/2022
La gestione dell’acqua rappresenta un tema critico in varie zone del mondo dovuto a diversi fattori ambientali ed antropici. All’incapacità di accedere e distribuire l’acqua, sono soprattutto i paesi a basso reddito che non hanno la capacità economica di effettuare gli investimenti necessari per infrastrutture adatte. La globalizzazione e la crescente pressione demografica aumentano la domanda nelle regioni più urbanizzate, rendendo la gestione dell’acqua più rilevante ai fini di uno sviluppo sostenibile. Nonostante i progressi tecnologici, la gestione idrica di una città rimane ancora un compito complesso dovuto a problematiche di diversa natura. Tra queste una delle più significative è la mancanza di dati affidabili sui consumi d’acqua a livello residenziale. Essi sono fondamentali per progettare e implementare politiche e programmi efficaci per la gestione idrica: dalla riduzione di eventuali perdite all’identificazione di aree ad alta richiesta. Purtroppo, molti paesi non dispongono di sistemi di monitoraggio adeguati e i consumi idrici pubblici rilevati tramite censimento e sondaggi hanno una risoluzione spaziale e una frequenza temporale bassa che limita la precisione dell’analisi e i progressi nella gestione sostenibile delle risorse idriche. In tale contesto, il lavoro di tesi propone un approccio innovativo nella risoluzione della mancanza di dati: si è riusciti a stimare il consumo d’acqua giornaliero di strutture residenziali utilizzando dati pubblici e tecniche di Machine Learning. Dopo un’analisi di diverse Reti Neurali Convoluzionali e tecniche di addestramento, sono state selezionate due architetture: una per filtrare le immagini Google Street View raffiguranti edifici ed un’altra per estrarne la relativa altezza. Unendo tale informazione con l’area dell’edificio e dati socio-demografici, XGBoost raggiunge le migliori prestazioni nella stima del consumo d’acqua giornaliero tra i vari algoritmi analizzati. Lo studio svolto ha dimostrato la validità delle tecniche di Machine Learning superando l’accuratezza di formule approssimative ed evidenziando la potenzialità dei dati pubblici nel supporto ad una gestione sempre più sostenibile dell’acqua.
File allegati
File Dimensione Formato  
2023_05_Panza_Thesis.pdf

Open Access dal 15/04/2024

Descrizione: Thesis
Dimensione 9.63 MB
Formato Adobe PDF
9.63 MB Adobe PDF Visualizza/Apri
2023_05_Panza_ExecutiveSummary.pdf

Open Access dal 15/04/2024

Descrizione: Executive Summary
Dimensione 2.86 MB
Formato Adobe PDF
2.86 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/210060