The present thesis is dedicated to the development of machine learning (ML)-based consumption estimation pipelines for buildings supplied by a district heating network, which permits obtaining a baseline to assess the impact of future interventions. In this context, the consumption profiles of two school buildings along with the corresponding hourly recorded meteorological data have been utilized. Machine learning-based pipelines are then developed to estimate the hourly consumption as a function of the varying weather conditions and seasonality-related parameters. To identify the most promising ML-based pipelines, the performance of state-of-the-art ML algorithms (with tuned hyper parameters) is compared, and a feature selection procedure is also performed. Random Forest and XGBoost regression models are shown to be the most promising algorithms for schools A and B, resulting in a weighted average percentage error (on the test set) of 14.6% and 14.3% respectively. It was thus observed that both models, taking into account the limitations of available features and assumption, estimated the heating consumption of the buildings with an acceptable accuracy. Nevertheless, limitations were observed in their capability of capturing rapid changes and fluctuations, due to their inherent features and missing detailed information.

La presente tesi è dedicata allo sviluppo di pipeline basate su machine learning (ML) per stimare i consumi degli edifici alimentati da una rete di teleriscaldamento, che consentono di ottenere una baseline per valutare l'impatto di interventi futuri. In questo contesto, sono stati utilizzati i profili di consumo di due edifici scolastici e i corrispondenti dati meteorologici registrati ogni ora. Sono state quindi sviluppate pipeline basate sul machine learning per stimare il consumo orario in funzione delle diverse condizioni meteorologiche e dei parametri legati alla stagionalità. Per identificare le pipeline basate sull' ML più promettenti, sono state confrontate le prestazioni degli algoritmi di ML più avanzati (con parametri calibrati) ed è stata eseguita una procedura di selezione dei parametri. I modelli di regressione Random Forest e XGBoost si dimostrano gli algoritmi più promettenti per le scuole A e B, con un errore percentuale medio ponderato (sul set di test) rispettivamente del 14,6% e del 14,3%. È stato quindi osservato che entrambi i modelli, tenendo conto dei limiti dei parametri e delle ipotesi disponibili, hanno stimato il consumo di riscaldamento degli edifici con un'accuratezza accettabile. Tuttavia, sono stati osservati dei limiti nella loro capacità di catturare cambiamenti e fluttuazioni rapidi, a causa delle loro caratteristiche intrinseche e delle informazioni dettagliate mancanti.

Development of machine learning-based baseline estimation pipelines for assessing the impact of interventions on buildings supplied by a district heating network

Faghih Shojaei, Arsalan
2023/2024

Abstract

The present thesis is dedicated to the development of machine learning (ML)-based consumption estimation pipelines for buildings supplied by a district heating network, which permits obtaining a baseline to assess the impact of future interventions. In this context, the consumption profiles of two school buildings along with the corresponding hourly recorded meteorological data have been utilized. Machine learning-based pipelines are then developed to estimate the hourly consumption as a function of the varying weather conditions and seasonality-related parameters. To identify the most promising ML-based pipelines, the performance of state-of-the-art ML algorithms (with tuned hyper parameters) is compared, and a feature selection procedure is also performed. Random Forest and XGBoost regression models are shown to be the most promising algorithms for schools A and B, resulting in a weighted average percentage error (on the test set) of 14.6% and 14.3% respectively. It was thus observed that both models, taking into account the limitations of available features and assumption, estimated the heating consumption of the buildings with an acceptable accuracy. Nevertheless, limitations were observed in their capability of capturing rapid changes and fluctuations, due to their inherent features and missing detailed information.
DADRAS JAVAN, FARZAD
ING - Scuola di Ingegneria Industriale e dell'Informazione
17-lug-2024
2023/2024
La presente tesi è dedicata allo sviluppo di pipeline basate su machine learning (ML) per stimare i consumi degli edifici alimentati da una rete di teleriscaldamento, che consentono di ottenere una baseline per valutare l'impatto di interventi futuri. In questo contesto, sono stati utilizzati i profili di consumo di due edifici scolastici e i corrispondenti dati meteorologici registrati ogni ora. Sono state quindi sviluppate pipeline basate sul machine learning per stimare il consumo orario in funzione delle diverse condizioni meteorologiche e dei parametri legati alla stagionalità. Per identificare le pipeline basate sull' ML più promettenti, sono state confrontate le prestazioni degli algoritmi di ML più avanzati (con parametri calibrati) ed è stata eseguita una procedura di selezione dei parametri. I modelli di regressione Random Forest e XGBoost si dimostrano gli algoritmi più promettenti per le scuole A e B, con un errore percentuale medio ponderato (sul set di test) rispettivamente del 14,6% e del 14,3%. È stato quindi osservato che entrambi i modelli, tenendo conto dei limiti dei parametri e delle ipotesi disponibili, hanno stimato il consumo di riscaldamento degli edifici con un'accuratezza accettabile. Tuttavia, sono stati osservati dei limiti nella loro capacità di catturare cambiamenti e fluttuazioni rapidi, a causa delle loro caratteristiche intrinseche e delle informazioni dettagliate mancanti.
File allegati
File Dimensione Formato  
2024_07_Faghih Shojaei.pdf

non accessibile

Dimensione 3.71 MB
Formato Adobe PDF
3.71 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/223317