The importance of a well-designed Machine Learning Pipeline (MLP) is emphasized in its role for improved energy forecasting in buildings. This study presents a semi-automatic approach to MLP design, encompassing Data Cleaning, Pre-Processing, Feature Construction/Aggregation, Feature Selection, Machine Learning Algorithm selection, and Hyperparameter optimization. Comprehensive benchmarking, using key metrics, is employed to evaluate various techniques in each step. Based on the benchmarking outcomes, additional hybrid models were crafted and subsequently assessed. The findings highlight the efficacy of the proposed system, revealing how certain practices stand out in optimizing MLP design and showcasing the system's capability in handling data inconsistencies and anomalies while retaining forecasting accuracy.
L'importanza di una pipeline di apprendimento automatico (MLP) ben progettata è sottolineata nel suo ruolo per migliorare le previsioni energetiche negli edifici. Questo studio presenta un approccio semi-automatico alla progettazione di MLP, che comprende la pulizia dei dati, la preelaborazione, la costruzione/aggregazione dei parametri, la selezione dei parametri, la selezione degli algoritmi di apprendimento automatico e l'ottimizzazione degli iperparametri. Per valutare le varie tecniche in ogni fase, si ricorre a un benchmarking completo, utilizzando metriche chiave. Sulla base dei risultati del benchmarking, sono stati creati e successivamente valutati altri modelli ibridi. I risultati evidenziano l'efficacia del sistema proposto, rivelando come alcune pratiche si distinguano nell'ottimizzazione della progettazione di MLP e mostrando la capacità del sistema di gestire le incoerenze e le anomalie dei dati mantenendo l'accuratezza delle previsioni.
A Semi-Automatic Machine Learning Pipeline Benchmarking Process to aid the pursuit of Energy Efficiency in Buildings
Salazar Pinto, Martin
2022/2023
Abstract
The importance of a well-designed Machine Learning Pipeline (MLP) is emphasized in its role for improved energy forecasting in buildings. This study presents a semi-automatic approach to MLP design, encompassing Data Cleaning, Pre-Processing, Feature Construction/Aggregation, Feature Selection, Machine Learning Algorithm selection, and Hyperparameter optimization. Comprehensive benchmarking, using key metrics, is employed to evaluate various techniques in each step. Based on the benchmarking outcomes, additional hybrid models were crafted and subsequently assessed. The findings highlight the efficacy of the proposed system, revealing how certain practices stand out in optimizing MLP design and showcasing the system's capability in handling data inconsistencies and anomalies while retaining forecasting accuracy.File | Dimensione | Formato | |
---|---|---|---|
2023_10_Salazar_Tesi_01.pdf
non accessibile
Descrizione: Thesis written document
Dimensione
7.91 MB
Formato
Adobe PDF
|
7.91 MB | Adobe PDF | Visualizza/Apri |
2023_10_Salazar_Executive_Summary_02.pdf
non accessibile
Descrizione: Executive Summary
Dimensione
1.41 MB
Formato
Adobe PDF
|
1.41 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/210841