The importance of a well-designed Machine Learning Pipeline (MLP) is emphasized in its role for improved energy forecasting in buildings. This study presents a semi-automatic approach to MLP design, encompassing Data Cleaning, Pre-Processing, Feature Construction/Aggregation, Feature Selection, Machine Learning Algorithm selection, and Hyperparameter optimization. Comprehensive benchmarking, using key metrics, is employed to evaluate various techniques in each step. Based on the benchmarking outcomes, additional hybrid models were crafted and subsequently assessed. The findings highlight the efficacy of the proposed system, revealing how certain practices stand out in optimizing MLP design and showcasing the system's capability in handling data inconsistencies and anomalies while retaining forecasting accuracy.

L'importanza di una pipeline di apprendimento automatico (MLP) ben progettata è sottolineata nel suo ruolo per migliorare le previsioni energetiche negli edifici. Questo studio presenta un approccio semi-automatico alla progettazione di MLP, che comprende la pulizia dei dati, la preelaborazione, la costruzione/aggregazione dei parametri, la selezione dei parametri, la selezione degli algoritmi di apprendimento automatico e l'ottimizzazione degli iperparametri. Per valutare le varie tecniche in ogni fase, si ricorre a un benchmarking completo, utilizzando metriche chiave. Sulla base dei risultati del benchmarking, sono stati creati e successivamente valutati altri modelli ibridi. I risultati evidenziano l'efficacia del sistema proposto, rivelando come alcune pratiche si distinguano nell'ottimizzazione della progettazione di MLP e mostrando la capacità del sistema di gestire le incoerenze e le anomalie dei dati mantenendo l'accuratezza delle previsioni.

A Semi-Automatic Machine Learning Pipeline Benchmarking Process to aid the pursuit of Energy Efficiency in Buildings

Salazar Pinto, Martin
2022/2023

Abstract

The importance of a well-designed Machine Learning Pipeline (MLP) is emphasized in its role for improved energy forecasting in buildings. This study presents a semi-automatic approach to MLP design, encompassing Data Cleaning, Pre-Processing, Feature Construction/Aggregation, Feature Selection, Machine Learning Algorithm selection, and Hyperparameter optimization. Comprehensive benchmarking, using key metrics, is employed to evaluate various techniques in each step. Based on the benchmarking outcomes, additional hybrid models were crafted and subsequently assessed. The findings highlight the efficacy of the proposed system, revealing how certain practices stand out in optimizing MLP design and showcasing the system's capability in handling data inconsistencies and anomalies while retaining forecasting accuracy.
ING - Scuola di Ingegneria Industriale e dell'Informazione
4-ott-2023
2022/2023
L'importanza di una pipeline di apprendimento automatico (MLP) ben progettata è sottolineata nel suo ruolo per migliorare le previsioni energetiche negli edifici. Questo studio presenta un approccio semi-automatico alla progettazione di MLP, che comprende la pulizia dei dati, la preelaborazione, la costruzione/aggregazione dei parametri, la selezione dei parametri, la selezione degli algoritmi di apprendimento automatico e l'ottimizzazione degli iperparametri. Per valutare le varie tecniche in ogni fase, si ricorre a un benchmarking completo, utilizzando metriche chiave. Sulla base dei risultati del benchmarking, sono stati creati e successivamente valutati altri modelli ibridi. I risultati evidenziano l'efficacia del sistema proposto, rivelando come alcune pratiche si distinguano nell'ottimizzazione della progettazione di MLP e mostrando la capacità del sistema di gestire le incoerenze e le anomalie dei dati mantenendo l'accuratezza delle previsioni.
File allegati
File Dimensione Formato  
2023_10_Salazar_Tesi_01.pdf

non accessibile

Descrizione: Thesis written document
Dimensione 7.91 MB
Formato Adobe PDF
7.91 MB Adobe PDF   Visualizza/Apri
2023_10_Salazar_Executive_Summary_02.pdf

non accessibile

Descrizione: Executive Summary
Dimensione 1.41 MB
Formato Adobe PDF
1.41 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/210841