In the present thesis, a procedure has been proposed and implemented aiming at determining optimal machine learning (ML) based pipelines for predicting the dynamic thermal behavior of indoor environments. In this context, two different case studies (a passive house and an apartment building with a programmable thermostat) are considered and datasets including measurements of the thermal conditions in the corresponding spaces, are employed. For the first case study, ML-based pipelines are first implemented for steady-state (without providing time-series data) estimation of the indoor temperature aiming at reproducing the missing data. Next, ML-based pipelines are developed for time-series forecasting of the indoor temperature, while considering several prediction windows (10 minutes to 2 hours). Similar methodology and prediction pipelines are also implemented for the second case study, in which the time-series information about the HVAC status is also provided. In the optimization procedure of the latter pipelines, using a benchmark algorithm (random forests), the most promising features are first determined. Next, a genetic algorithm-based optimization procedure is utilized in order to determine the most promising algorithm and the corresponding tuning parameters. Afterwards, the feature selection procedure is repeated while employing the obtained optimal algorithm. Finally, the pipeline determined in the previous step is utilized to carry out an incremental (online) training procedure and the corresponding training window is optimised. It is demonstrated that all of the above-mentioned conducted steps result in an increment in the obtained accuracy. It is also shown that carrying out the feature selection step notably reduces the number of features leading to a notable decrement in the computations cost, while permitting a possible reduction in the required measurements and facilitating an improved interpretation of the physical behavior of the system.
La presente tesi è incentrata sulla proposta e sull'implementazione di una procedura per la determinazione di pipeline ottimali basati su machine learning (ML) per la previsione del comportamento termico dinamico degli ambienti interni. In questo contesto, vengono presi in considerazione due diversi casi di studio (una casa passiva e un condominio con termostato programmabile) e vengono utilizzati set di dati che includono misure delle condizioni termiche negli spazi corrispondenti. Per il primo caso di studio, vengono prima implementate pipeline basate su ML per la stima stazionaria (senza fornire dati di serie temporali) della temperatura interna con l'obiettivo di riprodurre i dati mancanti. Successivamente, le pipeline basate su ML sono sviluppate per la previsione della temperatura interna in serie temporali, considerando diverse finestre di previsione (da 10 minuti a 2 ore). Metodologia simile e pipeline di previsione sono state implementate anche per il secondo caso di studio, in cui vengono fornite anche le informazioni sulle serie temporali sullo stato dell'HVAC. Nella procedura di ottimizzazione di queste ultime Pipeline, utilizzando un algoritmo di riferimento (Random Forests), vengono innanzitutto determinate i parametri più promettenti. Successivamente, viene utilizzata una procedura di ottimizzazione basata su algoritmo genetico per determinare l'algoritmo più promettente e i corrispondenti parametri di tuning. Successivamente, la procedura di selezione delle parametri viene ripetuta utilizzando l'algoritmo ottimale ottenuto. Infine, la pipeline determinata nella fase precedente viene utilizzata per eseguire una procedura di training incrementale (online) e la corrispondente finestra di training viene ottimizzata. E' dimostrato che tutte le suddette fasi condotte portano ad un incremento della precisione ottenuta. È inoltre dimostrato che l'esecuzione della fase di selezione dei parametri riduce notevolmente il numero di elementi che portano ad una notevole riduzione dei costi di calcolo, consentendo al contempo di ridurre il numero di misurazioni richieste e facilitando una migliore interpretazione del comportamento fisico del sistema.
Development of optimal machine learning based pipelines for predicting the dynamic thermal behavior of indoor environments
APPIAH, ENOCH NUAMAH;MIR, DANISH AHMAD
2018/2019
Abstract
In the present thesis, a procedure has been proposed and implemented aiming at determining optimal machine learning (ML) based pipelines for predicting the dynamic thermal behavior of indoor environments. In this context, two different case studies (a passive house and an apartment building with a programmable thermostat) are considered and datasets including measurements of the thermal conditions in the corresponding spaces, are employed. For the first case study, ML-based pipelines are first implemented for steady-state (without providing time-series data) estimation of the indoor temperature aiming at reproducing the missing data. Next, ML-based pipelines are developed for time-series forecasting of the indoor temperature, while considering several prediction windows (10 minutes to 2 hours). Similar methodology and prediction pipelines are also implemented for the second case study, in which the time-series information about the HVAC status is also provided. In the optimization procedure of the latter pipelines, using a benchmark algorithm (random forests), the most promising features are first determined. Next, a genetic algorithm-based optimization procedure is utilized in order to determine the most promising algorithm and the corresponding tuning parameters. Afterwards, the feature selection procedure is repeated while employing the obtained optimal algorithm. Finally, the pipeline determined in the previous step is utilized to carry out an incremental (online) training procedure and the corresponding training window is optimised. It is demonstrated that all of the above-mentioned conducted steps result in an increment in the obtained accuracy. It is also shown that carrying out the feature selection step notably reduces the number of features leading to a notable decrement in the computations cost, while permitting a possible reduction in the required measurements and facilitating an improved interpretation of the physical behavior of the system.File | Dimensione | Formato | |
---|---|---|---|
2019_12_Appiah_Mir.pdf
non accessibile
Descrizione: Thesis text
Dimensione
5.35 MB
Formato
Adobe PDF
|
5.35 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/150634