Machine learning based estimation of commercial buildings characteristics : determining the most influential temporal features

The possibility of categorizing commercial buildings, in terms of application and performance, in a remote manner provides a significant advantage for commissioning, benchmarking, and diagnostics applications. The latter procedures are fundamental steps to improve the energy efficiency and reduce the global impact of buildings. In this framework, the present work is focused on determining the most influential temporal features, to be extracted from the smart meter data, aiming at facilitating machine learning based classification of non-residential buildings. Accordingly, starting from the latest methodology proposed in the literature for achieving the latter aim, an alternative procedure for the analysis and interpretation of features is proposed and implemented. As the first step, state-of-the-art feature selection methods along with a proposed customized approach are utilized to determine the most influential parameters in the generated pool of features while attempting to improve the classification accuracy. The latter procedures are carried out while considering three different classification objectives including building use, performance class, and operation strategy. Feature importance coefficients, generated in the context of a load prediction framework, are next added to the set of temporal features aiming at enhancing the obtained accuracy. The influence of each selected variable on the overall classification accuracy is then demonstrated utilizing graphical tools. Multi-class boxplots are also employed to analyze the behaviour of different classes and features' significance in terms of the corresponding categorization. It is demonstrated that the proposed methodology improves the efficiency of the analysis and increases the corresponding accuracy while facilitating the interpretation of the obtained results. Finally, an additional analysis is performed in terms of variable importance outcomes for load prediction. The latter analysis permits finding patterns among building classes and identifying particular variables that are more significant for a certain class in a load prediction framework.

La possibilità di categorizzare da remoto edifici commerciali, in termini di tipologia d'uso e performance energetica, costituisce un vantaggio significativo per applicazioni di commissioning, benchmarking e diagnostica edilizia. Tali processi sono fondamentali per l'efficientamento energetico e la riduzione dell'impatto globale di questo settore. Partendo da questo contesto, il presente lavoro si propone di determinare le caratteristiche temporali più influenti, da estrarre a partire dai dati ricavati da contatori elettrici intelligenti, e volte a facilitare la classificazione di edifici non residenziali usando il machine learning. Conseguentemente, partendo dai più recenti studi nella letteratura relativi agli obiettivi sopramenzionati, viene proposto un metodo alternativo per l'analisi ed interpretazione delle caratteristiche impiegate. Come primo passo, i più attuali metodi per la selezione delle caratteristiche e un aggiuntivo metodo personalizzato sono impiegati per determinare i parametri più influenti tra quelli generati, cercando allo stesso tempo di migliorare la performance della classificazione. Tali procedimenti sono attuati considerando tre diversi obiettivi di classificazione tra cui tipologia di utilizzo dell'edificio, classe di performance energetica, e strategia di operazione. In seguito, sono ricavati dei coefficienti, indice della diversa importanza di alcune caratteristiche usate nella previsione del consumo elettrico degli stessi edifici, e sono aggiunti come ulteriori parametri per valutarne l'efficacia. L'impatto di ogni caratteristica selezionata sulla precisione complessiva della classificazione è dimostrato tramite l'impiego di strumenti grafici. Boxplot multi-classe sono usati per analizzare l'andamento delle diverse classi e il significato delle caratteristiche in termini di relativa categorizzazione. Il metodo proposto consente una più efficace analisi ed interpretazione delle logiche di funzionamento che caratterizzano gli edifici, affinando complessivamente la qualità dei risultati ottenuti. Infine, viene svolta un'analisi aggiuntiva relativa all'importanza delle caratteristiche generate nel contesto di previsione dei consumi. Tale analisi permette l'individuazione di pattern tra diverse classi di edifici e di caratteristiche particolarmente significative per la previsione del consumo di una determinata categoria.