This thesis aims to evaluate and overcome common shortcomings of forecasting analysis in construction industry. Particularly, starting from the debate around traditional bias-mitigation approaches, the dissertation analyses the standout role of “Reference Class Forecasting (RCF)”, recognizing two main categories of limitations of this methodology. On one hand, technical shortcomings of the method are highlighted (i.e. reference class biased, small replicability and flexibility), while on the other, the exclusive application to traditional success factors such as time and cost is reported. Consequently, the thesis evaluates Artificial Intelligence (AI) assisted tools as valuable solution to technical shortcomings, with particular emphasis on machine learning techniques and “K-means” algorithm. At the same time, a literature review on the debate around success factors in project management is provided to justify the willingness of expanding success factors also to stakeholders and sustainability criteria. To address these research gaps the thesis presents a progressive integration of theoretical reflection and empirical application with the aim of developing an alternative forecasting methodology, the “Clustering Behavioural Analysis (C-BA)”, an artificial intelligence assisted model based on K-means algorithms. Firstly, an additional literature review is conducted to identify effective criteria with which expand the research. These indexes are selected to design an effective database structure, on which the model will be applied. Building on most advanced success factors theories, such as “Tesseract Model”, this database includes both traditional dimensions (i.e. project data, cost and time) and novel ones, developed starting from the “Triple Bottom Line” framework (environmental, social and economic sustainability criteria). The thesis will therefore present the database population process, performed with real cases data thanks to the collaboration of Techbau S.p.A., a leading Italian construction industry. Consequently, the dissertation will focus on the design of the C-BA methodology. The architecture and the functioning of the model is therefore presented, highlighting its potentialities for the studied topics. Following, after having illustrated all the data preprocessing and initialization steps, the model is applied to two distinct databases. Firstly, the C-BA is used in the analysis of the full populated database, to assess the functioning of the model and its ability in overcoming technical RCF’s shortcomings. Following, all sustainability data are removed from the database, and the C-BA is applied a second time. The outcomes of this process will be compared with the first one to understand the impact of the sustainability dimension in forecasting analysis. Results obtained will be therefore presented. Particularly, the thesis will report and illustrate outcomes of each phase, including clusters selection of the initialization process, projects’ membership to each cluster, centroids values and C-BA Sankey diagram. For each of these elements, justifications and explanations are provided, concluding with an example on how C-BA can be read to gain relevant information from project’s data. Then, results are discussed in relation to the research questions. Particularly, attention is given to the relevance of C-BA as a technical alternative for forecasting analysis and to sustainability dimensions as a new critical element in assessing project success. Starting from the critical analysis of results, both theoretical and practitioners’ implications of the thesis are provided. Indeed, this research has produced contributions on both the theoretical and practical levels, actively participating to the debate on forecasting methodologies and on success factors’ theories, while simultaneously providing an effective data-driven forecasting approach that can be applied by construction industry professionals. The conclusion, finally, highlight the relevance of the works, reporting also its limitations and avenues for future possible development.

La seguente tesi si pone l’obbiettivo di studiare e superare le comuni criticità presenti nelle analisi previsionali nel settore delle costruzioni. In particolare, partendo dall’analisi del dibattito inerente ai tradizionali approcci di mitigazione dei bias, la ricerca analizza il ruolo di rilevo del “Reference Class Forecasting (RCF)”, riconoscendone due principale categorie di limiti. In primo luogo, vengono evidenziate le carenze tecniche del metodo (come, ad esempio, persistenza di bias nella selezione delle classi di riferimento, scarsa replicabilità e flessibilità); inoltre, viene criticata l’applicazione esclusiva di questo modello a fattori di successo tradizionali, quali il rispetto di tempi e costi. Di conseguenza, la tesi valuta metodologie che sfruttano l’utilizzo di modelli di intelligenza artificiale quale soluzione valida per le criticità tecniche, ponendo particolare enfasi su strumenti di machine learning e algoritmi “K-Means”. Allo stesso tempo, viene condotta una revisione della letteratura rispetto al dibattitto riguardante i fattori di successo nel project management, al fine di giustificare la volontà di questa tesi di includere in tali fattori anche criteri legati a stakeholders e sostenibilità. Per risolvere queste lacune nella ricerca, la tesi integra progressivamente riflessioni teoriche e applicazioni empiriche, con l’obbiettivo finale di sviluppare una metodologia di previsione alternativa, denominata “Clustering- Behavioural Analysis”, un modello supportato dall’intelligenza artificiale e strutturato sull’utilizzo di algoritmi K-Means. Innanzitutto, viene svolta un’ulteriore analisi della letteratura al fine di individuare i criteri più efficaci con cui espandere la ricerca. Questi indici vengono selezionati per la progettazione di un database efficace, sul quale il modello verrà applicato. Difatti, usando come riferimento le moderne teorie sui fattori di successo quali il “Tesseract Model”, il database integra sia elementi tradizionali (dati generali, tempi e costi) che dimensioni innovative, sviluppate partendo dalla struttura del “Triple Bottom Line” (criteri di sostenibilità ambientale, sociale ed economica). Viene quindi presentato il processo di popolazione del database così costituito con l’utilizzo di dati reali, forniti da un’impresa leader nel settore delle costruzioni in Italia, Techbau S.p.A. Delineato il database, la trattazione si concentra sulla struttura del modello C-BA. Ne viene quindi descritta l’architettura e il funzionamento, evidenziando le potenzialità rispetto al tema studiato. A seguire, dopo aver illustrato le fasi di processo e inizializzazione dei dati, il modello viene applicato a due distinti database. Nel primo caso, il C-BA è utilizzato sull’intero database, per valutare il funzionamento del modello e la sua capacità o meno nel superare le criticità tecniche del RCF. In seguito, i dati relativi alla sostenibilità vengono rimossi dal database e il modello viene applicato una seconda volta. I risultati dei due processi vengono quindi confrontati per comprendere l’impatto della sostenibilità quale fattore di successo nelle analisi previsionali. I risultati ottenuti vengono quindi presentati. Nello specifico, la tesi riporta e illustra gli output di ciascuna fase, tra cui la selezione dei cluster nel processo di inizializzazione, l’appartenenza dei progetti ai diversi cluster, i valori di ciascun centroide e il diagramma di Sankey del C-BA. Per ciascuno di questi elementi, sono fornite giustificazioni e spiegazioni, terminando la presentazione dei risultati con un esempio pratico di come i risultati del C-BA possono esser letti per ottenere informazioni rilevanti dai dati dei progetti. Di seguito, i risultati vengono discussi in relazione alle domande di ricerca. In particolare, l’attenzione è riposta alla rilevanza del C-BA quale alternativa tecnica per le analisi previsionali e alla dimensione della sostenibilità come nuovo elemento critico nella valutazione del successo dei progetti. Partendo dall’analisi critica dei risultati, sono quindi presentate le implicazioni sia teoriche che pratiche della ricerca. Difatti, questo lavoro ha prodotto contributi sia sul piano teorico che pratico, partecipando attivamente ai dibattiti sulle metodologie di previsione e sulle teorie inerenti ai fattori di successo. Contemporaneamente, ha proposto un effettivo approccio previsionale basato sull’analisi dati che può esser applicato dai professionisti del settore delle costruzioni. Infine, la conclusione del lavoro evidenzia la rilevanza della tesi, presentando allo stesso tempo i suoi limiti e i possibili sviluppi futuri.

Clustering - behavioural analysis in construction industry: evaluation of sustainability in project success

Oggionni, Marco
2024/2025

Abstract

This thesis aims to evaluate and overcome common shortcomings of forecasting analysis in construction industry. Particularly, starting from the debate around traditional bias-mitigation approaches, the dissertation analyses the standout role of “Reference Class Forecasting (RCF)”, recognizing two main categories of limitations of this methodology. On one hand, technical shortcomings of the method are highlighted (i.e. reference class biased, small replicability and flexibility), while on the other, the exclusive application to traditional success factors such as time and cost is reported. Consequently, the thesis evaluates Artificial Intelligence (AI) assisted tools as valuable solution to technical shortcomings, with particular emphasis on machine learning techniques and “K-means” algorithm. At the same time, a literature review on the debate around success factors in project management is provided to justify the willingness of expanding success factors also to stakeholders and sustainability criteria. To address these research gaps the thesis presents a progressive integration of theoretical reflection and empirical application with the aim of developing an alternative forecasting methodology, the “Clustering Behavioural Analysis (C-BA)”, an artificial intelligence assisted model based on K-means algorithms. Firstly, an additional literature review is conducted to identify effective criteria with which expand the research. These indexes are selected to design an effective database structure, on which the model will be applied. Building on most advanced success factors theories, such as “Tesseract Model”, this database includes both traditional dimensions (i.e. project data, cost and time) and novel ones, developed starting from the “Triple Bottom Line” framework (environmental, social and economic sustainability criteria). The thesis will therefore present the database population process, performed with real cases data thanks to the collaboration of Techbau S.p.A., a leading Italian construction industry. Consequently, the dissertation will focus on the design of the C-BA methodology. The architecture and the functioning of the model is therefore presented, highlighting its potentialities for the studied topics. Following, after having illustrated all the data preprocessing and initialization steps, the model is applied to two distinct databases. Firstly, the C-BA is used in the analysis of the full populated database, to assess the functioning of the model and its ability in overcoming technical RCF’s shortcomings. Following, all sustainability data are removed from the database, and the C-BA is applied a second time. The outcomes of this process will be compared with the first one to understand the impact of the sustainability dimension in forecasting analysis. Results obtained will be therefore presented. Particularly, the thesis will report and illustrate outcomes of each phase, including clusters selection of the initialization process, projects’ membership to each cluster, centroids values and C-BA Sankey diagram. For each of these elements, justifications and explanations are provided, concluding with an example on how C-BA can be read to gain relevant information from project’s data. Then, results are discussed in relation to the research questions. Particularly, attention is given to the relevance of C-BA as a technical alternative for forecasting analysis and to sustainability dimensions as a new critical element in assessing project success. Starting from the critical analysis of results, both theoretical and practitioners’ implications of the thesis are provided. Indeed, this research has produced contributions on both the theoretical and practical levels, actively participating to the debate on forecasting methodologies and on success factors’ theories, while simultaneously providing an effective data-driven forecasting approach that can be applied by construction industry professionals. The conclusion, finally, highlight the relevance of the works, reporting also its limitations and avenues for future possible development.
ARAYA ALIAGA, ERIK HUMBERTO
MANCINI, MAURO
MARIANI, COSTANZA
ARC I - Scuola di Architettura Urbanistica Ingegneria delle Costruzioni
23-ott-2025
2024/2025
La seguente tesi si pone l’obbiettivo di studiare e superare le comuni criticità presenti nelle analisi previsionali nel settore delle costruzioni. In particolare, partendo dall’analisi del dibattito inerente ai tradizionali approcci di mitigazione dei bias, la ricerca analizza il ruolo di rilevo del “Reference Class Forecasting (RCF)”, riconoscendone due principale categorie di limiti. In primo luogo, vengono evidenziate le carenze tecniche del metodo (come, ad esempio, persistenza di bias nella selezione delle classi di riferimento, scarsa replicabilità e flessibilità); inoltre, viene criticata l’applicazione esclusiva di questo modello a fattori di successo tradizionali, quali il rispetto di tempi e costi. Di conseguenza, la tesi valuta metodologie che sfruttano l’utilizzo di modelli di intelligenza artificiale quale soluzione valida per le criticità tecniche, ponendo particolare enfasi su strumenti di machine learning e algoritmi “K-Means”. Allo stesso tempo, viene condotta una revisione della letteratura rispetto al dibattitto riguardante i fattori di successo nel project management, al fine di giustificare la volontà di questa tesi di includere in tali fattori anche criteri legati a stakeholders e sostenibilità. Per risolvere queste lacune nella ricerca, la tesi integra progressivamente riflessioni teoriche e applicazioni empiriche, con l’obbiettivo finale di sviluppare una metodologia di previsione alternativa, denominata “Clustering- Behavioural Analysis”, un modello supportato dall’intelligenza artificiale e strutturato sull’utilizzo di algoritmi K-Means. Innanzitutto, viene svolta un’ulteriore analisi della letteratura al fine di individuare i criteri più efficaci con cui espandere la ricerca. Questi indici vengono selezionati per la progettazione di un database efficace, sul quale il modello verrà applicato. Difatti, usando come riferimento le moderne teorie sui fattori di successo quali il “Tesseract Model”, il database integra sia elementi tradizionali (dati generali, tempi e costi) che dimensioni innovative, sviluppate partendo dalla struttura del “Triple Bottom Line” (criteri di sostenibilità ambientale, sociale ed economica). Viene quindi presentato il processo di popolazione del database così costituito con l’utilizzo di dati reali, forniti da un’impresa leader nel settore delle costruzioni in Italia, Techbau S.p.A. Delineato il database, la trattazione si concentra sulla struttura del modello C-BA. Ne viene quindi descritta l’architettura e il funzionamento, evidenziando le potenzialità rispetto al tema studiato. A seguire, dopo aver illustrato le fasi di processo e inizializzazione dei dati, il modello viene applicato a due distinti database. Nel primo caso, il C-BA è utilizzato sull’intero database, per valutare il funzionamento del modello e la sua capacità o meno nel superare le criticità tecniche del RCF. In seguito, i dati relativi alla sostenibilità vengono rimossi dal database e il modello viene applicato una seconda volta. I risultati dei due processi vengono quindi confrontati per comprendere l’impatto della sostenibilità quale fattore di successo nelle analisi previsionali. I risultati ottenuti vengono quindi presentati. Nello specifico, la tesi riporta e illustra gli output di ciascuna fase, tra cui la selezione dei cluster nel processo di inizializzazione, l’appartenenza dei progetti ai diversi cluster, i valori di ciascun centroide e il diagramma di Sankey del C-BA. Per ciascuno di questi elementi, sono fornite giustificazioni e spiegazioni, terminando la presentazione dei risultati con un esempio pratico di come i risultati del C-BA possono esser letti per ottenere informazioni rilevanti dai dati dei progetti. Di seguito, i risultati vengono discussi in relazione alle domande di ricerca. In particolare, l’attenzione è riposta alla rilevanza del C-BA quale alternativa tecnica per le analisi previsionali e alla dimensione della sostenibilità come nuovo elemento critico nella valutazione del successo dei progetti. Partendo dall’analisi critica dei risultati, sono quindi presentate le implicazioni sia teoriche che pratiche della ricerca. Difatti, questo lavoro ha prodotto contributi sia sul piano teorico che pratico, partecipando attivamente ai dibattiti sulle metodologie di previsione e sulle teorie inerenti ai fattori di successo. Contemporaneamente, ha proposto un effettivo approccio previsionale basato sull’analisi dati che può esser applicato dai professionisti del settore delle costruzioni. Infine, la conclusione del lavoro evidenzia la rilevanza della tesi, presentando allo stesso tempo i suoi limiti e i possibili sviluppi futuri.
File allegati
File Dimensione Formato  
2025_10_Oggionni.pdf

non accessibile

Descrizione: Tesi completa di frontespizio, testo e appendice
Dimensione 3.57 MB
Formato Adobe PDF
3.57 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/243606