Risks and uncertainties are inherent in construction projects, presenting challenges to their successful completion and outcomes. Conventional risk management practices often rely on manual, time-consuming, subjective, and experiential processes, leading to superficial and ineffective risk identification and assessment, and hindering the knowledge transfer to the next projects. To overcome these limitations, this research aims to explore the potential of Artificial Intelligence (AI) and Machine Learning (ML) algorithms to automate and optimize risk management processes in the construction industry. The objectives of this research are as follows: identifying the shortcomings of traditional risk management practices, defining and implementing suitable ML algorithms, addressing data scarcity and uncertainty issues in construction companies, representing interdependencies between project variables and risks using probabilistic graphical models, automating risk identification and assessment processes, continually assessing and improving risk management performance, and addressing practical implementation requirements, challenges, ethics, biases, and potential harms. To achieve these objectives, three distinct ML-based models were developed and applied to two case studies. The first case study involved analyzing the project portfolio of Jacobs Italia SPA, the industry partner of this research. The second case study utilized a comprehensive database comprising over 130,000 records of school buildings in New York City. The models employed were a probabilistic Bayesian Network model based on both subjective expert opinions and objective project data, a Fuzzy Logic model based solely on subjective expert data, and a deterministic ML model based solely on previous project data. The results from each model were recorded and analyzed to assess the influence of database size on the performance of the ML models, as well as the role of uncertainty in achieving more accurate and realistic risk predictions. While deterministic ML models with backbox structures performed better in the bigger database, Bayesian Networks demonstrated the most favorable performance in limited databases, suggesting that the integration of subjective data elicitation with objective data is an effective approach to compensate for data scarcity. Another proposed solution to address data scarcity was the use of data augmentation and synthetic data generation through Generative Adversarial Networks (GANs), which proved highly effective. The findings indicate that ML models, particularly probabilistic ones like Bayesian Networks, can significantly enhance risk management processes across various project knowledge areas. These models facilitate the identification and analysis of complex interrelationships and causal inferences between project variables, providing accurate estimates of potential risks. As a result, project managers are empowered to take proactive measures and make informed decisions to mitigate risks, leading to successful, safe, on-budget, and on-time project delivery. Although limitations such as data scarcity and a lack of benchmark studies exist, the proposed ML-based RM framework offers several contributions to the RM body of knowledge, providing practical implication solutions and proper ML model choices based on the requirements and resource availability of each company. These include identifying key risk features, providing a comparative analysis of ML algorithms, addressing implementation challenges, and promoting the adoption of AI in the construction industry.

Rischi e incertezze sono intrinseci nei progetti di costruzione, presentando sfide per il loro completamento e per il conseguimento dei risultati desiderati. Le pratiche tradizionali di gestione del rischio spesso si basano su processi manuali, dispendiosi in termini di tempo, soggettivi ed esperienziali, che portano a un'identificazione e valutazione superficiale ed inefficace del rischio, ostacolando inoltre il trasferimento delle conoscenze ai progetti successivi. Per superare queste limitazioni, questa ricerca mira ad esplorare il potenziale degli algoritmi di Intelligenza Artificiale (AI) e Machine Learning (ML) per automatizzare e ottimizzare i processi di gestione del rischio nel settore delle costruzioni. Gli obiettivi di questa ricerca sono i seguenti: identificare le carenze delle pratiche tradizionali di gestione del rischio, definire e implementare algoritmi ML adeguati, affrontare i problemi di scarsità di dati e incertezza nelle imprese di costruzione, rappresentare le interdipendenze tra variabili di progetto e rischi utilizzando modelli grafici probabilistici, automatizzare l'identificazione e la valutazione del rischio, valutare e migliorare continuamente le prestazioni della gestione del rischio e affrontare i requisiti di implementazione pratica, le sfide, l'etica, i pregiudizi e i potenziali danni. Per raggiungere questi obiettivi, sono stati sviluppati tre distinti modelli basati su machine learning e applicati a due casi di studio. Il primo caso di studio ha riguardato l'analisi del portafoglio progetti di Jacobs Italia SPA, partner industriale di questa ricerca. Il secondo caso di studio ha utilizzato un database completo comprendente oltre 130.000 registrazioni di edifici scolastici nella città di New York. I modelli utilizzati erano un modello probabilistico di rete bayesiana basato sia su opinioni soggettive di esperti che su dati oggettivi di progetto, un modello di logica sfumata basato esclusivamente su dati soggettivi di esperti e un modello ML deterministico basato esclusivamente su dati di progetti precedenti. I risultati di ciascun modello sono stati registrati e analizzati per valutare l'influenza delle dimensioni del database sulle prestazioni dei modelli ML, nonché il ruolo dell'incertezza nel raggiungimento di previsioni di rischio più accurate e realistiche. Mentre i modelli ML deterministici con strutture backbox hanno ottenuto risultati migliori nei database più ampi, le reti bayesiane hanno dimostrato le prestazioni più favorevoli nei database limitati, suggerendo che l'integrazione dell'estrazione di dati soggettivi con dati oggettivi sia un approccio efficace per compensare la scarsità di dati. Un'altra soluzione proposta per affrontare la scarsità di dati è stata l'uso dell'aumento dei dati e della generazione di dati sintetici attraverso Generative Adversarial Networks (GAN), che si sono rivelati altamente efficaci. I risultati indicano che i modelli ML, in particolare quelli probabilistici come le reti bayesiane, possono migliorare significativamente i processi di gestione del rischio in varie aree di conoscenza del progetto. Questi modelli facilitano l'identificazione e l'analisi di complesse interrelazioni e inferenze causali tra le variabili di progetto, fornendo stime accurate dei potenziali rischi. Di conseguenza, i project manager sono in grado di adottare misure proattive e prendere decisioni informate per mitigare i rischi, portando a una consegna del progetto efficace, sicura, rispettando il budget e le tempistiche previste. Sebbene esistano limitazioni come la scarsità di dati e la mancanza di studi di riferimento, il framework di gestione del rischio proposto basato sul ML offre diversi contributi al corpo di conoscenze sulla gestione del rischio, fornendo soluzioni di implicazioni pratiche e scelte di modelli ML appropriate in base ai requisiti e alla disponibilitàdi risorse di ciasuna azienda. Questi includono l'identificazione delle principali caratteristiche di rischio, la fornitura di un'analisi comparativa degli algoritmi ML, la risoluzione delle sfide di implementazione e la promozione dell'adozione dell'intelligenza artificiale nel settore delle costruzioni.

Machine learning for risk management in construction projects

Khodabakhshian, Ania
2023/2024

Abstract

Risks and uncertainties are inherent in construction projects, presenting challenges to their successful completion and outcomes. Conventional risk management practices often rely on manual, time-consuming, subjective, and experiential processes, leading to superficial and ineffective risk identification and assessment, and hindering the knowledge transfer to the next projects. To overcome these limitations, this research aims to explore the potential of Artificial Intelligence (AI) and Machine Learning (ML) algorithms to automate and optimize risk management processes in the construction industry. The objectives of this research are as follows: identifying the shortcomings of traditional risk management practices, defining and implementing suitable ML algorithms, addressing data scarcity and uncertainty issues in construction companies, representing interdependencies between project variables and risks using probabilistic graphical models, automating risk identification and assessment processes, continually assessing and improving risk management performance, and addressing practical implementation requirements, challenges, ethics, biases, and potential harms. To achieve these objectives, three distinct ML-based models were developed and applied to two case studies. The first case study involved analyzing the project portfolio of Jacobs Italia SPA, the industry partner of this research. The second case study utilized a comprehensive database comprising over 130,000 records of school buildings in New York City. The models employed were a probabilistic Bayesian Network model based on both subjective expert opinions and objective project data, a Fuzzy Logic model based solely on subjective expert data, and a deterministic ML model based solely on previous project data. The results from each model were recorded and analyzed to assess the influence of database size on the performance of the ML models, as well as the role of uncertainty in achieving more accurate and realistic risk predictions. While deterministic ML models with backbox structures performed better in the bigger database, Bayesian Networks demonstrated the most favorable performance in limited databases, suggesting that the integration of subjective data elicitation with objective data is an effective approach to compensate for data scarcity. Another proposed solution to address data scarcity was the use of data augmentation and synthetic data generation through Generative Adversarial Networks (GANs), which proved highly effective. The findings indicate that ML models, particularly probabilistic ones like Bayesian Networks, can significantly enhance risk management processes across various project knowledge areas. These models facilitate the identification and analysis of complex interrelationships and causal inferences between project variables, providing accurate estimates of potential risks. As a result, project managers are empowered to take proactive measures and make informed decisions to mitigate risks, leading to successful, safe, on-budget, and on-time project delivery. Although limitations such as data scarcity and a lack of benchmark studies exist, the proposed ML-based RM framework offers several contributions to the RM body of knowledge, providing practical implication solutions and proper ML model choices based on the requirements and resource availability of each company. These include identifying key risk features, providing a comparative analysis of ML algorithms, addressing implementation challenges, and promoting the adoption of AI in the construction industry.
SCAIONI, MARCO
RUTA, MATTEO FRANCESCO
6-nov-2023
Machine learning for risk management in construction projects
Rischi e incertezze sono intrinseci nei progetti di costruzione, presentando sfide per il loro completamento e per il conseguimento dei risultati desiderati. Le pratiche tradizionali di gestione del rischio spesso si basano su processi manuali, dispendiosi in termini di tempo, soggettivi ed esperienziali, che portano a un'identificazione e valutazione superficiale ed inefficace del rischio, ostacolando inoltre il trasferimento delle conoscenze ai progetti successivi. Per superare queste limitazioni, questa ricerca mira ad esplorare il potenziale degli algoritmi di Intelligenza Artificiale (AI) e Machine Learning (ML) per automatizzare e ottimizzare i processi di gestione del rischio nel settore delle costruzioni. Gli obiettivi di questa ricerca sono i seguenti: identificare le carenze delle pratiche tradizionali di gestione del rischio, definire e implementare algoritmi ML adeguati, affrontare i problemi di scarsità di dati e incertezza nelle imprese di costruzione, rappresentare le interdipendenze tra variabili di progetto e rischi utilizzando modelli grafici probabilistici, automatizzare l'identificazione e la valutazione del rischio, valutare e migliorare continuamente le prestazioni della gestione del rischio e affrontare i requisiti di implementazione pratica, le sfide, l'etica, i pregiudizi e i potenziali danni. Per raggiungere questi obiettivi, sono stati sviluppati tre distinti modelli basati su machine learning e applicati a due casi di studio. Il primo caso di studio ha riguardato l'analisi del portafoglio progetti di Jacobs Italia SPA, partner industriale di questa ricerca. Il secondo caso di studio ha utilizzato un database completo comprendente oltre 130.000 registrazioni di edifici scolastici nella città di New York. I modelli utilizzati erano un modello probabilistico di rete bayesiana basato sia su opinioni soggettive di esperti che su dati oggettivi di progetto, un modello di logica sfumata basato esclusivamente su dati soggettivi di esperti e un modello ML deterministico basato esclusivamente su dati di progetti precedenti. I risultati di ciascun modello sono stati registrati e analizzati per valutare l'influenza delle dimensioni del database sulle prestazioni dei modelli ML, nonché il ruolo dell'incertezza nel raggiungimento di previsioni di rischio più accurate e realistiche. Mentre i modelli ML deterministici con strutture backbox hanno ottenuto risultati migliori nei database più ampi, le reti bayesiane hanno dimostrato le prestazioni più favorevoli nei database limitati, suggerendo che l'integrazione dell'estrazione di dati soggettivi con dati oggettivi sia un approccio efficace per compensare la scarsità di dati. Un'altra soluzione proposta per affrontare la scarsità di dati è stata l'uso dell'aumento dei dati e della generazione di dati sintetici attraverso Generative Adversarial Networks (GAN), che si sono rivelati altamente efficaci. I risultati indicano che i modelli ML, in particolare quelli probabilistici come le reti bayesiane, possono migliorare significativamente i processi di gestione del rischio in varie aree di conoscenza del progetto. Questi modelli facilitano l'identificazione e l'analisi di complesse interrelazioni e inferenze causali tra le variabili di progetto, fornendo stime accurate dei potenziali rischi. Di conseguenza, i project manager sono in grado di adottare misure proattive e prendere decisioni informate per mitigare i rischi, portando a una consegna del progetto efficace, sicura, rispettando il budget e le tempistiche previste. Sebbene esistano limitazioni come la scarsità di dati e la mancanza di studi di riferimento, il framework di gestione del rischio proposto basato sul ML offre diversi contributi al corpo di conoscenze sulla gestione del rischio, fornendo soluzioni di implicazioni pratiche e scelte di modelli ML appropriate in base ai requisiti e alla disponibilitàdi risorse di ciasuna azienda. Questi includono l'identificazione delle principali caratteristiche di rischio, la fornitura di un'analisi comparativa degli algoritmi ML, la risoluzione delle sfide di implementazione e la promozione dell'adozione dell'intelligenza artificiale nel settore delle costruzioni.
File allegati
File Dimensione Formato  
Final Thesis-Ania Khodabakhshian-ABC Department.pdf

accessibile in internet per tutti

Dimensione 10.78 MB
Formato Adobe PDF
10.78 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/213352