The objective of this study is to investigate the application of Machine Learning algorithms in addressing sustainability challenges within the service industry, with a specific focus on the economic dimension of healthcare sustainability. The work starts with a systematic literature review following PRISMA methodology, analyzing 85 articles published between 2015 and 2024 to map current trends concerning the relationship between Machine Learning and sustainability across both service and manufacturing industries. The aim is to identify research gaps and categorize studies according to three axes: type of learning (supervised, unsupervised, reinforcement), the dimension of the Triple Bottom Line (economic, environmental, social), and industry sector. To address the identified gap, a predictive patient allocation model was developed using hospital data from a Milanese hospital. The data required for this application consisted of over 30,000 anonymized surgical records, which went through cleaning, preprocessing, feature selection through Boruta algorithm, and class balancing with SMOTE techniques. Seven supervised ML algorithms were tested: Decision Tree, Random Forest, Naïve Bayes, K-Nearest Neighbors, Logistic Regression, Support Vector Machine, and Neural Networks. The evaluation involves traditional performance metrics (accuracy, precision, recall, F1-score, ROC AUC, execution time) with a novel cost-based metric that quantifies the economic impact of misclassifications. The study estimated that false positives cost approximately €750, while false negatives lead to about €1,250 due to emergency transfers and prolonged hospitalization. The analysis unfolds that there is not a single universally superior algorithm, since performance depends on hospital priorities and operational constraints. Neural Networks delivered the strongest overall performance with 85.4% accuracy, F1-score of 0.682, and the lowest estimated misclassification cost (€546,750). Support Vector Machines excelled in minimizing false negatives with a recall of 0.803, while Logistic Regression proved effective for real-time applications with reasonable execution time and important cost savings (€617,000). The research provides innovative insights for analyzing the relationship between Machine Learning and economic sustainability in healthcare, demonstrating how predictive models can support resource allocation decisions while quantifying their financial impact, thus contributing to the broader mission of healthcare and operational excellence.

L’obiettivo di questo studio è indagare l’utilizzo degli algoritmi di Machine Learning nell’affrontare le sfide della sostenibilità nel settore dei servizi, in particolare alla dimensione economica della sostenibilità sanitaria. Il lavoro inizia con una revisione sistematica della letteratura seguendo la metodologia PRISMA, analizzando 85 articoli pubblicati tra il 2015 e il 2024 per catturare le tendenze attuali riguardanti la relazione tra Machine Learning e sostenibilità sia nei servizi sia nell’industria manifatturiera. Lo scopo è identificare i gap di ricerca e categorizzare gli studi secondo tre assi: tipologia di apprendimento (supervised, unsupervised, reinforcement), dimensione del Triple Bottom Line (economica, ambientale, sociale) e settore industriale. A tal fine, è stato sviluppato un modello predittivo di allocazione dei pazienti basato su dati di un ospedale milanese. Il dataset impiegato consisteva in oltre 30.000 record chirurgici anonimizzati, sottoposti a fasi di pulizia, preprocessing, selezione delle variabili tramite algoritmo Boruta e bilanciamento delle classi tramite SMOTE. Sono stati testati sette algoritmi di apprendimento supervisionato: Decision Tree, Random Forest, Naïve Bayes, K-Nearest Neighbors, Logistic Regression, Support Vector Machine e Neural Networks. La valutazione ha incluso sia metriche tradizionali di performance (accuratezza, precisione, recall, F1-score, ROC AUC, tempo di esecuzione) sia una nuova metrica basata sui costi che stima l’impatto economico degli errori. Lo studio ha stimato che i falsi positivi comportano un costo medio di circa 750 €, mentre i falsi negativi di circa 1.250 € a causa di trasferimenti e ricoveri prolungati. L’analisi evidenzia che non esiste un algoritmo universalmente superiore, poiché la performance dipende dalle priorità e dai vincoli operativi dell’ospedale. Le Neural Networks hanno ottenuto la migliore performance nell’accuratezza (85,4%), F1-score (0,682) e nel costo di misclassificazione (546.750 €). Le Support Vector Machines hanno meglio minimizzato i falsi negativi, con un recall di 0,803, mentre la Logistic Regression è risultata efficace per applicazioni reali, con tempi di esecuzione contenuti e un ottimo risparmio economico (617.000 €). La ricerca offre innovazione nel rapporto tra Machine Learning e sostenibilità economica in sanità, dimostrando come i modelli predittivi possano supportare l’allocazione delle risorse quantificandone l’impatto finanziario, contribuendo così alla missione di sostenibilità e di eccellenza operativa in ambito sanitario.

Machine learning in healthcare sustainability: bridging the economic gap through predictive patient allocation model

Guernieri, Luigi
2025/2026

Abstract

The objective of this study is to investigate the application of Machine Learning algorithms in addressing sustainability challenges within the service industry, with a specific focus on the economic dimension of healthcare sustainability. The work starts with a systematic literature review following PRISMA methodology, analyzing 85 articles published between 2015 and 2024 to map current trends concerning the relationship between Machine Learning and sustainability across both service and manufacturing industries. The aim is to identify research gaps and categorize studies according to three axes: type of learning (supervised, unsupervised, reinforcement), the dimension of the Triple Bottom Line (economic, environmental, social), and industry sector. To address the identified gap, a predictive patient allocation model was developed using hospital data from a Milanese hospital. The data required for this application consisted of over 30,000 anonymized surgical records, which went through cleaning, preprocessing, feature selection through Boruta algorithm, and class balancing with SMOTE techniques. Seven supervised ML algorithms were tested: Decision Tree, Random Forest, Naïve Bayes, K-Nearest Neighbors, Logistic Regression, Support Vector Machine, and Neural Networks. The evaluation involves traditional performance metrics (accuracy, precision, recall, F1-score, ROC AUC, execution time) with a novel cost-based metric that quantifies the economic impact of misclassifications. The study estimated that false positives cost approximately €750, while false negatives lead to about €1,250 due to emergency transfers and prolonged hospitalization. The analysis unfolds that there is not a single universally superior algorithm, since performance depends on hospital priorities and operational constraints. Neural Networks delivered the strongest overall performance with 85.4% accuracy, F1-score of 0.682, and the lowest estimated misclassification cost (€546,750). Support Vector Machines excelled in minimizing false negatives with a recall of 0.803, while Logistic Regression proved effective for real-time applications with reasonable execution time and important cost savings (€617,000). The research provides innovative insights for analyzing the relationship between Machine Learning and economic sustainability in healthcare, demonstrating how predictive models can support resource allocation decisions while quantifying their financial impact, thus contributing to the broader mission of healthcare and operational excellence.
FERRAZZI, MATTEO
PRESCIUTTINI, ANNA
ING - Scuola di Ingegneria Industriale e dell'Informazione
23-ott-2025
2025/2026
L’obiettivo di questo studio è indagare l’utilizzo degli algoritmi di Machine Learning nell’affrontare le sfide della sostenibilità nel settore dei servizi, in particolare alla dimensione economica della sostenibilità sanitaria. Il lavoro inizia con una revisione sistematica della letteratura seguendo la metodologia PRISMA, analizzando 85 articoli pubblicati tra il 2015 e il 2024 per catturare le tendenze attuali riguardanti la relazione tra Machine Learning e sostenibilità sia nei servizi sia nell’industria manifatturiera. Lo scopo è identificare i gap di ricerca e categorizzare gli studi secondo tre assi: tipologia di apprendimento (supervised, unsupervised, reinforcement), dimensione del Triple Bottom Line (economica, ambientale, sociale) e settore industriale. A tal fine, è stato sviluppato un modello predittivo di allocazione dei pazienti basato su dati di un ospedale milanese. Il dataset impiegato consisteva in oltre 30.000 record chirurgici anonimizzati, sottoposti a fasi di pulizia, preprocessing, selezione delle variabili tramite algoritmo Boruta e bilanciamento delle classi tramite SMOTE. Sono stati testati sette algoritmi di apprendimento supervisionato: Decision Tree, Random Forest, Naïve Bayes, K-Nearest Neighbors, Logistic Regression, Support Vector Machine e Neural Networks. La valutazione ha incluso sia metriche tradizionali di performance (accuratezza, precisione, recall, F1-score, ROC AUC, tempo di esecuzione) sia una nuova metrica basata sui costi che stima l’impatto economico degli errori. Lo studio ha stimato che i falsi positivi comportano un costo medio di circa 750 €, mentre i falsi negativi di circa 1.250 € a causa di trasferimenti e ricoveri prolungati. L’analisi evidenzia che non esiste un algoritmo universalmente superiore, poiché la performance dipende dalle priorità e dai vincoli operativi dell’ospedale. Le Neural Networks hanno ottenuto la migliore performance nell’accuratezza (85,4%), F1-score (0,682) e nel costo di misclassificazione (546.750 €). Le Support Vector Machines hanno meglio minimizzato i falsi negativi, con un recall di 0,803, mentre la Logistic Regression è risultata efficace per applicazioni reali, con tempi di esecuzione contenuti e un ottimo risparmio economico (617.000 €). La ricerca offre innovazione nel rapporto tra Machine Learning e sostenibilità economica in sanità, dimostrando come i modelli predittivi possano supportare l’allocazione delle risorse quantificandone l’impatto finanziario, contribuendo così alla missione di sostenibilità e di eccellenza operativa in ambito sanitario.
File allegati
File Dimensione Formato  
Tesi_Luigi_Guernieri.pdf

non accessibile

Descrizione: Tesi di Luigi Guernieri
Dimensione 2.87 MB
Formato Adobe PDF
2.87 MB Adobe PDF   Visualizza/Apri
Executive Summary Luigi Guernieri.pdf

non accessibile

Descrizione: Executive Summary di Luigi Guernieri
Dimensione 1.03 MB
Formato Adobe PDF
1.03 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/242999