Helmet Continuous Positive Airway Pressure (H-CPAP) is a Non-Invasive Respiratory Support (NIRS) used to treat patients with Acute Respiratory Distress Syndrome (ARDS), a serious medical condition that can be diagnosed when respiratory symptoms such as profound hypoxemia, bilateral pulmonary opacities on radiography, and inability to explain respiratory failure by cardiac failure or fluid overload are present. Starting from the Electronic Medical Records (EMR) collected by the Pulmonology Department of Vimercate Hospital, a study has been carried out to build a Supervised Machine Learning system for predicting the failure of H-CPAP therapy on patients with ARDS, whether caused by Covid-19 or not. From the EMR, demographic information, blood tests, and vital parameters of all hospitalizations of patients treated with H-CPAP and with a diagnosis of ARDS have been extracted, and a dataset has been obtained. The dataset, containing 818 records and 41 features, has been split with proportions of 70 / 30%, obtaining a train set and a test set of 572 and 246 records, respectively, with an imbalance of 77.77 / 22.22% in favor of successes. Therapy has been considered failed if a patient dies during its administration, dies within 15 days after discharge, or undergoes intubation with Invasive Mechanical Ventilation (IMV) after administration of H-CPAP therapy. With these datasets, Machine Learning classifier models capable of approximating the class to which a patient belongs have been trained. A Random Forest model and an SVM model stood out for accuracy, precision, recall, and F1 Score. In particular, the SVM-based model achieved a final accuracy of 92.7%, a precision of 82.5%, a recall of 85.5%, and an F1 Score of 84%. The analysis with SHAP (SHapley Additive exPlanations), a popular model-agnostic explainability technique, has been able to provide an overview of the importance of each feature in contributing to the classification. In particular, the PaO2/FiO2 Ratio (as well as PaO2 and FiO2), C-Reactive Protein, and O2 saturation (both invasive and non-invasive) proved to be very important, followed by heartbeats, respiratory rate, White Blood Cells, Creatinine, and coagulation, in line with the indications of the clinicians commissioning the study.

L’Helmet Continuous Positive Airway Pressure (H-CPAP) è un Non-Invasive Respiratory Support (NIRS) utilizzato per trattare pazienti con Acute Respiratory Distress Syndrome (ARDS), una grave condizione medica diagnosticata quando sono presenti sintomi respiratori come ipossiemia profonda, opacità polmonari bilaterali alla radiografia e nessun’altra spiegazione dell’insufficienza respiratoria. A partire dalle cartelle cliniche elettroniche (EMR) raccolte dal Reparto di Pneumologia dell’Ospedale di Vimercate, è stato condotto uno studio per costruire un sistema di Machine Learning supervisionato per prevedere il fallimento della terapia H-CPAP su pazienti con ARDS, sia causato da Covid-19 che non. Dalle EMR è stato ottenuto un dataset, contenente informazioni demografiche, esami del sangue e parametri vitali di tutti i ricoveri di pazienti trattati con H-CPAP e con una diagnosi di ARDS. Il dataset, contenente 818 record e 41 features, è stato suddiviso con proporzioni del 70 / 30%, ottenendo un train set e un test set rispettivamente di 572 e 246 record. Lo sbilanciamento del dataset è stato del 77.77 / 22.22% a favore dei successi. Una terapia è stata considerata fallita se un paziente è deceduto durante la sua somministrazione, se è deceduto entro 15 giorni dalla dimissione o se è stato sottoposto a intubazione con ventilazione meccanica invasiva (IMV) dopo la somministrazione della terapia H-CPAP. Con questi dataset sono stati allenati dei modelli di Machine Learning in grado di approssimare la classe a cui appartiene un paziente. Si sono distinti per accuratezza, precisione, recall e F1 Score un modello di tipo Random Forest e uno di tipo SVM. In particolare, il modello basato su SVM ha ottenuto un’accuratezza del 92.7%, una precisione del 82.5%, una recall dell’85.5% e uno F1 Score dell’84%. L’analisi con SHAP (SHapley Additive exPlanations), una nota tecnica di spiegazione agnostica del modello, ha fornito una panoramica sull’importanza di ogni variabile nell’effettuare una classificazione: il Rapporto PaO2/FiO2 (così come PaO2 e FiO2), la Proteina C-Reattiva e la saturazione O2 (sia invasiva che non invasiva) si sono dimostrate molto importanti, seguite da battiti cardiaci, velocità di respirazione, globuli bianchi, Creatinina, e coagulazione, in linea con le indicazioni dei clinici che hanno commissionato lo studio.

Machine learning-based forecast of Helmet-CPAP therapy failure in acute distress respiratory syndrome patients

Campi, Riccardo
2022/2023

Abstract

Helmet Continuous Positive Airway Pressure (H-CPAP) is a Non-Invasive Respiratory Support (NIRS) used to treat patients with Acute Respiratory Distress Syndrome (ARDS), a serious medical condition that can be diagnosed when respiratory symptoms such as profound hypoxemia, bilateral pulmonary opacities on radiography, and inability to explain respiratory failure by cardiac failure or fluid overload are present. Starting from the Electronic Medical Records (EMR) collected by the Pulmonology Department of Vimercate Hospital, a study has been carried out to build a Supervised Machine Learning system for predicting the failure of H-CPAP therapy on patients with ARDS, whether caused by Covid-19 or not. From the EMR, demographic information, blood tests, and vital parameters of all hospitalizations of patients treated with H-CPAP and with a diagnosis of ARDS have been extracted, and a dataset has been obtained. The dataset, containing 818 records and 41 features, has been split with proportions of 70 / 30%, obtaining a train set and a test set of 572 and 246 records, respectively, with an imbalance of 77.77 / 22.22% in favor of successes. Therapy has been considered failed if a patient dies during its administration, dies within 15 days after discharge, or undergoes intubation with Invasive Mechanical Ventilation (IMV) after administration of H-CPAP therapy. With these datasets, Machine Learning classifier models capable of approximating the class to which a patient belongs have been trained. A Random Forest model and an SVM model stood out for accuracy, precision, recall, and F1 Score. In particular, the SVM-based model achieved a final accuracy of 92.7%, a precision of 82.5%, a recall of 85.5%, and an F1 Score of 84%. The analysis with SHAP (SHapley Additive exPlanations), a popular model-agnostic explainability technique, has been able to provide an overview of the importance of each feature in contributing to the classification. In particular, the PaO2/FiO2 Ratio (as well as PaO2 and FiO2), C-Reactive Protein, and O2 saturation (both invasive and non-invasive) proved to be very important, followed by heartbeats, respiratory rate, White Blood Cells, Creatinine, and coagulation, in line with the indications of the clinicians commissioning the study.
COLOMBO, PAOLO
SCARPAZZA, PAOLO
ING - Scuola di Ingegneria Industriale e dell'Informazione
5-ott-2023
2022/2023
L’Helmet Continuous Positive Airway Pressure (H-CPAP) è un Non-Invasive Respiratory Support (NIRS) utilizzato per trattare pazienti con Acute Respiratory Distress Syndrome (ARDS), una grave condizione medica diagnosticata quando sono presenti sintomi respiratori come ipossiemia profonda, opacità polmonari bilaterali alla radiografia e nessun’altra spiegazione dell’insufficienza respiratoria. A partire dalle cartelle cliniche elettroniche (EMR) raccolte dal Reparto di Pneumologia dell’Ospedale di Vimercate, è stato condotto uno studio per costruire un sistema di Machine Learning supervisionato per prevedere il fallimento della terapia H-CPAP su pazienti con ARDS, sia causato da Covid-19 che non. Dalle EMR è stato ottenuto un dataset, contenente informazioni demografiche, esami del sangue e parametri vitali di tutti i ricoveri di pazienti trattati con H-CPAP e con una diagnosi di ARDS. Il dataset, contenente 818 record e 41 features, è stato suddiviso con proporzioni del 70 / 30%, ottenendo un train set e un test set rispettivamente di 572 e 246 record. Lo sbilanciamento del dataset è stato del 77.77 / 22.22% a favore dei successi. Una terapia è stata considerata fallita se un paziente è deceduto durante la sua somministrazione, se è deceduto entro 15 giorni dalla dimissione o se è stato sottoposto a intubazione con ventilazione meccanica invasiva (IMV) dopo la somministrazione della terapia H-CPAP. Con questi dataset sono stati allenati dei modelli di Machine Learning in grado di approssimare la classe a cui appartiene un paziente. Si sono distinti per accuratezza, precisione, recall e F1 Score un modello di tipo Random Forest e uno di tipo SVM. In particolare, il modello basato su SVM ha ottenuto un’accuratezza del 92.7%, una precisione del 82.5%, una recall dell’85.5% e uno F1 Score dell’84%. L’analisi con SHAP (SHapley Additive exPlanations), una nota tecnica di spiegazione agnostica del modello, ha fornito una panoramica sull’importanza di ogni variabile nell’effettuare una classificazione: il Rapporto PaO2/FiO2 (così come PaO2 e FiO2), la Proteina C-Reattiva e la saturazione O2 (sia invasiva che non invasiva) si sono dimostrate molto importanti, seguite da battiti cardiaci, velocità di respirazione, globuli bianchi, Creatinina, e coagulazione, in linea con le indicazioni dei clinici che hanno commissionato lo studio.
File allegati
File Dimensione Formato  
Thesis___Riccardo_Campi.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Thesis
Dimensione 2.43 MB
Formato Adobe PDF
2.43 MB Adobe PDF   Visualizza/Apri
Executive_Summary___Riccardo_Campi.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Executive Summary
Dimensione 387.81 kB
Formato Adobe PDF
387.81 kB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/209435