Sepsis, a life-threatening organ dysfunction caused by dysregulated host response to infection, is considered to be one of the leading causes of illness and death. The existing literature lacks an exhaustive analysis on the evolution of septic patients’ clinical situation, which is very heterogeneous and patient dependent. In this thesis interpretable machine learning models were developed to predict the evolution of the clinical condition in septic patients, evaluating features’ predictive capability. A comprehensive pipeline for time series analysis of critical care data was developed. This pipeline included the following stages: data preprocessing, model training and evaluation. This thesis concentrated on a relatively uniform group of patients, i.e. septic patients, admitted to intensive care unit (ICU) for a minimum of two days, to exclude patients with less severe conditions. The dataset used is a freely available database named HiRID. The models implemented in the first phase of the analysis have been developed by using quantities based on medical parameters and those routinely monitored during the ICU stay. In a second phase, additional statistics have been considered, such as entropy and indices related to vital signs variability. In a third phase, quantities related to the Sequential Organ Failure Assessment (SOFA) score have been integrated in the models. Statistics related to quantities already used in clinical practice for monitoring purposes, such as lactate, mean arterial pressure (MAP), systolic and diastolic blood pressure, administered vasopressors and fluid balance, were confirmed to be significant. Also, the cross-entropy and cross-correlation between HR and SBP, and sample entropy of diastolic blood pressure resulted in the first rankings of the variable importance analysis. The best performance was registered in the models implemented using the SOFA score, where vital signs variability features seemed to play an important role.

La sepsi consiste in una risposta infiammatoria eccessiva dell'organismo a un'infezione generalizzata che danneggia tessuti e organi, ed è considerata una delle principali cause di malattia e morte. Attualmente, nella letteratura, non è presente un'analisi esaustiva riguardante la predizione dell'evoluzione clinica dei pazienti con sepsi, che è molto eterogenea a causa anche delle diverse caratteristiche dei pazienti. In questa tesi sono stati sviluppati modelli interpretabili di apprendimento automatico per predire l'evoluzione delle condizioni cliniche dei pazienti con sepsi, valutando la capacità predittiva delle variabili considerate. È stata sviluppata una pipeline per l'analisi delle serie temporali dei dati clinici. Questa pipeline comprende le seguenti fasi: pre-elaborazione dei dati, addestramento e valutazione del modello. Il database utilizzato è HiRID ed è disponibile gratuitamente online. Questa tesi è concentrata su una popolazione di studio relativamente uniforme: pazienti in sepsi ricoverati in terapia intensiva per almeno due giorni, in modo da escludere pazienti in condizioni meno critiche. I modelli implementati nella prima fase dell’analisi sono stati sviluppati utilizzando le features basate sui parametri medici e sulle quantità comunemente misurate durante la degenza in terapia intensiva. In una seconda fase, sono state prese in considerazione ulteriori statistiche, come l'entropia e gli indici relativi alla variabilità dei segni vitali (ad es. frequenza cardiaca). In una terza fase, variabili derivate dall'indice SOFA (Sequential Organ Failure Assessment) sono state integrate nel modello. Le features relative a grandezze utilizzate nella pratica clinica, come il lattato, la pressione arteriosa media, la pressione arteriosa sistolica e diastolica, la quantità di vasopressori somministrati e il bilancio di fluidi, sono risultate tra le variabili più importanti dei modelli analizzati. Inoltre, sono risultati rilevanti la cross-entropy e la correlazione incrociata tra frequenza cardiaca e pressione sistolica e l'entropia campionaria della pressione arteriosa diastolica. Le migliori prestazioni sono state registrate nei modelli implementati utilizzando l'indice SOFA in cui tra le variabili significative ricorrono ancora gli indici di variabilità dei parametri vitali.

Predicting septic patients' clinical evolution from routinely collected data: the contribution of vital signs variability

MENTASTI, ILARIA
2022/2023

Abstract

Sepsis, a life-threatening organ dysfunction caused by dysregulated host response to infection, is considered to be one of the leading causes of illness and death. The existing literature lacks an exhaustive analysis on the evolution of septic patients’ clinical situation, which is very heterogeneous and patient dependent. In this thesis interpretable machine learning models were developed to predict the evolution of the clinical condition in septic patients, evaluating features’ predictive capability. A comprehensive pipeline for time series analysis of critical care data was developed. This pipeline included the following stages: data preprocessing, model training and evaluation. This thesis concentrated on a relatively uniform group of patients, i.e. septic patients, admitted to intensive care unit (ICU) for a minimum of two days, to exclude patients with less severe conditions. The dataset used is a freely available database named HiRID. The models implemented in the first phase of the analysis have been developed by using quantities based on medical parameters and those routinely monitored during the ICU stay. In a second phase, additional statistics have been considered, such as entropy and indices related to vital signs variability. In a third phase, quantities related to the Sequential Organ Failure Assessment (SOFA) score have been integrated in the models. Statistics related to quantities already used in clinical practice for monitoring purposes, such as lactate, mean arterial pressure (MAP), systolic and diastolic blood pressure, administered vasopressors and fluid balance, were confirmed to be significant. Also, the cross-entropy and cross-correlation between HR and SBP, and sample entropy of diastolic blood pressure resulted in the first rankings of the variable importance analysis. The best performance was registered in the models implemented using the SOFA score, where vital signs variability features seemed to play an important role.
CARRARA, MARTA
ING - Scuola di Ingegneria Industriale e dell'Informazione
9-apr-2024
2022/2023
La sepsi consiste in una risposta infiammatoria eccessiva dell'organismo a un'infezione generalizzata che danneggia tessuti e organi, ed è considerata una delle principali cause di malattia e morte. Attualmente, nella letteratura, non è presente un'analisi esaustiva riguardante la predizione dell'evoluzione clinica dei pazienti con sepsi, che è molto eterogenea a causa anche delle diverse caratteristiche dei pazienti. In questa tesi sono stati sviluppati modelli interpretabili di apprendimento automatico per predire l'evoluzione delle condizioni cliniche dei pazienti con sepsi, valutando la capacità predittiva delle variabili considerate. È stata sviluppata una pipeline per l'analisi delle serie temporali dei dati clinici. Questa pipeline comprende le seguenti fasi: pre-elaborazione dei dati, addestramento e valutazione del modello. Il database utilizzato è HiRID ed è disponibile gratuitamente online. Questa tesi è concentrata su una popolazione di studio relativamente uniforme: pazienti in sepsi ricoverati in terapia intensiva per almeno due giorni, in modo da escludere pazienti in condizioni meno critiche. I modelli implementati nella prima fase dell’analisi sono stati sviluppati utilizzando le features basate sui parametri medici e sulle quantità comunemente misurate durante la degenza in terapia intensiva. In una seconda fase, sono state prese in considerazione ulteriori statistiche, come l'entropia e gli indici relativi alla variabilità dei segni vitali (ad es. frequenza cardiaca). In una terza fase, variabili derivate dall'indice SOFA (Sequential Organ Failure Assessment) sono state integrate nel modello. Le features relative a grandezze utilizzate nella pratica clinica, come il lattato, la pressione arteriosa media, la pressione arteriosa sistolica e diastolica, la quantità di vasopressori somministrati e il bilancio di fluidi, sono risultate tra le variabili più importanti dei modelli analizzati. Inoltre, sono risultati rilevanti la cross-entropy e la correlazione incrociata tra frequenza cardiaca e pressione sistolica e l'entropia campionaria della pressione arteriosa diastolica. Le migliori prestazioni sono state registrate nei modelli implementati utilizzando l'indice SOFA in cui tra le variabili significative ricorrono ancora gli indici di variabilità dei parametri vitali.
File allegati
File Dimensione Formato  
Mentasti_Ilaria___Master_Thesis.pdf

solo utenti autorizzati dal 20/03/2025

Descrizione: Master Thesis
Dimensione 5.6 MB
Formato Adobe PDF
5.6 MB Adobe PDF   Visualizza/Apri
Mentasti_Ilaria___Executive_Summary.pdf

solo utenti autorizzati dal 20/03/2025

Descrizione: Executive Summary
Dimensione 898.9 kB
Formato Adobe PDF
898.9 kB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/218674