Sepsis is a life-threatening condition characterized by a dysregulated immune response to infection, leading to organ dysfunction and high mortality rates. A predictive model can be useful to treat this condition by anticipating its deterioration. Hidden Markov Models (HMM) and Long Short-Term Memory (LSTM) neural networks were developed to analyze routinely collected ICU data and anticipate patient deterioration. The study is structured into key phases: data preprocessing, feature selection, model training, and evaluation. Data from the HiRID dataset, a high-resolution ICU database, is utilized. A relatively uniform group of patients – i.e. septic patients, admitted to ICU for a minimum of two days, to exclude patients with less severe conditions – represents the cohort of this thesis. A critical step involves defining a labeling procedure based on clinical indicators (qSOFA, MAP levels, lactate levels, vasopressor administration) allowing for patient stratification into different severity levels. The HMM approach models patient state transitions over time, incorporating historical clinical trajectories to estimate hidden disease states and predict deterioration or recovery. The LSTM model, in contrast, processes sequential patient data, leveraging deep learning techniques to identify temporal dependencies in physiological signals. Both models utilize 4-hour time windows to forecast the patient's clinical status. The performances - conducted through key metrics such as accuracy, precision, recall, F1-score, AUROC, and PR AUC - proved HMM and LSTM to have comparable predictive capabilities. The study demonstrates, the potential of machine learning on ICU data for the detection of sepsis progression.
La sepsi è una condizione critica, caratterizzata da una risposta immunitaria disregolata a un'infezione, che porta a disfunzioni d'organo e ad alti tassi di mortalità. Un modello predittivo può essere utile per trattare questa condizione anticipando il progressivo deterioramento delle condizioni del paziente. In questa tesi sono stati sviluppati due modelli predittivi: un modello Hidden Markov e un modello con reti neurali LSTM (Long Short-Term Memory) per analizzare i dati raccolti in terapia intensiva e anticipare il deterioramento del paziente. Lo studio è strutturato in diverse fasi: preelaborazione dei dati, selezione delle "features", addestramento dei modelli e valutazione delle performance. Sono stati utilizzati i dati del dataset HiRID, un database di terapia intensiva con dati raccolti ad alta risoluzione. Un gruppo relativamente omogeneo di pazienti - cioè pazienti settici, ricoverati in terapia intensiva per un minimo di due giorni, per escludere i pazienti con condizioni meno gravi - rappresenta la popolazione di questo studio. Una fase critica è rappresentata nel definire una procedura di "labeling" basata su indicatori clinici (qSOFA, livelli di pressione media, livelli di lattato, somministrazione di vasopressori) che sia in grado di stratificare i pazienti in diversi livelli di gravità. L'approccio HMM modella le transizioni di stato del paziente nel tempo, incorporando le traiettorie cliniche storiche per stimare gli stati patologici nascosti e prevedere il deterioramento o il recupero delle condizioni del paziente. Il modello LSTM, invece, elabora i dati sequenziali del paziente, sfruttando tecniche di deep learning per identificare le dipendenze temporali nei segnali fisiologici. Entrambi i modelli utilizzano finestre temporali di 4 ore per prevedere lo stato clinico del paziente. Le prestazioni - condotte attraverso metriche standard come accuracy, precision, recall, F1-score, AUROC e PR AUC - hanno dimostrato che i modelli HMM e LSTM hanno capacità predittive comparabili. Lo studio dimostra quindi il potenziale dei metodi machine learning su dati di terapia intensiva per il rilevamento della progressione della sepsi.
Hidden Markov model and long short-term memory models on sequential, routinely collected data for prediction of therapy response in septic patients
Volterra, Camilla
2023/2024
Abstract
Sepsis is a life-threatening condition characterized by a dysregulated immune response to infection, leading to organ dysfunction and high mortality rates. A predictive model can be useful to treat this condition by anticipating its deterioration. Hidden Markov Models (HMM) and Long Short-Term Memory (LSTM) neural networks were developed to analyze routinely collected ICU data and anticipate patient deterioration. The study is structured into key phases: data preprocessing, feature selection, model training, and evaluation. Data from the HiRID dataset, a high-resolution ICU database, is utilized. A relatively uniform group of patients – i.e. septic patients, admitted to ICU for a minimum of two days, to exclude patients with less severe conditions – represents the cohort of this thesis. A critical step involves defining a labeling procedure based on clinical indicators (qSOFA, MAP levels, lactate levels, vasopressor administration) allowing for patient stratification into different severity levels. The HMM approach models patient state transitions over time, incorporating historical clinical trajectories to estimate hidden disease states and predict deterioration or recovery. The LSTM model, in contrast, processes sequential patient data, leveraging deep learning techniques to identify temporal dependencies in physiological signals. Both models utilize 4-hour time windows to forecast the patient's clinical status. The performances - conducted through key metrics such as accuracy, precision, recall, F1-score, AUROC, and PR AUC - proved HMM and LSTM to have comparable predictive capabilities. The study demonstrates, the potential of machine learning on ICU data for the detection of sepsis progression.File | Dimensione | Formato | |
---|---|---|---|
2025_04_Volterra.pdf
non accessibile
Descrizione: Tesi
Dimensione
2.5 MB
Formato
Adobe PDF
|
2.5 MB | Adobe PDF | Visualizza/Apri |
2025_04_Volterra_Executive Summary.pdf
non accessibile
Descrizione: Executive Summary
Dimensione
475.32 kB
Formato
Adobe PDF
|
475.32 kB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/235340