Nowadays, hospitals are facing the increasingly pressing need for an accurate prediction of re-hospitalizations. Re-hospitalizations, indeed, are considered as a proxy measure to care quality, since they are often related to premature discharge or improper treatment. Moreover, they represent a high financial burden on the hospital, since they require a vast deployment of hospital resources. For these reasons, studying re-hospitalization risk can have several positive consequences: a reduction of the number of re-hospitalizations and the related healthcare cost as well as an improvement of care quality. We applied a Process Mining - Deep Learning (PM-DL) approach for the prediction of re-hospitalization at San Raffaele Hospital (HSR) within 6 months from the baseline hospitalization in a Cardiology-related department. By using the databases of HSR, we obtained a final dataset of 4761 patients from Regione Lombardia hospitalized due to Cardio-related diseases in 2018 or 2019. The Patient Hospital Records (PHRs) were converted into event logs that were used to discover a process model. Time information related to the hospital events, in the form of Timed State Samples (TSSs), was extracted using the DREAM (Decay Replay Mining) algorithm. The TSSs obtained in the PM phase were then combined with more traditional features (demographics, laboratory results, baseline hospitalization features and past history features) and fed to a Neural Network, to predict 6-months re-hospitalization. Our proposed model yielded promising results. Its performance was evaluated in terms of the Area Under the Receiver Operating Curve (AUROC). The performance of the PM-DL model was then compared with traditional Machine Learning models (Logistic Regression and Random Forest) that did not use time as a variable, and showed a significant improvement over different metrics. This proved the importance of including time information in models for re-hospitalization prediction, opening new scenarios for the use of PM and DL in the healthcare domain, to improve hospital resource planning as well as care quality.

Oggigiorno gli ospedali stanno fronteggiando il bisogno sempre più pressante di un'accurata predizione delle riospedalizzazioni. Queste, infatti, sono considerate come una misura approssimativa della qualità di cura, in quanto spesso ricollegabili a dimissioni precoci o trattamenti errati. Inoltre, esse rappresentano un importante onere finanziario per l'ospedale, che vi deve investire risorse. Per tali ragioni, studiare il rischio di riospedalizzazione può avere molteplici conseguenze positive: dalla riduzione del numero di riospedalizzazioni e del relativo costo per l'ospedale, al miglioramento della qualità delle cure. Abbiamo applicato un metodo di Process Mining - Deep Learning (PM-DL) per la predizione della riospedalizzazione all'Ospedale San Raffaele (HSR) entro 6 mesi da quella considerata come baseline avvenuta in un reparto di Cardiologia o affine. Usando i database HSR, abbiamo ottenuto un dataset finale di 4761 pazienti di Regione Lombardia ospedalizzati a causa di patologie cardiache nel 2018 o 2019. I Patients Hospital Records (PHRs) sono stati convertiti in event logs, usati poi per indivuare un modello di processo. L'informazione temporale relativa agli eventi ospedalieri, nella forma di Timed State Samples (TSSs) è stata estratta usando l'algoritmo DREAM (Decay Replay Mining). I TSSs così ottenuti, insieme a variabili più tradizionali (demografiche, di laboratorio, relative all'ospedalizzazione baseline e alla storia passata), sono stati poi dati in pasto ad una rete neurale per predire la riospedalizzazione a 6 mesi. Il modello proposto ottiene risultati promettenti. La performance è stata valutata in termini di AUROC. Il modello è stato poi confrontato con modelli di Machine Leanring più tradizionali (Logistic Regression e Random Forest), che non tengono conto dell'informazione temporale, e ha mostrato un miglioramento significativo su diverse metriche. Questo ha dimostrato l'importanza di includere l'informazione temporale nei modelli per la predizione di riospedalizzazione, aprendo nuovi scenari per l'uso di PM e DL nel mondo della sanità, per migliorare la pianificazione ospedaliera e la qualità di cura.

A new approach to predict rehospitalization based on medical records : the Process Mining - Deep Learning method

Spizzi, Eleonora
2021/2022

Abstract

Nowadays, hospitals are facing the increasingly pressing need for an accurate prediction of re-hospitalizations. Re-hospitalizations, indeed, are considered as a proxy measure to care quality, since they are often related to premature discharge or improper treatment. Moreover, they represent a high financial burden on the hospital, since they require a vast deployment of hospital resources. For these reasons, studying re-hospitalization risk can have several positive consequences: a reduction of the number of re-hospitalizations and the related healthcare cost as well as an improvement of care quality. We applied a Process Mining - Deep Learning (PM-DL) approach for the prediction of re-hospitalization at San Raffaele Hospital (HSR) within 6 months from the baseline hospitalization in a Cardiology-related department. By using the databases of HSR, we obtained a final dataset of 4761 patients from Regione Lombardia hospitalized due to Cardio-related diseases in 2018 or 2019. The Patient Hospital Records (PHRs) were converted into event logs that were used to discover a process model. Time information related to the hospital events, in the form of Timed State Samples (TSSs), was extracted using the DREAM (Decay Replay Mining) algorithm. The TSSs obtained in the PM phase were then combined with more traditional features (demographics, laboratory results, baseline hospitalization features and past history features) and fed to a Neural Network, to predict 6-months re-hospitalization. Our proposed model yielded promising results. Its performance was evaluated in terms of the Area Under the Receiver Operating Curve (AUROC). The performance of the PM-DL model was then compared with traditional Machine Learning models (Logistic Regression and Random Forest) that did not use time as a variable, and showed a significant improvement over different metrics. This proved the importance of including time information in models for re-hospitalization prediction, opening new scenarios for the use of PM and DL in the healthcare domain, to improve hospital resource planning as well as care quality.
ESPOSTI, FEDERICO
QUADRARO, DAMIANO
ING - Scuola di Ingegneria Industriale e dell'Informazione
4-mag-2023
2021/2022
Oggigiorno gli ospedali stanno fronteggiando il bisogno sempre più pressante di un'accurata predizione delle riospedalizzazioni. Queste, infatti, sono considerate come una misura approssimativa della qualità di cura, in quanto spesso ricollegabili a dimissioni precoci o trattamenti errati. Inoltre, esse rappresentano un importante onere finanziario per l'ospedale, che vi deve investire risorse. Per tali ragioni, studiare il rischio di riospedalizzazione può avere molteplici conseguenze positive: dalla riduzione del numero di riospedalizzazioni e del relativo costo per l'ospedale, al miglioramento della qualità delle cure. Abbiamo applicato un metodo di Process Mining - Deep Learning (PM-DL) per la predizione della riospedalizzazione all'Ospedale San Raffaele (HSR) entro 6 mesi da quella considerata come baseline avvenuta in un reparto di Cardiologia o affine. Usando i database HSR, abbiamo ottenuto un dataset finale di 4761 pazienti di Regione Lombardia ospedalizzati a causa di patologie cardiache nel 2018 o 2019. I Patients Hospital Records (PHRs) sono stati convertiti in event logs, usati poi per indivuare un modello di processo. L'informazione temporale relativa agli eventi ospedalieri, nella forma di Timed State Samples (TSSs) è stata estratta usando l'algoritmo DREAM (Decay Replay Mining). I TSSs così ottenuti, insieme a variabili più tradizionali (demografiche, di laboratorio, relative all'ospedalizzazione baseline e alla storia passata), sono stati poi dati in pasto ad una rete neurale per predire la riospedalizzazione a 6 mesi. Il modello proposto ottiene risultati promettenti. La performance è stata valutata in termini di AUROC. Il modello è stato poi confrontato con modelli di Machine Leanring più tradizionali (Logistic Regression e Random Forest), che non tengono conto dell'informazione temporale, e ha mostrato un miglioramento significativo su diverse metriche. Questo ha dimostrato l'importanza di includere l'informazione temporale nei modelli per la predizione di riospedalizzazione, aprendo nuovi scenari per l'uso di PM e DL nel mondo della sanità, per migliorare la pianificazione ospedaliera e la qualità di cura.
File allegati
File Dimensione Formato  
2023_05_Spizzi.pdf

solo utenti autorizzati dal 17/04/2024

Descrizione: Thesis
Dimensione 3.63 MB
Formato Adobe PDF
3.63 MB Adobe PDF   Visualizza/Apri
2023_05_Spizzi_02.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Executive Summary
Dimensione 494.93 kB
Formato Adobe PDF
494.93 kB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/208554