This work deals with the problem of predicting readmissions in Heart Failure patients. The aim is to highlight which factors may be helpful in the prediction process. The use of different statistical methods allows to gain a multiple perspective. However, the real innovation of this work lies in the comparison of two different countries. The available data, indeed, come from administrative databases of Lombardia, an Italian region, and of England, a country of United Kingdom. Each dataset contains in detail demographics, administrative and clinical information, which constitute the history of the patient and, furthermore, the covariates. Using the free available software R, we have implemented three different models: a Logistic Regression for both first and second readmission within 30 days; Hurdle and Zero-Inflated models for the total number of readmissions per patient within a year and, finally, two Multi-State models, that shape the process of admission-discharge-death. For each model chosen, we have adjusted in the right way the structure of the dataset. From our analysis interesting results come out: few common comorbidities increase the probability of readmission for Heart Failure in both the dataset (renal, arrhythmia, pulmonarydz and hypertension), while others have a different impact depending on the country (compdiabetes and pulmcirc are influential only in Lombardia, while alcohol, tumor, dementia and pvd only in England). The procedures are relevant in different way in both the countries, and they also are influenced by the timing in which considering a readmission. About the implementation, we can assert that the use of different models allows a good balance between computational costs and completeness in describing the scenario, highlighting various features. Logistic regression and Hurdle/Zero-inflated models, indeed, are easy to implement but they don't have a wide perspective of the clinical history of the patient. Multi-State models catch in the best way the process and the impact of covariates on transitions, but present computational limitations.

Questo lavoro tratta il problema di predire le riospedalizzazioni di pazienti affetti da Scompenso Cardiaco. Lo scopo e' cercare di evidenziare quali possano essere i fattori che aiutino nel processo di previsione. L'utilizzo di diversi metodi statistici permette di affrontare il problema da piu' punti di vista. Tuttavia, la vera innovazione portata da questo lavoro risiede nella comparazione di due differenti stati. I dati disponibili, infatti, provengono da database amministrativi della Lombardia, una regione italiana, e dell'Inghilterra, una nazione del Regno Unito. Ogni dataset contiene dettagliate informazioni di tipo demografico, amministrativo e clinico, le quali costituiscono la storia clinica del paziente e, inoltre, le covariate di interesse. Grazie all'uso del R, sono stati implementati tre modelli differenti: un regressione logistica sia per la prima che per la seconda riospedalizzazione entro 30 giorni; i modelli Hurdle e Zero-Inflated, che tengono conto del numero totale di riammissioni in un anno; infine, i modelli Multi-Stato, che modellano l'intero processo di ammissione-dimissione-morte. La struttura del dataset e' stata di volta in volta adattata al modello scelto. Dalle analisi eseguite, emergono interessanti risultati: alcune patologie accrescono la probabilita' di riammissione per Scompenso Cardiaco in entrambi i dataset (renal, arrhythmia, pulmonarydz and hypertension), mentre altre diversificano il loro impatto a seconda del paese (compdiabetes e pulmcirc sono rilevanti solo in Lombardia, mentre alcohol, tumor, dementia e pvd solo in Inghilterra). Le procedure mediche, pur differentemente, in entrambi i paesi hanno un'importante impatto, che cambia anche a seconda dell'orizzonte temporale considerato. Per quanto riguarda l'aspetto implementativo, possiamo asserire che l'uso di diversi modelli consente un buon bilanciamento tra i costi computazionali e la completezza nella descrizione dello scenario. La regressione logistica e i modelli di conteggio, ad esempio, sono facilmente implementabili, ma non consentono una visione dettagliata della storia clinica del paziente. I modelli Multi-Stato, invece, sono ottimi nel catturare l'intero processo e l'impatto delle covariate sulle singole transizioni, ma presentano forti limitazioni computazionali, non consentendo di inserire tutte le covariate di interesse come predittori.

Models for predicting readmissions in heart failure patients : a comparison between Lombardia and England

VENTURA, CHIARA MARIA
2013/2014

Abstract

This work deals with the problem of predicting readmissions in Heart Failure patients. The aim is to highlight which factors may be helpful in the prediction process. The use of different statistical methods allows to gain a multiple perspective. However, the real innovation of this work lies in the comparison of two different countries. The available data, indeed, come from administrative databases of Lombardia, an Italian region, and of England, a country of United Kingdom. Each dataset contains in detail demographics, administrative and clinical information, which constitute the history of the patient and, furthermore, the covariates. Using the free available software R, we have implemented three different models: a Logistic Regression for both first and second readmission within 30 days; Hurdle and Zero-Inflated models for the total number of readmissions per patient within a year and, finally, two Multi-State models, that shape the process of admission-discharge-death. For each model chosen, we have adjusted in the right way the structure of the dataset. From our analysis interesting results come out: few common comorbidities increase the probability of readmission for Heart Failure in both the dataset (renal, arrhythmia, pulmonarydz and hypertension), while others have a different impact depending on the country (compdiabetes and pulmcirc are influential only in Lombardia, while alcohol, tumor, dementia and pvd only in England). The procedures are relevant in different way in both the countries, and they also are influenced by the timing in which considering a readmission. About the implementation, we can assert that the use of different models allows a good balance between computational costs and completeness in describing the scenario, highlighting various features. Logistic regression and Hurdle/Zero-inflated models, indeed, are easy to implement but they don't have a wide perspective of the clinical history of the patient. Multi-State models catch in the best way the process and the impact of covariates on transitions, but present computational limitations.
BOTTLE, ALEX
IEVA, FRANCESCA
ING - Scuola di Ingegneria Industriale e dell'Informazione
29-apr-2015
2013/2014
Questo lavoro tratta il problema di predire le riospedalizzazioni di pazienti affetti da Scompenso Cardiaco. Lo scopo e' cercare di evidenziare quali possano essere i fattori che aiutino nel processo di previsione. L'utilizzo di diversi metodi statistici permette di affrontare il problema da piu' punti di vista. Tuttavia, la vera innovazione portata da questo lavoro risiede nella comparazione di due differenti stati. I dati disponibili, infatti, provengono da database amministrativi della Lombardia, una regione italiana, e dell'Inghilterra, una nazione del Regno Unito. Ogni dataset contiene dettagliate informazioni di tipo demografico, amministrativo e clinico, le quali costituiscono la storia clinica del paziente e, inoltre, le covariate di interesse. Grazie all'uso del R, sono stati implementati tre modelli differenti: un regressione logistica sia per la prima che per la seconda riospedalizzazione entro 30 giorni; i modelli Hurdle e Zero-Inflated, che tengono conto del numero totale di riammissioni in un anno; infine, i modelli Multi-Stato, che modellano l'intero processo di ammissione-dimissione-morte. La struttura del dataset e' stata di volta in volta adattata al modello scelto. Dalle analisi eseguite, emergono interessanti risultati: alcune patologie accrescono la probabilita' di riammissione per Scompenso Cardiaco in entrambi i dataset (renal, arrhythmia, pulmonarydz and hypertension), mentre altre diversificano il loro impatto a seconda del paese (compdiabetes e pulmcirc sono rilevanti solo in Lombardia, mentre alcohol, tumor, dementia e pvd solo in Inghilterra). Le procedure mediche, pur differentemente, in entrambi i paesi hanno un'importante impatto, che cambia anche a seconda dell'orizzonte temporale considerato. Per quanto riguarda l'aspetto implementativo, possiamo asserire che l'uso di diversi modelli consente un buon bilanciamento tra i costi computazionali e la completezza nella descrizione dello scenario. La regressione logistica e i modelli di conteggio, ad esempio, sono facilmente implementabili, ma non consentono una visione dettagliata della storia clinica del paziente. I modelli Multi-Stato, invece, sono ottimi nel catturare l'intero processo e l'impatto delle covariate sulle singole transizioni, ma presentano forti limitazioni computazionali, non consentendo di inserire tutte le covariate di interesse come predittori.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
CM_VENTURA_TESI.pdf

accessibile in internet per tutti

Descrizione: Thesis text
Dimensione 3.16 MB
Formato Adobe PDF
3.16 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/107021