Clinical administrative databases play an increasingly essential role in medical research to get real-world evidence. Their exploration is particularly relevant for a better investigation of chronic diseases, for which the standard Clinical Randomised Trials are not suitable. In order to deal with big data, such as clinical administrative databases, novel flexible statistical models and methods are required. In particular, since classical parametric assumptions difficultly hold, nonparametric statistical models should be investigated. Led by these observations, the main goal of this PhD thesis consists in providing novel contributions in the statistical framework of survival analysis. Specifically, we elaborate a Cox model with a nonparametric discrete frailty that is suitable for studying hierarchical time-to-event data. In fact, clinical records are often collected in a grouped form (i.e., patients in hospitals or hospitals in regions) and this fact can affect the readmission, discharge or even survival process of patients. We pursue the aim of properly modelling this effect and provide an in-built probabilistic clustering for detecting, if present, clusters of groups (i.e., clusters of hospitals). Then, we exploit Functional Data Analysis techniques for modelling the effect of time-dependent covariates on patients’ survival. Finally, we take advantage of multi-state models framework for identifying risk factors on patients' complete healthcare processes and we identify a pattern of clustering structures (i.e., clusters of providers in readmission, in discharge and in survival transitions). We take advantage of the previously mentioned models to get deeper insights of Heart Failure condition in order to help both clinicians and healthcare managers. Heart Failure is a chronic disease wide spread in the world, characterised by high risk of recurrent hospitalisations and death. It has been named as the cardiological pandemic of this century, so a great effort is being put for studying this syndrome. In this work, we analyse two clinical administrative databases, that are collected at regional level, in Lombardia Region and in Friuli Venezia Giulia Region respectively. These two databases differ both on cohort selection (due to multiple categories of Heart Failure) and on covariates selection. In particular, Lombardia Region database is characterised by a not negligible hierarchical structure (more than a hundred providers are involved for data collection), while Friuli Venezia Giulia database is characterised by a relevant outpatient care structure and the availability of laboratory tests results (i.e., glycosylated haemoglobin and creatinine). To conclude, pharmacological treatment information are also recorded in Friuli, based on patients drug purchase. We propose a novel index to investigate the impact of multi-therapy adherence on patients survival. The obtained results are promising and a further reflection is required for better understanding the discrepancy between the estimate drug assumption and the European Society of Cardiology guidelines.

Nell'ambito della ricerca clinica, i database amministrativi di tipo clinico sono sempre più frequentemente oggetto di studio, al fine di ottenere evidenze dal mondo reale. Lo studio di questo tipo di dati è di particolare rilievo nell' investigazione di malattie croniche, per cui i classici esperimenti clinici randomizzati risultano essere poco adatti. Per gestire grandi moli di dati, quali i database amministrativi clinici, nuovi modelli e metodi statistici, sufficientemente flessibili, sono necessari. In particolare, considerando che assunzioni di tipo parametrico difficilmente valgono, o possono essere validate, è appropriato focalizzarsi su modelli statistici di tipo non parametrico. Sulla base di queste osservazioni, l'obiettivo principale di questa tesi di dottorato consiste nel proporre contributi innovativi nell'ambito dell’analisi di sopravvivenza. Specificatamente, abbiamo elaborato un modello di Cox con una frailty discreta non parametrica, che risulta essere particolarmente appropriata nello studio di dati di tipo tempo all'evento, che presentano una struttura gerarchica. Questo tipo di dato è particolarmente frequente in ambito clinico, basti pensare a pazienti ricoverati in ospedale, che a loro volta si collocano in determinate aree urbane. In queste situazioni, è di fondamentale importanza tenere in considerazione l'effetto di raggruppamento dato che i fattori di raggruppamento possono influenzare le dinamiche di ammissione/dimissione/decesso del paziente. Il nostro obiettivo consiste nella modellazione di questo effetto in maniera appropriata e fornire al tempo stesso una tecnica di clustering probabilistico per individuare, se presenti, cluster fra i gruppi. Successivamente, ci siamo focalizzati su Analisi di Dati Funzionali per modellare l'effetto di covariate tempo-dipendenti sulla sopravvivenza del paziente quando sono presenti raggruppamenti di pazienti. Una caratteristica di pazienti cronici sono i ripetuti ricoveri sia in strutture ospedaliere che in strutture assistenziali. La seconda parte di questo lavoro di tesi si concentra quindi sulla modellazione del percorso clinico del paziente ed in particolare sull'investigazione dei fattori di rischio nelle diverse riammissioni/dimissioni. A tal scopo, abbiamo applicato modelli multi-stato e abbiamo proposto un'estensione dei questi modelli, includendo una frailty non parametrica sulle diverse transizioni. I modelli precedentemente menzionati sono stati applicati su due database amministrativi, raccolti a livello regionale, relativi a pazienti affetti da scompenso cardiaco con l’obiettivo di raggiungere una visione più approfondita e dettagliata della gestione del paziente al fine di aiutare sia i medici sia i man- ager ospedalieri. Lo scompenso cardiaco è una malattia molto grave e molto diffusa nel mondo, caratterizzata da un alto tasso di ospedalizzazioni e un alto rischio di decesso. Infatti, è stata definita la pandemia cardiologica di questo secolo ed un grande sforzo sta venendo impiegato per fare ricerca su questo tema. In questo lavoro, analizziamo due database amministrativi clinici, che sono raccolti a livello regionale, rispettivamente in Lombardia e in Friuli Venezia Giulia. Questi due database differiscono rispetto alla selezione della coorte (dovuta alle diverse categorie di scompenso contemplate) e rispetto alla selezione delle covariate. In particolare, il database di regione Lombardia è caratterizzato da una non trascurabile struttura gerarchica (più di cento ospedali sono registrati), mentre il database del Friuli Venezia Giulia è caratterizzato dalla registrazione di ricoveri in servizi sanitari assistenziali e di risultati di test di laboratorio (quali l'emoglobina glicata e la creatinina). In conclusione, nel database relativo al Friuli Venezia Giulia sono state raccolte informazioni relative ai trattamenti farmacologici del paziente, in particolare sono registrati gli acquisti per singolo paziente. All'interno di questo lavoro di tesi, proponiamo un nuovo indice per tenere propriamente in considerazione l’impatto dell’aderenza alla poli-terapia sulla sopravvivenza del paziente. I risultati ottenuti sono promettenti, ma sono necessarie ulteriori investigazioni per comprendere meglio la discrepanza fra l'assunzione effettiva di farmaci e le linee guida fornite dalla European Society of Cardiology.

Parametric and nonparametric frailty survival models for exploring unobserved heterogeneity and profiling Heart Failure patients through administrative databases

GASPERONI, FRANCESCA

Abstract

Clinical administrative databases play an increasingly essential role in medical research to get real-world evidence. Their exploration is particularly relevant for a better investigation of chronic diseases, for which the standard Clinical Randomised Trials are not suitable. In order to deal with big data, such as clinical administrative databases, novel flexible statistical models and methods are required. In particular, since classical parametric assumptions difficultly hold, nonparametric statistical models should be investigated. Led by these observations, the main goal of this PhD thesis consists in providing novel contributions in the statistical framework of survival analysis. Specifically, we elaborate a Cox model with a nonparametric discrete frailty that is suitable for studying hierarchical time-to-event data. In fact, clinical records are often collected in a grouped form (i.e., patients in hospitals or hospitals in regions) and this fact can affect the readmission, discharge or even survival process of patients. We pursue the aim of properly modelling this effect and provide an in-built probabilistic clustering for detecting, if present, clusters of groups (i.e., clusters of hospitals). Then, we exploit Functional Data Analysis techniques for modelling the effect of time-dependent covariates on patients’ survival. Finally, we take advantage of multi-state models framework for identifying risk factors on patients' complete healthcare processes and we identify a pattern of clustering structures (i.e., clusters of providers in readmission, in discharge and in survival transitions). We take advantage of the previously mentioned models to get deeper insights of Heart Failure condition in order to help both clinicians and healthcare managers. Heart Failure is a chronic disease wide spread in the world, characterised by high risk of recurrent hospitalisations and death. It has been named as the cardiological pandemic of this century, so a great effort is being put for studying this syndrome. In this work, we analyse two clinical administrative databases, that are collected at regional level, in Lombardia Region and in Friuli Venezia Giulia Region respectively. These two databases differ both on cohort selection (due to multiple categories of Heart Failure) and on covariates selection. In particular, Lombardia Region database is characterised by a not negligible hierarchical structure (more than a hundred providers are involved for data collection), while Friuli Venezia Giulia database is characterised by a relevant outpatient care structure and the availability of laboratory tests results (i.e., glycosylated haemoglobin and creatinine). To conclude, pharmacological treatment information are also recorded in Friuli, based on patients drug purchase. We propose a novel index to investigate the impact of multi-therapy adherence on patients survival. The obtained results are promising and a further reflection is required for better understanding the discrepancy between the estimate drug assumption and the European Society of Cardiology guidelines.
SABADINI, IRENE MARIA
SABADINI, IRENE MARIA
IEVA, FRANCESCA
26-feb-2019
Nell'ambito della ricerca clinica, i database amministrativi di tipo clinico sono sempre più frequentemente oggetto di studio, al fine di ottenere evidenze dal mondo reale. Lo studio di questo tipo di dati è di particolare rilievo nell' investigazione di malattie croniche, per cui i classici esperimenti clinici randomizzati risultano essere poco adatti. Per gestire grandi moli di dati, quali i database amministrativi clinici, nuovi modelli e metodi statistici, sufficientemente flessibili, sono necessari. In particolare, considerando che assunzioni di tipo parametrico difficilmente valgono, o possono essere validate, è appropriato focalizzarsi su modelli statistici di tipo non parametrico. Sulla base di queste osservazioni, l'obiettivo principale di questa tesi di dottorato consiste nel proporre contributi innovativi nell'ambito dell’analisi di sopravvivenza. Specificatamente, abbiamo elaborato un modello di Cox con una frailty discreta non parametrica, che risulta essere particolarmente appropriata nello studio di dati di tipo tempo all'evento, che presentano una struttura gerarchica. Questo tipo di dato è particolarmente frequente in ambito clinico, basti pensare a pazienti ricoverati in ospedale, che a loro volta si collocano in determinate aree urbane. In queste situazioni, è di fondamentale importanza tenere in considerazione l'effetto di raggruppamento dato che i fattori di raggruppamento possono influenzare le dinamiche di ammissione/dimissione/decesso del paziente. Il nostro obiettivo consiste nella modellazione di questo effetto in maniera appropriata e fornire al tempo stesso una tecnica di clustering probabilistico per individuare, se presenti, cluster fra i gruppi. Successivamente, ci siamo focalizzati su Analisi di Dati Funzionali per modellare l'effetto di covariate tempo-dipendenti sulla sopravvivenza del paziente quando sono presenti raggruppamenti di pazienti. Una caratteristica di pazienti cronici sono i ripetuti ricoveri sia in strutture ospedaliere che in strutture assistenziali. La seconda parte di questo lavoro di tesi si concentra quindi sulla modellazione del percorso clinico del paziente ed in particolare sull'investigazione dei fattori di rischio nelle diverse riammissioni/dimissioni. A tal scopo, abbiamo applicato modelli multi-stato e abbiamo proposto un'estensione dei questi modelli, includendo una frailty non parametrica sulle diverse transizioni. I modelli precedentemente menzionati sono stati applicati su due database amministrativi, raccolti a livello regionale, relativi a pazienti affetti da scompenso cardiaco con l’obiettivo di raggiungere una visione più approfondita e dettagliata della gestione del paziente al fine di aiutare sia i medici sia i man- ager ospedalieri. Lo scompenso cardiaco è una malattia molto grave e molto diffusa nel mondo, caratterizzata da un alto tasso di ospedalizzazioni e un alto rischio di decesso. Infatti, è stata definita la pandemia cardiologica di questo secolo ed un grande sforzo sta venendo impiegato per fare ricerca su questo tema. In questo lavoro, analizziamo due database amministrativi clinici, che sono raccolti a livello regionale, rispettivamente in Lombardia e in Friuli Venezia Giulia. Questi due database differiscono rispetto alla selezione della coorte (dovuta alle diverse categorie di scompenso contemplate) e rispetto alla selezione delle covariate. In particolare, il database di regione Lombardia è caratterizzato da una non trascurabile struttura gerarchica (più di cento ospedali sono registrati), mentre il database del Friuli Venezia Giulia è caratterizzato dalla registrazione di ricoveri in servizi sanitari assistenziali e di risultati di test di laboratorio (quali l'emoglobina glicata e la creatinina). In conclusione, nel database relativo al Friuli Venezia Giulia sono state raccolte informazioni relative ai trattamenti farmacologici del paziente, in particolare sono registrati gli acquisti per singolo paziente. All'interno di questo lavoro di tesi, proponiamo un nuovo indice per tenere propriamente in considerazione l’impatto dell’aderenza alla poli-terapia sulla sopravvivenza del paziente. I risultati ottenuti sono promettenti, ma sono necessarie ulteriori investigazioni per comprendere meglio la discrepanza fra l'assunzione effettiva di farmaci e le linee guida fornite dalla European Society of Cardiology.
Tesi di dottorato
File allegati
File Dimensione Formato  
Gasperoni_PhD_thesis_v2.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Testi della tesi
Dimensione 6.01 MB
Formato Adobe PDF
6.01 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/145700