We introduce a new parametric approach for clustering multilevel survival data that accounts for the heterogeneity at baseline and local distributions of the explanatory variables. The proposed method aims to identify clusters of patients with different survival patterns and uncover the impact of the known hierarchy on the survival hazard within each cluster. This methodology can be seen as a generalization of multilevel cluster-weighted modeling for time-to-event outcomes. The objective function is maximized using a stochastic EM algorithm tailored to right-censored lifetime data. The method is motivated by a study about the unraveling of the diverse dynamics of survival times concerning a cohort of patients affected by heart failure that have been hospitalized for COVID-19. We identify latent clusters representing heterogeneous patient profiles, exploiting the hospital hierarchy to understand the effect of the admittance facility. Moreover, the impact of respiratory diseases is included as covariate to model the survival function. Our model provides a new tool in the literature of model-based clustering of hierarchical data, being able to produce a deep and more informed analysis of the hazard risk, and in particular its stratification on the different levels.
Introduciamo un nuovo approccio parametrico per il clustering di dati survival a più livelli, tenendo conto dell'eterogeneità iniziale e delle distribuzioni locali delle variabili esplicative. Il metodo proposto mira a identificare cluster di pazienti con diversi pattern di sopravvivenza e a scoprire l'impatto della gerarchia nota sul rischio di morte all'interno di ciascun cluster. Questa metodologia può essere vista come una generalizzazione della modellazione a cluster a più livelli per dati di tempo all'evento. La funzione obiettivo viene massimizzata utilizzando un algoritmo EM stocastico adattato a dati survival censurati. La metodologia è motivata da uno studio sulle diverse dinamiche di sopravvivenza riguardante una coorte di pazienti affetti da insufficienza cardiaca ricoverati per COVID-19. Riusciamo a identificare cluster latenti che rappresentano profili eterogenei di pazienti, sfruttando la gerarchia ospedaliera per comprendere l'effetto della struttura di ammissione. Inoltre, l'impatto di alcune malattie respiratorie viene incluso come covariata per modellare la funzione di sopravvivenza. Il nostro modello fornisce un nuovo strumento che si inserisce nella letteratura sul model-based clustering di dati gerarchici, essendo in grado di produrre una analisi sul rischio di morte più accurata e precisa, concentrandosi in particolare sulla sua stratificazione nei diversi livelli.
Model-based clustering of lifetime data with frailties and random covariates for the profiling of COVID-19 heart failure patients
ANGIOLINI, LORENZO
2022/2023
Abstract
We introduce a new parametric approach for clustering multilevel survival data that accounts for the heterogeneity at baseline and local distributions of the explanatory variables. The proposed method aims to identify clusters of patients with different survival patterns and uncover the impact of the known hierarchy on the survival hazard within each cluster. This methodology can be seen as a generalization of multilevel cluster-weighted modeling for time-to-event outcomes. The objective function is maximized using a stochastic EM algorithm tailored to right-censored lifetime data. The method is motivated by a study about the unraveling of the diverse dynamics of survival times concerning a cohort of patients affected by heart failure that have been hospitalized for COVID-19. We identify latent clusters representing heterogeneous patient profiles, exploiting the hospital hierarchy to understand the effect of the admittance facility. Moreover, the impact of respiratory diseases is included as covariate to model the survival function. Our model provides a new tool in the literature of model-based clustering of hierarchical data, being able to produce a deep and more informed analysis of the hazard risk, and in particular its stratification on the different levels.File | Dimensione | Formato | |
---|---|---|---|
2023_12_Angiolini_Tesi_01.pdf
Open Access dal 24/11/2024
Descrizione: Tesi in formato articolo
Dimensione
8.75 MB
Formato
Adobe PDF
|
8.75 MB | Adobe PDF | Visualizza/Apri |
2023_12_Angiolini_Executive Summary_02.pdf
Open Access dal 24/11/2024
Descrizione: Executive Summary
Dimensione
3.79 MB
Formato
Adobe PDF
|
3.79 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/215133