Model-based clustering of lifetime data with frailties and random covariates for the profiling of COVID-19 heart failure patients

Biblioteche e Archivi
POLITesi - Archivio digitale delle tesi di laurea e di dottorato

We introduce a new parametric approach for clustering multilevel survival data that accounts for the heterogeneity at baseline and local distributions of the explanatory variables. The proposed method aims to identify clusters of patients with different survival patterns and uncover the impact of the known hierarchy on the survival hazard within each cluster. This methodology can be seen as a generalization of multilevel cluster-weighted modeling for time-to-event outcomes. The objective function is maximized using a stochastic EM algorithm tailored to right-censored lifetime data. The method is motivated by a study about the unraveling of the diverse dynamics of survival times concerning a cohort of patients affected by heart failure that have been hospitalized for COVID-19. We identify latent clusters representing heterogeneous patient profiles, exploiting the hospital hierarchy to understand the effect of the admittance facility. Moreover, the impact of respiratory diseases is included as covariate to model the survival function. Our model provides a new tool in the literature of model-based clustering of hierarchical data, being able to produce a deep and more informed analysis of the hazard risk, and in particular its stratification on the different levels.

Introduciamo un nuovo approccio parametrico per il clustering di dati survival a più livelli, tenendo conto dell'eterogeneità iniziale e delle distribuzioni locali delle variabili esplicative. Il metodo proposto mira a identificare cluster di pazienti con diversi pattern di sopravvivenza e a scoprire l'impatto della gerarchia nota sul rischio di morte all'interno di ciascun cluster. Questa metodologia può essere vista come una generalizzazione della modellazione a cluster a più livelli per dati di tempo all'evento. La funzione obiettivo viene massimizzata utilizzando un algoritmo EM stocastico adattato a dati survival censurati. La metodologia è motivata da uno studio sulle diverse dinamiche di sopravvivenza riguardante una coorte di pazienti affetti da insufficienza cardiaca ricoverati per COVID-19. Riusciamo a identificare cluster latenti che rappresentano profili eterogenei di pazienti, sfruttando la gerarchia ospedaliera per comprendere l'effetto della struttura di ammissione. Inoltre, l'impatto di alcune malattie respiratorie viene incluso come covariata per modellare la funzione di sopravvivenza. Il nostro modello fornisce un nuovo strumento che si inserisce nella letteratura sul model-based clustering di dati gerarchici, essendo in grado di produrre una analisi sul rischio di morte più accurata e precisa, concentrandosi in particolare sulla sua stratificazione nei diversi livelli.

Model-based clustering of lifetime data with frailties and random covariates for the profiling of COVID-19 heart failure patients

ANGIOLINI, LORENZO

2022/2023

Abstract

We introduce a new parametric approach for clustering multilevel survival data that accounts for the heterogeneity at baseline and local distributions of the explanatory variables. The proposed method aims to identify clusters of patients with different survival patterns and uncover the impact of the known hierarchy on the survival hazard within each cluster. This methodology can be seen as a generalization of multilevel cluster-weighted modeling for time-to-event outcomes. The objective function is maximized using a stochastic EM algorithm tailored to right-censored lifetime data. The method is motivated by a study about the unraveling of the diverse dynamics of survival times concerning a cohort of patients affected by heart failure that have been hospitalized for COVID-19. We identify latent clusters representing heterogeneous patient profiles, exploiting the hospital hierarchy to understand the effect of the admittance facility. Moreover, the impact of respiratory diseases is included as covariate to model the survival function. Our model provides a new tool in the literature of model-based clustering of hierarchical data, being able to produce a deep and more informed analysis of the hazard risk, and in particular its stratification on the different levels.

Scheda breve

Scheda completa

	Relatore
	
				IEVA, FRANCESCA
			
	Correlatore/i
	
				CAPPOZZO, ANDREA
MASCI, CHIARA
			
	Scuola / Dip.
	
				ING  - Scuola di Ingegneria Industriale e dell'Informazione
			
	Data
	
				19-dic-2023
			
	Anno accademico
	
				2022/2023
			
	Abstract in italiano
	
				Introduciamo un nuovo approccio parametrico per il clustering di dati survival a più livelli, tenendo conto dell'eterogeneità iniziale e delle distribuzioni locali delle variabili esplicative. Il metodo proposto mira a identificare cluster di pazienti con diversi pattern di sopravvivenza e a scoprire l'impatto della gerarchia nota sul rischio di morte all'interno di ciascun cluster. Questa metodologia può essere vista come una generalizzazione della modellazione a cluster a più livelli per dati di tempo all'evento. La funzione obiettivo viene massimizzata utilizzando un algoritmo EM stocastico adattato a dati survival censurati. La metodologia è motivata da uno studio sulle diverse dinamiche di sopravvivenza riguardante una coorte di pazienti affetti da insufficienza cardiaca ricoverati per COVID-19. Riusciamo a identificare cluster latenti che rappresentano profili eterogenei di pazienti, sfruttando la gerarchia ospedaliera per comprendere l'effetto della struttura di ammissione. Inoltre, l'impatto di alcune malattie respiratorie viene incluso come covariata per modellare la funzione di sopravvivenza. Il nostro modello fornisce un nuovo strumento che si inserisce nella letteratura sul model-based clustering di dati gerarchici, essendo in grado di produrre una analisi sul rischio di morte più accurata e precisa, concentrandosi in particolare sulla sua stratificazione nei diversi livelli.
			
	Appare nelle tipologie:
	
				Tesi di laurea Magistrale

File allegati

File	Dimensione	Formato
2023_12_Angiolini_Tesi_01.pdf Open Access dal 24/11/2024 Descrizione: Tesi in formato articolo Dimensione 8.75 MB Formato Adobe PDF Visualizza/Apri	8.75 MB	Adobe PDF	Visualizza/Apri
2023_12_Angiolini_Executive Summary_02.pdf Open Access dal 24/11/2024 Descrizione: Executive Summary Dimensione 3.79 MB Formato Adobe PDF Visualizza/Apri	3.79 MB	Adobe PDF	Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/215133