We introduce a new parametric approach for clustering multilevel survival data that accounts for the heterogeneity at baseline and local distributions of the explanatory variables. The proposed method aims to identify clusters of patients with different survival patterns and uncover the impact of the known hierarchy on the survival hazard within each cluster. This methodology can be seen as a generalization of multilevel cluster-weighted modeling for time-to-event outcomes. The objective function is maximized using a stochastic EM algorithm tailored to right-censored lifetime data. The method is motivated by a study about the unraveling of the diverse dynamics of survival times concerning a cohort of patients affected by heart failure that have been hospitalized for COVID-19. We identify latent clusters representing heterogeneous patient profiles, exploiting the hospital hierarchy to understand the effect of the admittance facility. Moreover, the impact of respiratory diseases is included as covariate to model the survival function. Our model provides a new tool in the literature of model-based clustering of hierarchical data, being able to produce a deep and more informed analysis of the hazard risk, and in particular its stratification on the different levels.

Introduciamo un nuovo approccio parametrico per il clustering di dati survival a più livelli, tenendo conto dell'eterogeneità iniziale e delle distribuzioni locali delle variabili esplicative. Il metodo proposto mira a identificare cluster di pazienti con diversi pattern di sopravvivenza e a scoprire l'impatto della gerarchia nota sul rischio di morte all'interno di ciascun cluster. Questa metodologia può essere vista come una generalizzazione della modellazione a cluster a più livelli per dati di tempo all'evento. La funzione obiettivo viene massimizzata utilizzando un algoritmo EM stocastico adattato a dati survival censurati. La metodologia è motivata da uno studio sulle diverse dinamiche di sopravvivenza riguardante una coorte di pazienti affetti da insufficienza cardiaca ricoverati per COVID-19. Riusciamo a identificare cluster latenti che rappresentano profili eterogenei di pazienti, sfruttando la gerarchia ospedaliera per comprendere l'effetto della struttura di ammissione. Inoltre, l'impatto di alcune malattie respiratorie viene incluso come covariata per modellare la funzione di sopravvivenza. Il nostro modello fornisce un nuovo strumento che si inserisce nella letteratura sul model-based clustering di dati gerarchici, essendo in grado di produrre una analisi sul rischio di morte più accurata e precisa, concentrandosi in particolare sulla sua stratificazione nei diversi livelli.

Model-based clustering of lifetime data with frailties and random covariates for the profiling of COVID-19 heart failure patients

ANGIOLINI, LORENZO
2022/2023

Abstract

We introduce a new parametric approach for clustering multilevel survival data that accounts for the heterogeneity at baseline and local distributions of the explanatory variables. The proposed method aims to identify clusters of patients with different survival patterns and uncover the impact of the known hierarchy on the survival hazard within each cluster. This methodology can be seen as a generalization of multilevel cluster-weighted modeling for time-to-event outcomes. The objective function is maximized using a stochastic EM algorithm tailored to right-censored lifetime data. The method is motivated by a study about the unraveling of the diverse dynamics of survival times concerning a cohort of patients affected by heart failure that have been hospitalized for COVID-19. We identify latent clusters representing heterogeneous patient profiles, exploiting the hospital hierarchy to understand the effect of the admittance facility. Moreover, the impact of respiratory diseases is included as covariate to model the survival function. Our model provides a new tool in the literature of model-based clustering of hierarchical data, being able to produce a deep and more informed analysis of the hazard risk, and in particular its stratification on the different levels.
CAPPOZZO, ANDREA
MASCI, CHIARA
ING - Scuola di Ingegneria Industriale e dell'Informazione
19-dic-2023
2022/2023
Introduciamo un nuovo approccio parametrico per il clustering di dati survival a più livelli, tenendo conto dell'eterogeneità iniziale e delle distribuzioni locali delle variabili esplicative. Il metodo proposto mira a identificare cluster di pazienti con diversi pattern di sopravvivenza e a scoprire l'impatto della gerarchia nota sul rischio di morte all'interno di ciascun cluster. Questa metodologia può essere vista come una generalizzazione della modellazione a cluster a più livelli per dati di tempo all'evento. La funzione obiettivo viene massimizzata utilizzando un algoritmo EM stocastico adattato a dati survival censurati. La metodologia è motivata da uno studio sulle diverse dinamiche di sopravvivenza riguardante una coorte di pazienti affetti da insufficienza cardiaca ricoverati per COVID-19. Riusciamo a identificare cluster latenti che rappresentano profili eterogenei di pazienti, sfruttando la gerarchia ospedaliera per comprendere l'effetto della struttura di ammissione. Inoltre, l'impatto di alcune malattie respiratorie viene incluso come covariata per modellare la funzione di sopravvivenza. Il nostro modello fornisce un nuovo strumento che si inserisce nella letteratura sul model-based clustering di dati gerarchici, essendo in grado di produrre una analisi sul rischio di morte più accurata e precisa, concentrandosi in particolare sulla sua stratificazione nei diversi livelli.
File allegati
File Dimensione Formato  
2023_12_Angiolini_Tesi_01.pdf

Open Access dal 24/11/2024

Descrizione: Tesi in formato articolo
Dimensione 8.75 MB
Formato Adobe PDF
8.75 MB Adobe PDF Visualizza/Apri
2023_12_Angiolini_Executive Summary_02.pdf

Open Access dal 24/11/2024

Descrizione: Executive Summary
Dimensione 3.79 MB
Formato Adobe PDF
3.79 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/215133