We present a novel Multilevel Logistic Cluster Weighted Model (ML-CWM) designed for analyzing hierarchical data. This model offers two main innovations: it accommodates continuous, categorical, and dichotomous covariates with assumed interdependencies, and it effectively captures the dependencies among observations within the same cluster and grouping level. Our model finds its primary application within the medical field, where it excels in addressing the intricate complexities arising from hospital-specific effects and the existence of distinct patient subgroups characterized by unique attributes. To accurately estimate the model parameters, we propose an Expectation-Maximization algorithm. To evaluate its performance, we conduct a simulation study, comparing the capabilities of our model with an identical model that does not account for interdependencies between dichotomous variables. The outcomes demonstrate the superior ability of our model in accurately identifying latent clusters within the data. In addition, we use health administrative data to show the practical utility of our model in profiling and categorizing patients with heart failure and hospitalized for COVID-19 in the Lombardy Region. A scenario analysis emphasizes how the proposed methods can handle multiple sources of heterogeneities, arising from different patient profiles and hospitals, with respect to state of the art models, and can support health care providers and policy-makers.

Presentiamo un nuovo Multilevel Logistic Cluster Weighted Model (ML-CWM) progettato per l'analisi di dati gerarchici. Questo modello offre due innovazioni principali: accoglie covariate continue, categoriche e dicotomiche con interdipendenze ipotizzate e cattura efficacemente le dipendenze tra le osservazioni all'interno dello stesso cluster e livello di raggruppamento. Questo modello è principalmente destinato all'ambito medico, poiché è in grado di considerare la complessità legata agli effetti ospedalieri e ai diversi sottogruppi di pazienti con caratteristiche distinte. Per stimare con precisione i parametri del modello, proponiamo un algoritmo di Expectation-Maximization. Per valutare le sue performance, conduciamo uno studio di simulazione, confrontando le capacità del nostro modello con un modello identico che non tiene conto delle interdipendenze tra le variabili dicotomiche. I risultati dimostrano che il nostro modello è superiore nell'identificare accuratamente i cluster latenti. Inoltre, utilizziamo dati amministrativi sanitari per mostrare l'utilità pratica del nostro modello nel profilare e nel categorizzare i pazienti affetti da scompenso cardiaco e ricoverati per COVID-19 nella Regione Lombardia. Infine, un'analisi di scenario sottolinea come i metodi proposti siano in grado di gestire molteplici fonti di eterogeneità, derivanti da diversi profili di pazienti e ospedali, rispetto ai modelli attualmente in uso e possano supportare i fornitori di assistenza sanitaria e la stesura di alcune policy.

Multilevel logistic cluster-weighted model for profiling and clustering of heart failure patients in Lombardy region using administrative database

CALDERA, LUCA
2022/2023

Abstract

We present a novel Multilevel Logistic Cluster Weighted Model (ML-CWM) designed for analyzing hierarchical data. This model offers two main innovations: it accommodates continuous, categorical, and dichotomous covariates with assumed interdependencies, and it effectively captures the dependencies among observations within the same cluster and grouping level. Our model finds its primary application within the medical field, where it excels in addressing the intricate complexities arising from hospital-specific effects and the existence of distinct patient subgroups characterized by unique attributes. To accurately estimate the model parameters, we propose an Expectation-Maximization algorithm. To evaluate its performance, we conduct a simulation study, comparing the capabilities of our model with an identical model that does not account for interdependencies between dichotomous variables. The outcomes demonstrate the superior ability of our model in accurately identifying latent clusters within the data. In addition, we use health administrative data to show the practical utility of our model in profiling and categorizing patients with heart failure and hospitalized for COVID-19 in the Lombardy Region. A scenario analysis emphasizes how the proposed methods can handle multiple sources of heterogeneities, arising from different patient profiles and hospitals, with respect to state of the art models, and can support health care providers and policy-makers.
CAPPOZZO, ANDREA
ING - Scuola di Ingegneria Industriale e dell'Informazione
5-ott-2023
2022/2023
Presentiamo un nuovo Multilevel Logistic Cluster Weighted Model (ML-CWM) progettato per l'analisi di dati gerarchici. Questo modello offre due innovazioni principali: accoglie covariate continue, categoriche e dicotomiche con interdipendenze ipotizzate e cattura efficacemente le dipendenze tra le osservazioni all'interno dello stesso cluster e livello di raggruppamento. Questo modello è principalmente destinato all'ambito medico, poiché è in grado di considerare la complessità legata agli effetti ospedalieri e ai diversi sottogruppi di pazienti con caratteristiche distinte. Per stimare con precisione i parametri del modello, proponiamo un algoritmo di Expectation-Maximization. Per valutare le sue performance, conduciamo uno studio di simulazione, confrontando le capacità del nostro modello con un modello identico che non tiene conto delle interdipendenze tra le variabili dicotomiche. I risultati dimostrano che il nostro modello è superiore nell'identificare accuratamente i cluster latenti. Inoltre, utilizziamo dati amministrativi sanitari per mostrare l'utilità pratica del nostro modello nel profilare e nel categorizzare i pazienti affetti da scompenso cardiaco e ricoverati per COVID-19 nella Regione Lombardia. Infine, un'analisi di scenario sottolinea come i metodi proposti siano in grado di gestire molteplici fonti di eterogeneità, derivanti da diversi profili di pazienti e ospedali, rispetto ai modelli attualmente in uso e possano supportare i fornitori di assistenza sanitaria e la stesura di alcune policy.
File allegati
File Dimensione Formato  
2023_09_ES_Caldera.pdf

accessibile in internet per tutti a partire dal 13/09/2024

Descrizione: Executive Summary
Dimensione 914.06 kB
Formato Adobe PDF
914.06 kB Adobe PDF   Visualizza/Apri
2023_09_Caldera.pdf

accessibile in internet per tutti a partire dal 13/09/2024

Descrizione: Elaborato di tesi
Dimensione 3.34 MB
Formato Adobe PDF
3.34 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/210923