Real-world data often contain grouping structures that, if improperly modelled, can lead to inaccurate assumptions about data dependencies and produce misleading results. Properly accounting for these structures improves model accuracy and provides insights that can inform policy decisions at the group level. This thesis aims to develop and apply novel models and methods for effectively handling grouped data with a particular focus on the fields of learning and healthcare analytics, where grouping typically takes the form of hierarchical structures and recurrent events. Specifically, this thesis builds on mixed-effects and time-to-event models to enhance both the institutional effectiveness and the assessment of treatment efficacy, which are critical challenges in the learning and healthcare context. Key novelties include advancements in model-based clustering methods, propensity-score techniques, management of time-dependent group-level variability in time-to-event models, and the assessment of treatment effects in recurrent events setting. These contributions aim to enhance existing methodologies and introduce new strategies for analyzing grouped data structures in both domains.

Le strutture di raggruppamento sono spesso intrinsiche ai dati e, se ignorate o modellizzate in modo inadeguato, possono portare ad assunzioni non accurate sulle dipendenze ed a risultati fuorvianti. Un'adeguata considerazione di queste strutture non solo aumenta l'accuratezza dei modelli, ma fornisce anche intuizioni preziose per decisioni informate a livello del raggruppamento. Questa tesi si propone di sviluppare e applicare modelli e metodi innovativi per affrontare in modo efficace l'analisi dei dati raggruppati, concentrandosi in particolare su ambiti quali l’educazione e la sanità, dove il raggruppamento tende a manifestarsi sotto forma di strutture gerarchiche o eventi ricorrenti. In particolare, la tesi si basa su modelli a effetti misti e modelli di tempo all’evento come fondamento metodologico per affrontare le sfide della valutazione dell’efficacia istituzionale e dei trattamenti, temi centrali rispettivamente in ambito educativo e sanitario. I principali contributi comprendono avanzamenti nei metodi di clustering basati sui modelli, tecniche di propensity score, gestione della variabilità temporale a livello di gruppo nei modelli di tempo all’evento e strategie per la valutazione degli effetti dei trattamenti in contesti con eventi ricorrenti. Questi sviluppi mirano a potenziare le metodologie esistenti ed introdurre soluzioni innovative per analizzare dati con strutture di raggruppamento complesse in entrambi gli ambiti.

Statistical methods for hierarchical and recurrent event data in learning and healthcare analytics

Ragni, Alessandra
2024/2025

Abstract

Real-world data often contain grouping structures that, if improperly modelled, can lead to inaccurate assumptions about data dependencies and produce misleading results. Properly accounting for these structures improves model accuracy and provides insights that can inform policy decisions at the group level. This thesis aims to develop and apply novel models and methods for effectively handling grouped data with a particular focus on the fields of learning and healthcare analytics, where grouping typically takes the form of hierarchical structures and recurrent events. Specifically, this thesis builds on mixed-effects and time-to-event models to enhance both the institutional effectiveness and the assessment of treatment efficacy, which are critical challenges in the learning and healthcare context. Key novelties include advancements in model-based clustering methods, propensity-score techniques, management of time-dependent group-level variability in time-to-event models, and the assessment of treatment effects in recurrent events setting. These contributions aim to enhance existing methodologies and introduce new strategies for analyzing grouped data structures in both domains.
SECCHI, PIERCESARE
IEVA, FRANCESCA
28-feb-2025
Le strutture di raggruppamento sono spesso intrinsiche ai dati e, se ignorate o modellizzate in modo inadeguato, possono portare ad assunzioni non accurate sulle dipendenze ed a risultati fuorvianti. Un'adeguata considerazione di queste strutture non solo aumenta l'accuratezza dei modelli, ma fornisce anche intuizioni preziose per decisioni informate a livello del raggruppamento. Questa tesi si propone di sviluppare e applicare modelli e metodi innovativi per affrontare in modo efficace l'analisi dei dati raggruppati, concentrandosi in particolare su ambiti quali l’educazione e la sanità, dove il raggruppamento tende a manifestarsi sotto forma di strutture gerarchiche o eventi ricorrenti. In particolare, la tesi si basa su modelli a effetti misti e modelli di tempo all’evento come fondamento metodologico per affrontare le sfide della valutazione dell’efficacia istituzionale e dei trattamenti, temi centrali rispettivamente in ambito educativo e sanitario. I principali contributi comprendono avanzamenti nei metodi di clustering basati sui modelli, tecniche di propensity score, gestione della variabilità temporale a livello di gruppo nei modelli di tempo all’evento e strategie per la valutazione degli effetti dei trattamenti in contesti con eventi ricorrenti. Questi sviluppi mirano a potenziare le metodologie esistenti ed introdurre soluzioni innovative per analizzare dati con strutture di raggruppamento complesse in entrambi gli ambiti.
File allegati
File Dimensione Formato  
PhD_Thesis_Ragni.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: PhD Thesis - after revisions
Dimensione 15.64 MB
Formato Adobe PDF
15.64 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/233512