Multi-state models are powerful tools for analyzing life history processes, widely used in medical and epidemiological research to capture disease progression and biological transitions over time. However, when applied to panel data, where observations occur at discrete time points, uncertainty in transition timing complicates inference. This issue is particularly relevant in chronic disease studies, such as dementia research, where assessments occur at scheduled visits rather than continuously. This thesis examines the limitations of existing multi-state modeling approaches under such uncertainty and proposes a novel strategy to address them. We first evaluate traditional semi-parametric and parametric multi-state models that assume exact transition times, highlighting their applicability and constraints when applied to panel data. We then explore time-homogeneous and time-inhomogeneous models, which explicitly account for interval censoring, analyzing their theoretical properties and computational implementation. A key contribution of this work is the development of Multiple Imputation for Panel Data (MIPD), designed for an illness-death model where dementia represents the intermediate disease state. MIPD leverages multiple imputation to infer the exact onset of dementia in patients diagnosed with the disease and to estimate disease status in cases where progression remains unobserved. By doing so, it eliminates the need to explicitly model uncertainty, bridging the gap between traditional exact-transition methods and interval-censored approaches, while preserving the tractability of the likelihood function. To assess performance and reliability, we conduct an extensive simulation study, evaluating estimation accuracy under varying observational schemes and data-generating processes. Results show that MIPD outperforms traditional methods in settings with irregular observation schedules and wide intervals. However, findings also reveal that no single strategy is universally optimal—the implications of ignoring transition-time uncertainty depend on the data structure and study design. Therefore, we provide practical recommendations for researchers applying multi-state models to panel data, offering guidance on selecting the most appropriate approach based on the available data and modeling objectives.

I modelli multi-stato sono strumenti potenti per l'analisi dei processi di storia della vita, ampiamente utilizzati nella ricerca medica ed epidemiologica per catturare la progressione delle malattie e le transizioni biologiche nel tempo. Tuttavia, quando applicati ai dati panel, dove le osservazioni avvengono a intervalli discreti, l'incertezza nei tempi di transizione complica l'inferenza. Questo aspetto è particolarmente rilevante negli studi sulle malattie croniche, come la demenza, dove le valutazioni sono limitate a visite programmate anziché a monitoraggi continui. Questa tesi analizza le limitazioni degli approcci esistenti nei modelli multi-stato in presenza di incertezze nei tempi di transizione, proponendo una strategia innovativa per affrontare tali difficoltà. Iniziamo valutando i modelli semi-parametrici e parametrici tradizionali, che assumono transizioni esatte, evidenziandone l'applicabilità e i limiti nell'analisi di dati panel. Successivamente, esploriamo modelli tempo-omogenei e tempo-inomogenei, che considerano esplicitamente la censura intervallare, analizzando le loro proprietà teoriche e l'implementazione computazionale. Un contributo significativo di questo lavoro è lo sviluppo di Multiple Imputation for Panel Data (MIPD), progettato per un modello illness-death in cui la demenza rappresenta lo intermedio. MIPD sfrutta l'imputazione multipla per inferire l’esatto momento di insorgenza della demenza nei pazienti diagnosticati e stimare lo stato della malattia nei casi in cui la progressione non sia osservata. In questo modo, elimina la necessità di modellare esplicitamente l’incertezza, colmando il divario tra i metodi tradizionali a transizioni esatte e quelli per dati censurati per intervallo, mantenendo la trattabilità della funzione di verosimiglianza. Per valutare le performance e l’affidabilità, conduciamo uno studio di simulazione approfondito, esaminando l'accuratezza delle stime in contesti con schemi di osservazione variabili e processi generativi dei dati differenti. I risultati mostrano che MIPD supera i metodi tradizionali in scenari con programmi di osservazione irregolari e intervalli ampi. Tuttavia, emerge che non esiste una strategia universale ottimale, poiché l’impatto dell’incertezza nei tempi di transizione dipende dalla struttura dei dati e dal disegno dello studio. Pertanto, offriamo raccomandazioni pratiche per i ricercatori che utilizzano modelli multi-stato applicati ai dati panel, guidandoli nella scelta dell’approccio più adatto in base ai dati disponibili e agli obiettivi del modello.

Multi-state models with intermittent observation scheme in the aging research field

Pescina, Alessandra
2023/2024

Abstract

Multi-state models are powerful tools for analyzing life history processes, widely used in medical and epidemiological research to capture disease progression and biological transitions over time. However, when applied to panel data, where observations occur at discrete time points, uncertainty in transition timing complicates inference. This issue is particularly relevant in chronic disease studies, such as dementia research, where assessments occur at scheduled visits rather than continuously. This thesis examines the limitations of existing multi-state modeling approaches under such uncertainty and proposes a novel strategy to address them. We first evaluate traditional semi-parametric and parametric multi-state models that assume exact transition times, highlighting their applicability and constraints when applied to panel data. We then explore time-homogeneous and time-inhomogeneous models, which explicitly account for interval censoring, analyzing their theoretical properties and computational implementation. A key contribution of this work is the development of Multiple Imputation for Panel Data (MIPD), designed for an illness-death model where dementia represents the intermediate disease state. MIPD leverages multiple imputation to infer the exact onset of dementia in patients diagnosed with the disease and to estimate disease status in cases where progression remains unobserved. By doing so, it eliminates the need to explicitly model uncertainty, bridging the gap between traditional exact-transition methods and interval-censored approaches, while preserving the tractability of the likelihood function. To assess performance and reliability, we conduct an extensive simulation study, evaluating estimation accuracy under varying observational schemes and data-generating processes. Results show that MIPD outperforms traditional methods in settings with irregular observation schedules and wide intervals. However, findings also reveal that no single strategy is universally optimal—the implications of ignoring transition-time uncertainty depend on the data structure and study design. Therefore, we provide practical recommendations for researchers applying multi-state models to panel data, offering guidance on selecting the most appropriate approach based on the available data and modeling objectives.
GREGORIO, CATERINA
ING - Scuola di Ingegneria Industriale e dell'Informazione
3-apr-2025
2023/2024
I modelli multi-stato sono strumenti potenti per l'analisi dei processi di storia della vita, ampiamente utilizzati nella ricerca medica ed epidemiologica per catturare la progressione delle malattie e le transizioni biologiche nel tempo. Tuttavia, quando applicati ai dati panel, dove le osservazioni avvengono a intervalli discreti, l'incertezza nei tempi di transizione complica l'inferenza. Questo aspetto è particolarmente rilevante negli studi sulle malattie croniche, come la demenza, dove le valutazioni sono limitate a visite programmate anziché a monitoraggi continui. Questa tesi analizza le limitazioni degli approcci esistenti nei modelli multi-stato in presenza di incertezze nei tempi di transizione, proponendo una strategia innovativa per affrontare tali difficoltà. Iniziamo valutando i modelli semi-parametrici e parametrici tradizionali, che assumono transizioni esatte, evidenziandone l'applicabilità e i limiti nell'analisi di dati panel. Successivamente, esploriamo modelli tempo-omogenei e tempo-inomogenei, che considerano esplicitamente la censura intervallare, analizzando le loro proprietà teoriche e l'implementazione computazionale. Un contributo significativo di questo lavoro è lo sviluppo di Multiple Imputation for Panel Data (MIPD), progettato per un modello illness-death in cui la demenza rappresenta lo intermedio. MIPD sfrutta l'imputazione multipla per inferire l’esatto momento di insorgenza della demenza nei pazienti diagnosticati e stimare lo stato della malattia nei casi in cui la progressione non sia osservata. In questo modo, elimina la necessità di modellare esplicitamente l’incertezza, colmando il divario tra i metodi tradizionali a transizioni esatte e quelli per dati censurati per intervallo, mantenendo la trattabilità della funzione di verosimiglianza. Per valutare le performance e l’affidabilità, conduciamo uno studio di simulazione approfondito, esaminando l'accuratezza delle stime in contesti con schemi di osservazione variabili e processi generativi dei dati differenti. I risultati mostrano che MIPD supera i metodi tradizionali in scenari con programmi di osservazione irregolari e intervalli ampi. Tuttavia, emerge che non esiste una strategia universale ottimale, poiché l’impatto dell’incertezza nei tempi di transizione dipende dalla struttura dei dati e dal disegno dello studio. Pertanto, offriamo raccomandazioni pratiche per i ricercatori che utilizzano modelli multi-stato applicati ai dati panel, guidandoli nella scelta dell’approccio più adatto in base ai dati disponibili e agli obiettivi del modello.
File allegati
File Dimensione Formato  
2025_04_Pescina_Tesi.pdf

accessibile in internet per tutti

Descrizione: Thesis
Dimensione 2.37 MB
Formato Adobe PDF
2.37 MB Adobe PDF Visualizza/Apri
2025_04_Pescina_Executive_Summary.pdf

accessibile in internet per tutti

Descrizione: Executive Summary
Dimensione 617.35 kB
Formato Adobe PDF
617.35 kB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/234373