Recently, the increasing availability of repeated measurements in biomedical studies has motivated the development of statistical methods specifically designed to predict survival from a large (potentially high-dimensional) number of longitudinal covariates. In the past five years, several approaches have been proposed, including Multivariate Functional Principal Component Cox model, Penalized Regression Calibrarion, Functional Random Survival Forest, and DynForest. These methods differ in terms of how they model the evolution of longitudinal covariates over time, and how they model the relationship between the longitudinal covariates and the survival outcomes. Despite their potential, there is limited knowledge about their applicability, efficiency, limitations, and performance when applied to real-world data. This thesis aims to provide an overview of these methods, focusing on their different strategies for modelling and summarizing disease progression. Furthermore, it presents a systematic comparison of their predictive performance in the context of dynamic prediction. The comparison includes also two simpler approaches, namely a Cox model using landmarking (last observation carried forward) and a Cox model using only baseline measurements. The six methods selected are applied to three real-world datasets obtained from the Alzheimer’s Disease Neuroimaging Initiative, the Religious Orders Study and Rush Memory and Aging Project, and the Mayo Clinic Primary Biliary Cholangitis study. These studies differ in terms of disease types, sample sizes, number of longitudinal covariates, and follow-up durations, making it possible to compare the aforementioned methods under a heterogeneous set of circumstances.

Di recente, l’aumento della disponibilità di misure ripetute negli studi biomedici ha incentivato lo sviluppo di metodi statistici appositamente progettati per predire la sopravvivenza sfruttando un elevato numero di covariate longitudinali. Negli ultimi cinque anni, sono stati proposti diversi approcci, tra cui il modello Multivariate Functional Principal Component Cox, Penalized Regression Calibrarion, Functional Random Survival Forest e DynForest. Questi metodi differiscono per la metodologia scelta per modellare l’evoluzione delle covariate longitudinali nel tempo e per modellare la relazione tra tali covariate e le previsioni di sopravvivenza. Nonostante il loro potenziale, le conoscenze sulla loro applicabilità, efficienza, limitazioni e prestazioni quando applicati a dati del mondo reale sono ancora limitate. Questa tesi si propone di fornire una panoramica di tali metodi, con particolare attenzione alle diverse strategie per modellare e riassumere dati longitudinali clinici. Inoltre, proponiamo un confronto sistematico delle loro prestazioni predittive nel contesto della previsione dinamica. Tale confronto include anche due approcci più semplici: un modello Cox che utilizza landmarking (Last Observation Carried Forward) e un modello Cox che utilizza solo misure a baseline. I sei metodi selezionati vengono applicati a tre dataset reali provenienti dall’Alzheimer’s Disease Neuroimaging Initiative, dal Religious Orders Study and Rush Memory and Aging Project, e dal Mayo Clinic Primary Biliary Cholangitis study. Questi studi differiscono per il tipo di malattia, le dimensioni del campione, il numero di covariate longitudinali e la durata del follow-up, consentendo così di confrontare i metodi sopra citati su un insieme eterogeneo di circostanze.

Dynamic prediction of survival with many longitudinal predictors : an empirical evaluation

Retif, Sophie Lorenza Charlotte
2022/2023

Abstract

Recently, the increasing availability of repeated measurements in biomedical studies has motivated the development of statistical methods specifically designed to predict survival from a large (potentially high-dimensional) number of longitudinal covariates. In the past five years, several approaches have been proposed, including Multivariate Functional Principal Component Cox model, Penalized Regression Calibrarion, Functional Random Survival Forest, and DynForest. These methods differ in terms of how they model the evolution of longitudinal covariates over time, and how they model the relationship between the longitudinal covariates and the survival outcomes. Despite their potential, there is limited knowledge about their applicability, efficiency, limitations, and performance when applied to real-world data. This thesis aims to provide an overview of these methods, focusing on their different strategies for modelling and summarizing disease progression. Furthermore, it presents a systematic comparison of their predictive performance in the context of dynamic prediction. The comparison includes also two simpler approaches, namely a Cox model using landmarking (last observation carried forward) and a Cox model using only baseline measurements. The six methods selected are applied to three real-world datasets obtained from the Alzheimer’s Disease Neuroimaging Initiative, the Religious Orders Study and Rush Memory and Aging Project, and the Mayo Clinic Primary Biliary Cholangitis study. These studies differ in terms of disease types, sample sizes, number of longitudinal covariates, and follow-up durations, making it possible to compare the aforementioned methods under a heterogeneous set of circumstances.
SIGNORELLI , MIRKO
ING - Scuola di Ingegneria Industriale e dell'Informazione
18-lug-2023
2022/2023
Di recente, l’aumento della disponibilità di misure ripetute negli studi biomedici ha incentivato lo sviluppo di metodi statistici appositamente progettati per predire la sopravvivenza sfruttando un elevato numero di covariate longitudinali. Negli ultimi cinque anni, sono stati proposti diversi approcci, tra cui il modello Multivariate Functional Principal Component Cox, Penalized Regression Calibrarion, Functional Random Survival Forest e DynForest. Questi metodi differiscono per la metodologia scelta per modellare l’evoluzione delle covariate longitudinali nel tempo e per modellare la relazione tra tali covariate e le previsioni di sopravvivenza. Nonostante il loro potenziale, le conoscenze sulla loro applicabilità, efficienza, limitazioni e prestazioni quando applicati a dati del mondo reale sono ancora limitate. Questa tesi si propone di fornire una panoramica di tali metodi, con particolare attenzione alle diverse strategie per modellare e riassumere dati longitudinali clinici. Inoltre, proponiamo un confronto sistematico delle loro prestazioni predittive nel contesto della previsione dinamica. Tale confronto include anche due approcci più semplici: un modello Cox che utilizza landmarking (Last Observation Carried Forward) e un modello Cox che utilizza solo misure a baseline. I sei metodi selezionati vengono applicati a tre dataset reali provenienti dall’Alzheimer’s Disease Neuroimaging Initiative, dal Religious Orders Study and Rush Memory and Aging Project, e dal Mayo Clinic Primary Biliary Cholangitis study. Questi studi differiscono per il tipo di malattia, le dimensioni del campione, il numero di covariate longitudinali e la durata del follow-up, consentendo così di confrontare i metodi sopra citati su un insieme eterogeneo di circostanze.
File allegati
File Dimensione Formato  
Executive_Summary_Retif.pdf

solo utenti autorizzati a partire dal 03/07/2024

Descrizione: Executive summary
Dimensione 619.68 kB
Formato Adobe PDF
619.68 kB Adobe PDF   Visualizza/Apri
Master_thesis_Retif.pdf

solo utenti autorizzati a partire dal 03/07/2024

Descrizione: Master thesis
Dimensione 1.35 MB
Formato Adobe PDF
1.35 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/207573