The selection of a donor for allogeneic hematopoietic stem cell transplantation has become a complex, multi-factorial challenge that requires balancing traditional human leukocyte antigen (HLA) compatibility — molecules on cell surfaces that guide immune recognition and whose matching reduces post-transplant immune complications — with non-HLA factors and with modern pharmacological strategies such as post-transplant cyclophosphamide. This thesis addresses the resulting need for interpretable, data-driven decision support by developing a comprehensive framework based on a Bayesian hierarchical Accelerated Failure Time survival model. Trained on a multicenter Italian registry (GITMO, N=7,609), the model overcomes key limitations of traditional approaches by directly modeling survival times using a log-normal distribution, explicitly accounting for heteroscedasticity, and incorporating center-level random effects. The core contribution is an interactive Shiny application that enables clinicians to compare multiple donor candidates through personalized survival curves with uncertainty intervals. To ensure transparency, the system integrates SHapley Additive exPlanations values to provide clear, feature-level explanations for each prediction. Model validation demonstrates robust performance, with a concordance index of 0.64 and strong discriminative ability at the clinically relevant one-year mark (AUC: 0.71 at 12 months). Calibration is also satisfactory, with a Brier score of 0.187 at 12 months. A key finding is the quantification of how PTCy mitigates the survival penalty associated with mismatched unrelated donors, a pivotal insight for contemporary donor selection. By bridging rigorous Bayesian survival modeling with clinical usability and explainability, this work provides a practical tool to navigate the complexities of contemporary donor selection and to support more personalized, evidence-based decisions.
La selezione di un donatore per il trapianto allogenico di cellule staminali ematopoietiche è diventata una sfida complessa e multifattoriale, che richiede di bilanciare la compatibilità tradizionale degli antigeni leucocitari umani (HLA) - molecole presenti sulla superficie cellulare che guidano il riconoscimento immunitario e la cui corrispondenza riduce le complicanze immunitarie post-trapianto - con fattori non-HLA e con strategie farmacologiche moderne, come la ciclofosfamide post-trapianto (PTCy). Questa tesi affronta la conseguente esigenza di un supporto decisionale interpretabile e basato sui dati, sviluppando un framework completo fondato su un modello di sopravvivenza Accelerated Failure Time gerarchico bayesiano. Addestrato su un registro multicentrico italiano (GITMO, N=7.609), il modello supera i principali limiti degli approcci tradizionali modellando direttamente i tempi di sopravvivenza tramite una distribuzione log-normale, tenendo esplicitamente conto dell’eteroschedasticità e incorporando effetti casuali a livello di centro. Il contributo principale consiste in un’applicazione interattiva sviluppata in Shiny, che consente ai clinici di confrontare diversi potenziali donatori attraverso curve di sopravvivenza personalizzate con relativi intervalli di credibilità. Per garantire trasparenza, il sistema integra i valori di SHapley Additive exPlanations (SHAP), offrendo spiegazioni chiare e interpretabili a livello di singola variabile per ogni previsione. La validazione del modello mostra prestazioni solide, con un indice di concordanza pari a 0.64 e una buona capacità discriminativa al traguardo clinicamente rilevante di un anno (AUC: 0.71 a 12 mesi). Anche la calibrazione risulta soddisfacente, con un Brier score di 0.187 a 12 mesi. Un risultato chiave è la quantificazione di come la PTCy riduca la penalità di sopravvivenza associata ai donatori non correlati con mismatch, un’informazione cruciale per la selezione contemporanea dei donatori. Unendo la rigorosità della modellazione bayesiana di sopravvivenza con usabilità e spiegabilità clinica, questo lavoro fornisce uno strumento pratico per affrontare la complessità della selezione dei donatori e supportare decisioni più personalizzate e basate sull’evidenza.
Survival models to support the selection of the best hematopoietic stem cell donor
Scorza, Raffaele
2024/2025
Abstract
The selection of a donor for allogeneic hematopoietic stem cell transplantation has become a complex, multi-factorial challenge that requires balancing traditional human leukocyte antigen (HLA) compatibility — molecules on cell surfaces that guide immune recognition and whose matching reduces post-transplant immune complications — with non-HLA factors and with modern pharmacological strategies such as post-transplant cyclophosphamide. This thesis addresses the resulting need for interpretable, data-driven decision support by developing a comprehensive framework based on a Bayesian hierarchical Accelerated Failure Time survival model. Trained on a multicenter Italian registry (GITMO, N=7,609), the model overcomes key limitations of traditional approaches by directly modeling survival times using a log-normal distribution, explicitly accounting for heteroscedasticity, and incorporating center-level random effects. The core contribution is an interactive Shiny application that enables clinicians to compare multiple donor candidates through personalized survival curves with uncertainty intervals. To ensure transparency, the system integrates SHapley Additive exPlanations values to provide clear, feature-level explanations for each prediction. Model validation demonstrates robust performance, with a concordance index of 0.64 and strong discriminative ability at the clinically relevant one-year mark (AUC: 0.71 at 12 months). Calibration is also satisfactory, with a Brier score of 0.187 at 12 months. A key finding is the quantification of how PTCy mitigates the survival penalty associated with mismatched unrelated donors, a pivotal insight for contemporary donor selection. By bridging rigorous Bayesian survival modeling with clinical usability and explainability, this work provides a practical tool to navigate the complexities of contemporary donor selection and to support more personalized, evidence-based decisions.| File | Dimensione | Formato | |
|---|---|---|---|
|
tesi_raffaele_scorza-45.pdf
accessibile in internet per tutti a partire dal 18/11/2028
Descrizione: Tesi Scorza Raffaele
Dimensione
15.01 MB
Formato
Adobe PDF
|
15.01 MB | Adobe PDF | Visualizza/Apri |
|
Executive_Summary___Scuola_di_Ingegneria_Industriale_e_dell_Informazione___Politecnico_di_Milano__2_-15.pdf
accessibile in internet per tutti a partire dal 18/11/2028
Descrizione: Executive Summary Scorza Raffaele
Dimensione
2.26 MB
Formato
Adobe PDF
|
2.26 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/246716