Is it possible to predict the precise timing of a critical event, such as disease recovery or death, without having to choose between the accuracy of deep learning and the need for interpretability? In clinical practice, a model is only useful if clinicians can understand why and how individual features functionally contribute to the risk prediction. This thesis examines a rigid dichotomy in survival analysis. Traditional models, such as CoxPH, often fail to match the accuracy of deep learning models, such as DeepHit or DeepSurv, relying on restrictive assumptions that fail to capture the complexity of real-world, time-varying risks. Conversely, while deep learning models offer superior performance, they sacrifice transparency for black-box power. Furthermore, they often handle time inefficiently, discretizing it into fixed bins rather than treating it as a continuous dimension. A recent work, CoxKAN, has attempted to bridge this gap using Kolmogorov-Arnold Networks (KANs), which differ from traditional Multi-Layer Perceptrons by replacing fixed activation functions on nodes with learnable univariate functions on edges. However, CoxKAN remains a semi-parametric solution, relying on unspecified baseline components that prevent a complete description of the patient risk. We propose SurvKAN, a model that resolves this trade-off. Unlike its predecessors, it treats time as an active input feature fed directly into the neural network alongside clinical data. By leveraging the learnable activation functions of KANs, it generates continuous risk trajectories for every patient without requiring assumptions or time discretization. It has been validated on ten benchmark medical datasets. To rigorously assess the practical utility of the model's transparency, two of these datasets were subjected to a qualitative review by a clinical domain expert, confirming that SurvKAN is a trustworthy decision-support tool that discovers clinically relevant patterns and provides actionable insights. SurvKAN achieves prediction accuracy competitive or superior compared to survival analysis baselines, while maintaining the mathematical clarity of traditional equations, offering a unified and fully parametric solution for modern clinical analysis.

È possibile prevedere la tempistica precisa di un evento critico, come la guarigione da una malattia o la morte, senza dover scegliere tra l'accuratezza del deep learning e la necessità di interpretabilità? Nella pratica clinica, un modello è utile solo se i clinici possono comprendere perché e come le singole caratteristiche contribuiscano funzionalmente alla previsione del rischio. Questa tesi esamina una rigida dicotomia nell'analisi di sopravvivenza. I modelli tradizionali, come CoxPH, spesso non riescono a eguagliare l'accuratezza dei modelli di deep learning, come DeepHit o DeepSurv, basandosi su assunzioni restrittive che non riescono a cogliere la complessità dei rischi del mondo reale, variabili nel tempo. Viceversa, sebbene i modelli di deep learning offrano prestazioni superiori, essi sacrificano la trasparenza in favore della potenza delle "black-box". Inoltre, spesso gestiscono il tempo in modo inefficiente, discretizzandolo in intervalli fissi anziché trattarlo come una dimensione continua. Un lavoro recente, CoxKAN, ha tentato di colmare questo divario utilizzando le Kolmogorov-Arnold Networks (KANs), le quali differiscono dai tradizionali Multi-Layer Perceptrons sostituendo le funzioni di attivazione fisse sui nodi con funzioni univariate apprendibili sulle connessioni. Tuttavia, CoxKAN rimane una soluzione semi-parametrica, che si basa su componenti baseline non specificate che impediscono una descrizione completa del rischio del paziente. Proponiamo SurvKAN, un modello che risolve questo compromesso. A differenza dei suoi predecessori, esso tratta il tempo come una caratteristica di input attiva, inserita direttamente nella rete neurale insieme ai dati clinici. Sfruttando le funzioni di attivazione apprendibili delle KANs, genera traiettorie di rischio continue per ogni paziente senza richiedere assunzioni o discretizzazione temporale. È stato validato su dieci dataset medici di riferimento. Per valutare rigorosamente l'utilità pratica della trasparenza del modello, due di questi dataset sono stati sottoposti a una revisione qualitativa da parte di un esperto del dominio clinico, confermando che SurvKAN è uno strumento di supporto decisionale affidabile, che scopre pattern clinicamente rilevanti e fornisce intuizioni utilizzabili. SurvKAN raggiunge un'accuratezza di previsione competitiva o superiore rispetto ai modelli di base dell'analisi di sopravvivenza, mantenendo al contempo la chiarezza matematica delle equazioni tradizionali, offrendo una soluzione unificata e interamente parametrica per la moderna analisi clinica.

SurvKAN: a fully parametric survival model based on kolmogorov-arnold networks

MASTROLEO, MARINA
2024/2025

Abstract

Is it possible to predict the precise timing of a critical event, such as disease recovery or death, without having to choose between the accuracy of deep learning and the need for interpretability? In clinical practice, a model is only useful if clinicians can understand why and how individual features functionally contribute to the risk prediction. This thesis examines a rigid dichotomy in survival analysis. Traditional models, such as CoxPH, often fail to match the accuracy of deep learning models, such as DeepHit or DeepSurv, relying on restrictive assumptions that fail to capture the complexity of real-world, time-varying risks. Conversely, while deep learning models offer superior performance, they sacrifice transparency for black-box power. Furthermore, they often handle time inefficiently, discretizing it into fixed bins rather than treating it as a continuous dimension. A recent work, CoxKAN, has attempted to bridge this gap using Kolmogorov-Arnold Networks (KANs), which differ from traditional Multi-Layer Perceptrons by replacing fixed activation functions on nodes with learnable univariate functions on edges. However, CoxKAN remains a semi-parametric solution, relying on unspecified baseline components that prevent a complete description of the patient risk. We propose SurvKAN, a model that resolves this trade-off. Unlike its predecessors, it treats time as an active input feature fed directly into the neural network alongside clinical data. By leveraging the learnable activation functions of KANs, it generates continuous risk trajectories for every patient without requiring assumptions or time discretization. It has been validated on ten benchmark medical datasets. To rigorously assess the practical utility of the model's transparency, two of these datasets were subjected to a qualitative review by a clinical domain expert, confirming that SurvKAN is a trustworthy decision-support tool that discovers clinically relevant patterns and provides actionable insights. SurvKAN achieves prediction accuracy competitive or superior compared to survival analysis baselines, while maintaining the mathematical clarity of traditional equations, offering a unified and fully parametric solution for modern clinical analysis.
ING - Scuola di Ingegneria Industriale e dell'Informazione
26-mar-2026
2024/2025
È possibile prevedere la tempistica precisa di un evento critico, come la guarigione da una malattia o la morte, senza dover scegliere tra l'accuratezza del deep learning e la necessità di interpretabilità? Nella pratica clinica, un modello è utile solo se i clinici possono comprendere perché e come le singole caratteristiche contribuiscano funzionalmente alla previsione del rischio. Questa tesi esamina una rigida dicotomia nell'analisi di sopravvivenza. I modelli tradizionali, come CoxPH, spesso non riescono a eguagliare l'accuratezza dei modelli di deep learning, come DeepHit o DeepSurv, basandosi su assunzioni restrittive che non riescono a cogliere la complessità dei rischi del mondo reale, variabili nel tempo. Viceversa, sebbene i modelli di deep learning offrano prestazioni superiori, essi sacrificano la trasparenza in favore della potenza delle "black-box". Inoltre, spesso gestiscono il tempo in modo inefficiente, discretizzandolo in intervalli fissi anziché trattarlo come una dimensione continua. Un lavoro recente, CoxKAN, ha tentato di colmare questo divario utilizzando le Kolmogorov-Arnold Networks (KANs), le quali differiscono dai tradizionali Multi-Layer Perceptrons sostituendo le funzioni di attivazione fisse sui nodi con funzioni univariate apprendibili sulle connessioni. Tuttavia, CoxKAN rimane una soluzione semi-parametrica, che si basa su componenti baseline non specificate che impediscono una descrizione completa del rischio del paziente. Proponiamo SurvKAN, un modello che risolve questo compromesso. A differenza dei suoi predecessori, esso tratta il tempo come una caratteristica di input attiva, inserita direttamente nella rete neurale insieme ai dati clinici. Sfruttando le funzioni di attivazione apprendibili delle KANs, genera traiettorie di rischio continue per ogni paziente senza richiedere assunzioni o discretizzazione temporale. È stato validato su dieci dataset medici di riferimento. Per valutare rigorosamente l'utilità pratica della trasparenza del modello, due di questi dataset sono stati sottoposti a una revisione qualitativa da parte di un esperto del dominio clinico, confermando che SurvKAN è uno strumento di supporto decisionale affidabile, che scopre pattern clinicamente rilevanti e fornisce intuizioni utilizzabili. SurvKAN raggiunge un'accuratezza di previsione competitiva o superiore rispetto ai modelli di base dell'analisi di sopravvivenza, mantenendo al contempo la chiarezza matematica delle equazioni tradizionali, offrendo una soluzione unificata e interamente parametrica per la moderna analisi clinica.
File allegati
File Dimensione Formato  
2026_03_Mastroleo_Thesis.pdf

non accessibile

Descrizione: Thesis
Dimensione 3.47 MB
Formato Adobe PDF
3.47 MB Adobe PDF   Visualizza/Apri
2026_03_Mastroleo_Executive_Summary.pdf

non accessibile

Descrizione: Executive Summary
Dimensione 1.72 MB
Formato Adobe PDF
1.72 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/251590