The accurate diagnosis of bipolar disorder remains a major clinical challenge as it lacks validated biomarkers. Identifying objective, data-driven methods is crucial for improving diagnostic accuracy. The recent availability of large-scale neuroimaging datasets provides a unique opportunity to identify brain correlates of psychiatric disorders and supports the use of machine learning methods, which require substantial data to derive robust and clinically meaningful biomarkers. This thesis aims to advance the automatic diagnosis of bipolar disorder by studying the complex relationships among brain morphology, sex, and diagnosis through advanced artificial intelligence tools. Two datasets were employed: the Human Connectome Project (HCP), composed of healthy young adults, and the StratiBip dataset, populated with both healthy controls (HC) and bipolar disorder (BD) patients young adults. To this end, the work investigates the use of Ensemble Kolmogorov-Arnold Networks (E-KAN) for the classification of sex and BD from structural magnetic resonance imaging (sMRI) features. The proposed E-KAN architecture combines multiple KAN-based base learners with feature selection techniques. For this work a custom fine-tuning strategy was implemented to the original architecture to improve cross-dataset generalization and to adapt models trained on one record of healthy controls to independent records of both healthy controls an patients. %Models were trained to address sex and diagnosis classification tasks, designed to assess the effect of sexual dimorphism in brain structure. Fine-tuning was performed on the pre-trained E-KAN models to adapt them from the HCP dataset to the StratiBip dataset (both HC and BD), and from HC and BD within StratiBip. To understand the relationship between the pathology prediction and sex found by the model explainability methods were applied to reveal which brain regions drove predictions and how their contributions differed across demographic groups. To this end, Shapley values were computed to quantify the contribution of each brain region to the predictions. Sex classification on StratiBip yielded the highest accuracy of 0.745 (±0.039) in the healthy control group. Cross-dataset inference confirmed the expected performance drop, with a model trained on HCP achieving only 0.482 (±0.012) accuracy when applied to StratiBip HC. However, fine-tuning strategies substantially improved transferability: in the best-case scenario from HCP to Stratibip HC, accuracy increased up to 0.673, corresponding to a gain of +0.192. For the diagnosis prediction task, incorporating prior confounder correction strategies for age and sex (while accounting for diagnosis) improved classification, with the best configuration reaching 0.738 (±0.074). For sex classification, the striatum and thalamus emerged as the most informative predictors on healthy controls from the shapley values analysis. Overall, this study investigated the complex relationships between sex, brain structure, and the findings support the potential of E-KAN architecture as reliable tool for advancing computation psychiatry.

La diagnosi accurata del disturbo bipolare rimane una sfida clinica significativa, poiché mancano biomarcatori validati. L’identificazione di metodi oggettivi e basati sui dati è fondamentale per migliorare l’accuratezza diagnostica. La recente disponibilità di dataset neuroimaging su larga scala offre un’opportunità unica per identificare correlati cerebrali dei disturbi psichiatrici e supporta l’impiego di metodi di machine learning, che richiedono grandi quantità di dati per derivare biomarcatori robusti e clinicamente significativi. Questa tesi si propone di avanzare nella diagnosi automatica del disturbo bipolare studiando le complesse relazioni tra morfologia cerebrale, sesso e diagnosi tramite strumenti avanzati di intelligenza artificiale. Sono stati utilizzati due dataset: l’Human Connectome Project (HCP), composto da giovani adulti sani, e il dataset StratiBip, comprendente sia controlli sani (HC) sia pazienti con disturbo bipolare (BD). A tal fine, il lavoro ha esplorato l’utilizzo delle Reti Ensemble Kolmogorov-Arnold (E-KAN) per la classificazione del sesso e del disturbo bipolare a partire da caratteristiche derivanti da immagini di risonanza magnetica strutturale (sMRI). L’architettura proposta combina più modelli di base KAN con tecniche di selezione delle caratteristiche. Per questo studio è stata implementata una strategia di fine-tuning personalizzata sull’architettura originale, al fine di migliorare la generalizzazione cross-dataset e adattare modelli pre-addestrati su un gruppo di controlli sani a set di dati indipendenti comprendenti sia controlli sani sia pazienti. Il fine-tuning è stato effettuato sui modelli E-KAN pre-addestrati per adattarli dal dataset HCP al dataset StratiBip (sia HC sia BD), e all’interno di StratiBip tra HC e BD. Per comprendere le relazioni tra la predizione della patologia e il sesso identificate dal modello, sono stati applicati metodi di interpretabilità per rivelare quali regioni cerebrali influenzassero le predizioni e come il loro contributo differisse tra gruppi demografici. A tal fine, sono stati calcolati i valori di Shapley per quantificare il contributo di ciascuna regione cerebrale alle predizioni. La classificazione del sesso sul dataset StratiBip ha raggiunto la massima accuratezza di 0,745 (±0,039) nel gruppo dei controlli sani. L’inferenza cross-dataset ha confermato il previsto calo di prestazioni, con un modello addestrato su HCP che ha raggiunto solo 0,482 (±0.012) di accuratezza applicato agli HC di StratiBip. Tuttavia, le strategie di fine-tuning hanno migliorato significativamente la trasferibilità: nel caso migliore, passando da HCP a StratiBip HC, l’accuratezza è aumentata da 0,482 a 0,673, con un incremento di +0,192. Per il compito di predizione della diagnosi, l’inclusione di strategie di correzione dei confondenti per età e sesso (tenendo conto della diagnosi) ha migliorato la classificazione, con la configurazione ottimale che ha raggiunto 0,738 (±0,074). Infine, l’analisi dei valori di Shapley ha fornito interpretabilità, evidenziando le principali regioni cerebrali e mostrando come le strategie di correzione abbiano modificato l’importanza delle caratteristiche. Per la classificazione del sesso, il striato e il talamo si sono rivelati i predittori più informativi nei controlli sani. Complessivamente, questo studio ha indagato le complesse relazioni tra sesso e struttura cerebrale, e i risultati supportano il potenziale dell’architettura E-KAN come strumento affidabile per avanzare nella psichiatria computazionale.

Multi-dataset analysis of brain sexual dimorphism through fine-tuned ensemble Kolmogorov-Arnold networks: from physiology to bipolar disorder

MURÈ, PAOLA
2024/2025

Abstract

The accurate diagnosis of bipolar disorder remains a major clinical challenge as it lacks validated biomarkers. Identifying objective, data-driven methods is crucial for improving diagnostic accuracy. The recent availability of large-scale neuroimaging datasets provides a unique opportunity to identify brain correlates of psychiatric disorders and supports the use of machine learning methods, which require substantial data to derive robust and clinically meaningful biomarkers. This thesis aims to advance the automatic diagnosis of bipolar disorder by studying the complex relationships among brain morphology, sex, and diagnosis through advanced artificial intelligence tools. Two datasets were employed: the Human Connectome Project (HCP), composed of healthy young adults, and the StratiBip dataset, populated with both healthy controls (HC) and bipolar disorder (BD) patients young adults. To this end, the work investigates the use of Ensemble Kolmogorov-Arnold Networks (E-KAN) for the classification of sex and BD from structural magnetic resonance imaging (sMRI) features. The proposed E-KAN architecture combines multiple KAN-based base learners with feature selection techniques. For this work a custom fine-tuning strategy was implemented to the original architecture to improve cross-dataset generalization and to adapt models trained on one record of healthy controls to independent records of both healthy controls an patients. %Models were trained to address sex and diagnosis classification tasks, designed to assess the effect of sexual dimorphism in brain structure. Fine-tuning was performed on the pre-trained E-KAN models to adapt them from the HCP dataset to the StratiBip dataset (both HC and BD), and from HC and BD within StratiBip. To understand the relationship between the pathology prediction and sex found by the model explainability methods were applied to reveal which brain regions drove predictions and how their contributions differed across demographic groups. To this end, Shapley values were computed to quantify the contribution of each brain region to the predictions. Sex classification on StratiBip yielded the highest accuracy of 0.745 (±0.039) in the healthy control group. Cross-dataset inference confirmed the expected performance drop, with a model trained on HCP achieving only 0.482 (±0.012) accuracy when applied to StratiBip HC. However, fine-tuning strategies substantially improved transferability: in the best-case scenario from HCP to Stratibip HC, accuracy increased up to 0.673, corresponding to a gain of +0.192. For the diagnosis prediction task, incorporating prior confounder correction strategies for age and sex (while accounting for diagnosis) improved classification, with the best configuration reaching 0.738 (±0.074). For sex classification, the striatum and thalamus emerged as the most informative predictors on healthy controls from the shapley values analysis. Overall, this study investigated the complex relationships between sex, brain structure, and the findings support the potential of E-KAN architecture as reliable tool for advancing computation psychiatry.
BRAMBILLA, PAOLO
DE FRANCESCHI, GIANLUCA
ING - Scuola di Ingegneria Industriale e dell'Informazione
23-ott-2025
2024/2025
La diagnosi accurata del disturbo bipolare rimane una sfida clinica significativa, poiché mancano biomarcatori validati. L’identificazione di metodi oggettivi e basati sui dati è fondamentale per migliorare l’accuratezza diagnostica. La recente disponibilità di dataset neuroimaging su larga scala offre un’opportunità unica per identificare correlati cerebrali dei disturbi psichiatrici e supporta l’impiego di metodi di machine learning, che richiedono grandi quantità di dati per derivare biomarcatori robusti e clinicamente significativi. Questa tesi si propone di avanzare nella diagnosi automatica del disturbo bipolare studiando le complesse relazioni tra morfologia cerebrale, sesso e diagnosi tramite strumenti avanzati di intelligenza artificiale. Sono stati utilizzati due dataset: l’Human Connectome Project (HCP), composto da giovani adulti sani, e il dataset StratiBip, comprendente sia controlli sani (HC) sia pazienti con disturbo bipolare (BD). A tal fine, il lavoro ha esplorato l’utilizzo delle Reti Ensemble Kolmogorov-Arnold (E-KAN) per la classificazione del sesso e del disturbo bipolare a partire da caratteristiche derivanti da immagini di risonanza magnetica strutturale (sMRI). L’architettura proposta combina più modelli di base KAN con tecniche di selezione delle caratteristiche. Per questo studio è stata implementata una strategia di fine-tuning personalizzata sull’architettura originale, al fine di migliorare la generalizzazione cross-dataset e adattare modelli pre-addestrati su un gruppo di controlli sani a set di dati indipendenti comprendenti sia controlli sani sia pazienti. Il fine-tuning è stato effettuato sui modelli E-KAN pre-addestrati per adattarli dal dataset HCP al dataset StratiBip (sia HC sia BD), e all’interno di StratiBip tra HC e BD. Per comprendere le relazioni tra la predizione della patologia e il sesso identificate dal modello, sono stati applicati metodi di interpretabilità per rivelare quali regioni cerebrali influenzassero le predizioni e come il loro contributo differisse tra gruppi demografici. A tal fine, sono stati calcolati i valori di Shapley per quantificare il contributo di ciascuna regione cerebrale alle predizioni. La classificazione del sesso sul dataset StratiBip ha raggiunto la massima accuratezza di 0,745 (±0,039) nel gruppo dei controlli sani. L’inferenza cross-dataset ha confermato il previsto calo di prestazioni, con un modello addestrato su HCP che ha raggiunto solo 0,482 (±0.012) di accuratezza applicato agli HC di StratiBip. Tuttavia, le strategie di fine-tuning hanno migliorato significativamente la trasferibilità: nel caso migliore, passando da HCP a StratiBip HC, l’accuratezza è aumentata da 0,482 a 0,673, con un incremento di +0,192. Per il compito di predizione della diagnosi, l’inclusione di strategie di correzione dei confondenti per età e sesso (tenendo conto della diagnosi) ha migliorato la classificazione, con la configurazione ottimale che ha raggiunto 0,738 (±0,074). Infine, l’analisi dei valori di Shapley ha fornito interpretabilità, evidenziando le principali regioni cerebrali e mostrando come le strategie di correzione abbiano modificato l’importanza delle caratteristiche. Per la classificazione del sesso, il striato e il talamo si sono rivelati i predittori più informativi nei controlli sani. Complessivamente, questo studio ha indagato le complesse relazioni tra sesso e struttura cerebrale, e i risultati supportano il potenziale dell’architettura E-KAN come strumento affidabile per avanzare nella psichiatria computazionale.
File allegati
File Dimensione Formato  
2025_10_Mure_Tesi_01.pdf

non accessibile

Dimensione 2.29 MB
Formato Adobe PDF
2.29 MB Adobe PDF   Visualizza/Apri
2025_10_Mure_Executive Summary_02.pdf

non accessibile

Dimensione 1.26 MB
Formato Adobe PDF
1.26 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/243979