Distinguishing between recent-onset psychosis (ROP) and depression (ROD) remains a significant challenge in psychiatry. The current clinical practice relies on subjective clinician evaluation, leading to potential misdiagnosis and delayed treatment. This study ventures beyond symptom-based diagnosis by harnessing the power of neuroimaging and machine learning (ML). We present an optimized framework to develop a ML pipeline designed to distinguish healthy controls (HC) from patients (P) and to classify ROP and ROD using structural and functional Magnetic Resonance Imaging (MRI) data from 506 participants of the multi-site European PRONIA study. Recognizing the potential influence of substance use, we explore the possibility of incorporating these additional features. To ensure model robustness and generalizability, a nested cross-validation (CV) scheme is implemented, featuring a unique design that integrates confounder correction and optimization tools. The pipeline development involved a meticulous search for the best-performing feature selection (FS) and optimization techniques including filter-based methods and genetic algorithms (GA). Finally, Shapley values and permutation importance techniques were used to gain valuable insights into the model's decision-making process. The GA consistently demonstrated its potential for applications in psychiatric diagnosis. Used both for feature selection and model selection tasks, it achieved the following average accuracies: 0.574 for HC vs. P and 0.676 for ROP vs. ROD. Our findings also revealed that incorporating data on substance use improved the overall classification accuracy. By leveraging the power of neuroimaging and ML, this study paves the way for more objective data-driven diagnoses of ROP and ROD, ultimately contributing to improved patient outcomes.
Il riconoscimento di psicosi o depressione ad esordio recente (ROP o ROD) rimane un ostacolo significativo in psichiatria. I metodi tradizionali si basano fortemente sui sintomi riportati dai pazienti, portando a potenziali diagnosi errate e ritardi nel trattamento. Questo studio si spinge oltre la diagnosi basata sui sintomi sfruttando i concetti della diagnostica per immagini e del machine learning (ML). Viene qui presentato un framework per lo sviluppo di una pipeline di ML ottimizzata, progettata per distinguere i pazienti (P) dai controlli sani (HC) e i casi ROP dai ROD , allenata su dati di risonanza magnetica strutturale e funzionale (RM) raccolti dal consorzio PRONIA in uno studio europeo multicentrico che comprende 506 soggetti. Riconoscendo la potenziale influenza dell'abuso di sostanze, è stata esplorata anche la possibilità di incorporare il loro consumo come dato aggiuntivo. Per garantire la robustezza e la generalizzabilità del modello, è stato implementato uno schema di nested cross validation, caratterizzato da un design unico capace di integrare gli strumenti di correzione dei fattori confondenti ai sistemi di ottimizzazione. Una meticolosa selezione delle tecniche di feature selection e di ottimizzazione più performanti, che ha incluso filter methods e algoritmi genetici (AG), è stata condotta. Infine, i valori di Shapley e le tecniche di permutation importance sono state utilizzate per ottenere preziose informazioni sul processo decisionale del modello. Gli AG hanno dimostrato il loro potenziale per le applicazioni nella diagnosi psichiatrica; utilizzati sia per la selezione delle features che per la selezione del modello, hanno ottenuto i seguenti indici di accuratezza media: 0,574 per HC vs. P e 0,676 per ROP vs. ROD. Dai risultati emerge che l'incorporazione di dati sull'abuso di sostanze, in veste di features aggiuntive, migliora l'accuratezza. Questo studio contribuisce quindi allo sviluppo della diagnostica per immagini in psichiatria tramite algoritmi di ML, migliorando i risultati per i pazienti.
Towards early psychosis and depression prediction: optimizing an explainable machine learning pipeline based on multimodal MRI data
De Franceschi, Gianluca
2023/2024
Abstract
Distinguishing between recent-onset psychosis (ROP) and depression (ROD) remains a significant challenge in psychiatry. The current clinical practice relies on subjective clinician evaluation, leading to potential misdiagnosis and delayed treatment. This study ventures beyond symptom-based diagnosis by harnessing the power of neuroimaging and machine learning (ML). We present an optimized framework to develop a ML pipeline designed to distinguish healthy controls (HC) from patients (P) and to classify ROP and ROD using structural and functional Magnetic Resonance Imaging (MRI) data from 506 participants of the multi-site European PRONIA study. Recognizing the potential influence of substance use, we explore the possibility of incorporating these additional features. To ensure model robustness and generalizability, a nested cross-validation (CV) scheme is implemented, featuring a unique design that integrates confounder correction and optimization tools. The pipeline development involved a meticulous search for the best-performing feature selection (FS) and optimization techniques including filter-based methods and genetic algorithms (GA). Finally, Shapley values and permutation importance techniques were used to gain valuable insights into the model's decision-making process. The GA consistently demonstrated its potential for applications in psychiatric diagnosis. Used both for feature selection and model selection tasks, it achieved the following average accuracies: 0.574 for HC vs. P and 0.676 for ROP vs. ROD. Our findings also revealed that incorporating data on substance use improved the overall classification accuracy. By leveraging the power of neuroimaging and ML, this study paves the way for more objective data-driven diagnoses of ROP and ROD, ultimately contributing to improved patient outcomes.File | Dimensione | Formato | |
---|---|---|---|
2024_04_De_Franceschi_Gianluca_Tesi_01.pdf
accessibile in internet per tutti
Dimensione
6.05 MB
Formato
Adobe PDF
|
6.05 MB | Adobe PDF | Visualizza/Apri |
2023_04_De_Franceschi_Gianluca_Summary_02.pdf
accessibile in internet per tutti
Dimensione
1.55 MB
Formato
Adobe PDF
|
1.55 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/218358