Bipolar disorder (BD) is a chronic and disabling mood disorder, characterized by a heterogeneous clinical and symptomatological presentation and a diagnosis latency of 5 to 10 years. Identifying objective neurobiological markers for BD, such as those based on neuroimaging data, might help improve the diagnosis sensitivity by translating quantitative knowledge to clinical practice. A vast amount of neuroscientific literature has reported neuroanatomical alterations correlating with BD, although evidence is fragmented. Machine Learning (ML), as a multivariate statistical method, has become a widely used approach to investigate biological markers and build predictive models for clinical diagnosis. Nevertheless, limitations have hampered their development and application, such as the large number of cases required for the training process and the lack of domain relevance of most models, being characterized as “black box”, providing no insight into disease pathophysiology mechanisms. In the present study, for the first time, we experiment an alternative approach for the automatic detection of BD, based on structural neuroimaging data, using an Autoencoder-based (AE) normative model, trained solely on healthy controls’ (HC) data devoid of confounding factors. We use a multisite 3T structural Magnetic Resonance Imaging (sMRI) dataset composed of 605 HC and 558 BD, from which we extract brain morphological features and design both an internal and external validation framework, to evaluate the model’s discriminative power and generalizability. To eliminate confounding effects in the sMRI data, we compare different multisite data harmonization options using the ComBat tool combined with biological covariates correction. We conclude that estimating ComBat center effects solely in the training set, via a CV framework, leads to an effective harmonization of training, test, and external set. After being trained and tested on HC data, the AE model is employed in an anomaly detection framework on BD data, using the reconstruction error to spot deviating samples, achieving an AUC of 0.51 for BD discrimination, using all brain features. With the proposed model, we then identify BD neuroanatomical deviating features and assess if they help increase the discriminatory power, achieving an AUC of 0.61 in the external set, higher than the AUC obtained in a traditional SVM approach.

Il disturbo bipolare (BD) è un disturbo dell'umore cronico e invalidante, caratterizzato da una presentazione clinica e sintomatologica eterogenea e da una latenza della diagnosi che si stima dai 5 ai 10 anni. L'identificazione di marcatori neurobiologici oggettivi relativi al BD, come quelli basati sui dati di neuroimaging, potrebbero aiutare a migliorare la qualità della diagnosi traducendo le conoscenze quantitative estratte nella pratica clinica. Una vasta quantità di letteratura neuroscientifica ha riportato alterazioni neuroanatomiche correlate al BD, sebbene le prove siano frammentate. L’utilizzo di tecniche di Machine Learning (ML), come metodo statistico multivariato, è diventato un approccio ampiamente utilizzato per studiare i marcatori biologici e costruire modelli predittivi per la diagnosi clinica di specifichi patologie. Tuttavia, tali tecniche sono associate a specifiche limitazioni proprio relative alla modalità operative di tipo “black-box”, a scatola nera, che rende i processi computazioni e i meccanismi di predizione di specifiche patologie non totalmente trasparenti. In questo studio, per la prima volta, verrà sperimentato un approccio alternativo per la detezione automatica di BD, basato su dati di neuroimaging strutturale, utilizzando un modello normativo basato su Autoencoder (AE), addestrato esclusivamente su dati di controlli sani (HC) privi di fattori confondenti. Abbiamo utilizzato un set di dati 3T strutturale di risonanza magnetica (sMRI) composto da 605 HC e 558 BD, da cui abbiamo estratto le caratteristiche morfologiche del cervello e progettiamo un framework di convalida sia interno che esterno, per valutare il potere discriminativo e la generalizzabilità del modello. Per eliminare gli effetti confondenti nei dati sMRI, abbiamo confrontato diverse opzioni di armonizzazione dei dati multicentrici utilizzando il toolbox di ComBat combinato con la correzione di covariate biologiche. Concludiamo che la stima e la rimozione degli effetti centro ottenuta da ComBat esclusivamente nel training set, tramite un framework CV, porta a un'efficace armonizzazione nel training, test set e dataset esterno indipendente. Dopo essere stato addestrato e testato sui dati HC, il modello AE è stato impiegato in un framework di rilevamento delle anomalie sui dati BD, utilizzando l'errore di ricostruzione per individuare i soggetti che deviano dal modello normativo, ottenendo un AUC di 0,51 per la discriminazione del BD, utilizzando tutte le caratteristiche cerebrali. Con il modello proposto, si identificano quindi le caratteristiche neuroanatomiche dei BD che deviano rispetto al modello normativo (i.e., modellizzato su HC), per poi valutare il relativo potere discriminatorio, raggiungendo un'AUC di 0,61 nel dataset esterno indipendente, superiore all'AUC ottenuta con un approccio SVM tradizionale.

A multi-center normative deep learning approach for automatic detection of bipolar disorder patients based on neuroanatomy

WON SAMPAIO, INÊS
2021/2022

Abstract

Bipolar disorder (BD) is a chronic and disabling mood disorder, characterized by a heterogeneous clinical and symptomatological presentation and a diagnosis latency of 5 to 10 years. Identifying objective neurobiological markers for BD, such as those based on neuroimaging data, might help improve the diagnosis sensitivity by translating quantitative knowledge to clinical practice. A vast amount of neuroscientific literature has reported neuroanatomical alterations correlating with BD, although evidence is fragmented. Machine Learning (ML), as a multivariate statistical method, has become a widely used approach to investigate biological markers and build predictive models for clinical diagnosis. Nevertheless, limitations have hampered their development and application, such as the large number of cases required for the training process and the lack of domain relevance of most models, being characterized as “black box”, providing no insight into disease pathophysiology mechanisms. In the present study, for the first time, we experiment an alternative approach for the automatic detection of BD, based on structural neuroimaging data, using an Autoencoder-based (AE) normative model, trained solely on healthy controls’ (HC) data devoid of confounding factors. We use a multisite 3T structural Magnetic Resonance Imaging (sMRI) dataset composed of 605 HC and 558 BD, from which we extract brain morphological features and design both an internal and external validation framework, to evaluate the model’s discriminative power and generalizability. To eliminate confounding effects in the sMRI data, we compare different multisite data harmonization options using the ComBat tool combined with biological covariates correction. We conclude that estimating ComBat center effects solely in the training set, via a CV framework, leads to an effective harmonization of training, test, and external set. After being trained and tested on HC data, the AE model is employed in an anomaly detection framework on BD data, using the reconstruction error to spot deviating samples, achieving an AUC of 0.51 for BD discrimination, using all brain features. With the proposed model, we then identify BD neuroanatomical deviating features and assess if they help increase the discriminatory power, achieving an AUC of 0.61 in the external set, higher than the AUC obtained in a traditional SVM approach.
BRAMBILLA, PAOLO
TASSI, EMMA
ING - Scuola di Ingegneria Industriale e dell'Informazione
22-lug-2022
2021/2022
Il disturbo bipolare (BD) è un disturbo dell'umore cronico e invalidante, caratterizzato da una presentazione clinica e sintomatologica eterogenea e da una latenza della diagnosi che si stima dai 5 ai 10 anni. L'identificazione di marcatori neurobiologici oggettivi relativi al BD, come quelli basati sui dati di neuroimaging, potrebbero aiutare a migliorare la qualità della diagnosi traducendo le conoscenze quantitative estratte nella pratica clinica. Una vasta quantità di letteratura neuroscientifica ha riportato alterazioni neuroanatomiche correlate al BD, sebbene le prove siano frammentate. L’utilizzo di tecniche di Machine Learning (ML), come metodo statistico multivariato, è diventato un approccio ampiamente utilizzato per studiare i marcatori biologici e costruire modelli predittivi per la diagnosi clinica di specifichi patologie. Tuttavia, tali tecniche sono associate a specifiche limitazioni proprio relative alla modalità operative di tipo “black-box”, a scatola nera, che rende i processi computazioni e i meccanismi di predizione di specifiche patologie non totalmente trasparenti. In questo studio, per la prima volta, verrà sperimentato un approccio alternativo per la detezione automatica di BD, basato su dati di neuroimaging strutturale, utilizzando un modello normativo basato su Autoencoder (AE), addestrato esclusivamente su dati di controlli sani (HC) privi di fattori confondenti. Abbiamo utilizzato un set di dati 3T strutturale di risonanza magnetica (sMRI) composto da 605 HC e 558 BD, da cui abbiamo estratto le caratteristiche morfologiche del cervello e progettiamo un framework di convalida sia interno che esterno, per valutare il potere discriminativo e la generalizzabilità del modello. Per eliminare gli effetti confondenti nei dati sMRI, abbiamo confrontato diverse opzioni di armonizzazione dei dati multicentrici utilizzando il toolbox di ComBat combinato con la correzione di covariate biologiche. Concludiamo che la stima e la rimozione degli effetti centro ottenuta da ComBat esclusivamente nel training set, tramite un framework CV, porta a un'efficace armonizzazione nel training, test set e dataset esterno indipendente. Dopo essere stato addestrato e testato sui dati HC, il modello AE è stato impiegato in un framework di rilevamento delle anomalie sui dati BD, utilizzando l'errore di ricostruzione per individuare i soggetti che deviano dal modello normativo, ottenendo un AUC di 0,51 per la discriminazione del BD, utilizzando tutte le caratteristiche cerebrali. Con il modello proposto, si identificano quindi le caratteristiche neuroanatomiche dei BD che deviano rispetto al modello normativo (i.e., modellizzato su HC), per poi valutare il relativo potere discriminatorio, raggiungendo un'AUC di 0,61 nel dataset esterno indipendente, superiore all'AUC ottenuta con un approccio SVM tradizionale.
File allegati
File Dimensione Formato  
2022_07_Won_Sampaio_01.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 6.57 MB
Formato Adobe PDF
6.57 MB Adobe PDF Visualizza/Apri
2022_07_Won_Sampaio_02.pdf

accessibile in internet per tutti

Descrizione: Executive Summary
Dimensione 769.99 kB
Formato Adobe PDF
769.99 kB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/190340