The main purpose of this thesis was the optimization of a workflow for the radiomic analysis of Magnetic Resonance Images (MRI) acquired with uncontrolled image acquisition protocols. The secondary aim was the application of the optimized workflow to build prognostic models for Overall Survival (OS) for Head and Neck Cancer (HNC) and Soft Tissue Sarcoma (STS), in order to show the feasibility of using radiomics in multicentric and/or multiprotocol datasets. The first part of the work focused on a series of stability analyses performed using a virtual phantom (BrainWeb). The aim of these studies was two-fold: 1) to evaluate the effect of image preprocessing on the stability to imaging-related variability; 2) to select the features that are stable to such variations, in order to use them for the following analysis. Intensity standardization, image denoising, voxel size resampling and bias field correction were considered as potentially useful preprocessing steps. Intraclass Correlation Coefficient (ICC) was used to quantify features stability, and features with ICC>0.75 were considered stable. All the preprocessing steps (Gaussian filtering, N4ITK Bias field correction, B-spline spatial resampling and intensity standardization) had positive effects in increasing the stability of radiomic features. When including all the previous preprocessing step, 550 features, based on both T1-weighted (T1w) and T2-weighted (T2w) MRI were identified as stable, out of a total of 1072 (536 per image type). Stability to uncertainties of the region of interest (ROI) was also investigated. Two sources of variability were considered: multiple segmentation and geometrical transformations of the ROI. Both tests were performed on real images of STS and HNC, considering T1w, T2w and apparent diffusion coefficient maps (ADC). In each test, features with ICC>0.75 were considered stable. In total, 701 and 1057 features out of 1608 were stable for HNC and STS respectively. After properly combining these stable features sets with the results previously obtained on the BrainWeb dataset, the number of stable features was reduced to 410 and 617. These two sets of features were used for successive studies. The postprocessing of the features was also optimized. In particular, features normalization and feature selection/dimensionality reduction were optimized in order to maximize the performance of a Cox proportional hazard regression model. Four different features normalization algorithms and 2 different features selection pipelines were tested. Harrell’s C-index was used to quantify the models performance. It was found that the combination of Z-score normalization and a series of different features selection (pairwise correlation and cross-validated Multivariate-Cox) lead to the best performance in a retrospective multi-centric HNC dataset (C-index 0.67). After the optimization based on the results of the previous analyses, the radiomic workflow was used to identify signatures that were prognostic of OS in HNC and STS. In HNC, a five-features radiomic signature had a good prognostic value in both cross-validation (C-index 0.67) and independent validation (C-index 0.63) and in both cases the radiomic features improved the prognosis when added to the clinical ones (from 0.67 to 0.69 and from 0.69 to 0.72 for the cross-validation and independent validation respectively). Similar results were found after cross-validation of a radiomic model in STS (C-index 0.74, 0.74 and 0.78 for the radiomic, clinical and combined model). The results show that with the right processing, radiomic analysis from non-standardized images is possible and provides a consistent improvement in the prognostic performance of survival model for OS.

Lo scopo principale della tesi è stato l’ottimizzazione di un workflow per l’analisi radiomica di immagini di risonanza magnetica (MRI, dall’inglese Magnetic Resonance Imaging) acquisite senza alcun protocollo di acquisizione controllato. Obiettivo secondario è stato l’applicazione del workflow ottimizzato per la creazione di modelli prognostici per la sopravvivenza generica (OS, dall’inglese Overall Survival) in pazienti affetti da tumori di testa e collo (HNC, dall’inglese Head and Neck Cancer) o da sarcomi dei tessuti molli (STS, dall’inglese Soft Tissue Sarcoma), per mostrare la fattibilità dell’utilizzo della radiomica su dataset multicentrici e multiprotocollo. La prima parte del lavoro ha riguardato lo svolgimento di una serie di analisi di stabilità con dei fantocci virtuali (BrainWeb). Lo scopo di queste analisi era duplice: 1) valutare l’effetto del preprocessing delle immagini sulla stabilità alle variazioni dovute all’imaging; 2) selezionare delle features radiomiche che siano stabili a queste variazione, per poterle usare per le analisi successive. Standardizzazione delle intensità, rimozione del rumore, ricampionamento a risoluzione comune e correzione delle inomogeneità sono stati considerati come potenziali passaggi di preprocessing. Il coefficiente di correlazione intra-classe (ICC, dall’inglese Intra-class Correlation Coefficient) è stato utilizzato per quantificare la stabilità delle features, con le features con ICC>0.75 considerate stabili. Tutti i passaggi di preprocessing (filtraggio Gaussiano, N4ITK per la correzione delle inomogeneità di campo, ricampionamento spaziale e standardizzazione delle intensità) hanno aumentato la stabilità delle features. Includendo tutti i passaggi di preprocessing soprariportati, e considerando immagini T1-pesate e T2-pesate (T1w e T2w dall’inglese T1-weighted e T2-weighted), 550 features su un totale di 1072 features (536 per tipo di immagine) sono state considerate stabili. È stata valutata anche la stabilità a piccole variazioni della regione di interesse (ROI, dall’inglese Region Of Interest). Sono state considerate due diverse fonti di variabilità: segmentazioni multiple e trasformazioni geometriche della ROI. Entrambi i test sono stati svolti separatamente su STS e HNC considerano immagini T1w, T2w e mappe di coefficiente di diffusione apparente (ADC, dall’inglese Apparent Diffusion Coefficient). In ogni test, le features con ICC>0.75 sono state considerate stabili. In totale, 701 e 1057 features su 1608 sono risultate stabili, rispettivamente per HNC e STS. Combinando le liste di features stabili ai parametri di imaging e alle modificazioni della ROI, 410 e 617 features sono risultate stabili a entrambe le fonti di variabilità. Questi due set di features sono poi stati usati per le analisi future. Anche il postprocessing delle features è stato ottimizzato. In particolare, gli algoritmi di normalizzazione e selezione delle features sono stati ottimizzati per massimizzare la performance prognostica di un modello di Cox. In totale sono state testate 8 combinazioni di quattro algoritmi di normalizzazione e 2 metodologie di selezione delle features. Si è visto che la combinazione di Z-score e selezione delle features basata sulla significatività (correlazione tra features e Cox multivariato) è quella che massimizza la performance del modello radiomico su un dataset HNC multicentrico (C-index 0.67). Dopo l’ottimizzazione basata sui risultati delle analisi precedenti, il workflow radiomico è stato utilizzato per identificare delle signature prognostiche per OS in HNC e STS. Nel caso di HNC, una signature di 5 features ha fornito una buona performance prognostica sia in cross-validazione (C-index 0.67) che in una validazione esterna (C-index 0.67). In entrambi i casi l’aggiunta delle features radiomiche migliorava la performance dei modelli prognostici basate sulle sole variabili cliniche (da 0.67 a 0.69 e da 0.69 a 0.72, rispettivamente per la cross-validazione e la validazione esterna). Analoghi risultati sono stati trovati per la cross-validazione di un modello radiomico allenato su un dataset STS (C-index 0.74, 0.74 e 0.78, rispettivamente per il modello radiomico, clinico e combinato). I risultati qui descritti mostrano come, utilizzando un adeguato preprocessing, l’analisi radiomica da immagini non standardizzate possa comunque fornire un miglioramento consistente nella performance dei modelli prognostici per OS.

MRI-based radiomic analysis of rare tumors: optimization of a workflow for retrospective and multicentric studies

BOLOGNA, MARCO

Abstract

The main purpose of this thesis was the optimization of a workflow for the radiomic analysis of Magnetic Resonance Images (MRI) acquired with uncontrolled image acquisition protocols. The secondary aim was the application of the optimized workflow to build prognostic models for Overall Survival (OS) for Head and Neck Cancer (HNC) and Soft Tissue Sarcoma (STS), in order to show the feasibility of using radiomics in multicentric and/or multiprotocol datasets. The first part of the work focused on a series of stability analyses performed using a virtual phantom (BrainWeb). The aim of these studies was two-fold: 1) to evaluate the effect of image preprocessing on the stability to imaging-related variability; 2) to select the features that are stable to such variations, in order to use them for the following analysis. Intensity standardization, image denoising, voxel size resampling and bias field correction were considered as potentially useful preprocessing steps. Intraclass Correlation Coefficient (ICC) was used to quantify features stability, and features with ICC>0.75 were considered stable. All the preprocessing steps (Gaussian filtering, N4ITK Bias field correction, B-spline spatial resampling and intensity standardization) had positive effects in increasing the stability of radiomic features. When including all the previous preprocessing step, 550 features, based on both T1-weighted (T1w) and T2-weighted (T2w) MRI were identified as stable, out of a total of 1072 (536 per image type). Stability to uncertainties of the region of interest (ROI) was also investigated. Two sources of variability were considered: multiple segmentation and geometrical transformations of the ROI. Both tests were performed on real images of STS and HNC, considering T1w, T2w and apparent diffusion coefficient maps (ADC). In each test, features with ICC>0.75 were considered stable. In total, 701 and 1057 features out of 1608 were stable for HNC and STS respectively. After properly combining these stable features sets with the results previously obtained on the BrainWeb dataset, the number of stable features was reduced to 410 and 617. These two sets of features were used for successive studies. The postprocessing of the features was also optimized. In particular, features normalization and feature selection/dimensionality reduction were optimized in order to maximize the performance of a Cox proportional hazard regression model. Four different features normalization algorithms and 2 different features selection pipelines were tested. Harrell’s C-index was used to quantify the models performance. It was found that the combination of Z-score normalization and a series of different features selection (pairwise correlation and cross-validated Multivariate-Cox) lead to the best performance in a retrospective multi-centric HNC dataset (C-index 0.67). After the optimization based on the results of the previous analyses, the radiomic workflow was used to identify signatures that were prognostic of OS in HNC and STS. In HNC, a five-features radiomic signature had a good prognostic value in both cross-validation (C-index 0.67) and independent validation (C-index 0.63) and in both cases the radiomic features improved the prognosis when added to the clinical ones (from 0.67 to 0.69 and from 0.69 to 0.72 for the cross-validation and independent validation respectively). Similar results were found after cross-validation of a radiomic model in STS (C-index 0.74, 0.74 and 0.78 for the radiomic, clinical and combined model). The results show that with the right processing, radiomic analysis from non-standardized images is possible and provides a consistent improvement in the prognostic performance of survival model for OS.
ALIVERTI, ANDREA
GASTALDI, DARIO
24-giu-2020
Lo scopo principale della tesi è stato l’ottimizzazione di un workflow per l’analisi radiomica di immagini di risonanza magnetica (MRI, dall’inglese Magnetic Resonance Imaging) acquisite senza alcun protocollo di acquisizione controllato. Obiettivo secondario è stato l’applicazione del workflow ottimizzato per la creazione di modelli prognostici per la sopravvivenza generica (OS, dall’inglese Overall Survival) in pazienti affetti da tumori di testa e collo (HNC, dall’inglese Head and Neck Cancer) o da sarcomi dei tessuti molli (STS, dall’inglese Soft Tissue Sarcoma), per mostrare la fattibilità dell’utilizzo della radiomica su dataset multicentrici e multiprotocollo. La prima parte del lavoro ha riguardato lo svolgimento di una serie di analisi di stabilità con dei fantocci virtuali (BrainWeb). Lo scopo di queste analisi era duplice: 1) valutare l’effetto del preprocessing delle immagini sulla stabilità alle variazioni dovute all’imaging; 2) selezionare delle features radiomiche che siano stabili a queste variazione, per poterle usare per le analisi successive. Standardizzazione delle intensità, rimozione del rumore, ricampionamento a risoluzione comune e correzione delle inomogeneità sono stati considerati come potenziali passaggi di preprocessing. Il coefficiente di correlazione intra-classe (ICC, dall’inglese Intra-class Correlation Coefficient) è stato utilizzato per quantificare la stabilità delle features, con le features con ICC>0.75 considerate stabili. Tutti i passaggi di preprocessing (filtraggio Gaussiano, N4ITK per la correzione delle inomogeneità di campo, ricampionamento spaziale e standardizzazione delle intensità) hanno aumentato la stabilità delle features. Includendo tutti i passaggi di preprocessing soprariportati, e considerando immagini T1-pesate e T2-pesate (T1w e T2w dall’inglese T1-weighted e T2-weighted), 550 features su un totale di 1072 features (536 per tipo di immagine) sono state considerate stabili. È stata valutata anche la stabilità a piccole variazioni della regione di interesse (ROI, dall’inglese Region Of Interest). Sono state considerate due diverse fonti di variabilità: segmentazioni multiple e trasformazioni geometriche della ROI. Entrambi i test sono stati svolti separatamente su STS e HNC considerano immagini T1w, T2w e mappe di coefficiente di diffusione apparente (ADC, dall’inglese Apparent Diffusion Coefficient). In ogni test, le features con ICC>0.75 sono state considerate stabili. In totale, 701 e 1057 features su 1608 sono risultate stabili, rispettivamente per HNC e STS. Combinando le liste di features stabili ai parametri di imaging e alle modificazioni della ROI, 410 e 617 features sono risultate stabili a entrambe le fonti di variabilità. Questi due set di features sono poi stati usati per le analisi future. Anche il postprocessing delle features è stato ottimizzato. In particolare, gli algoritmi di normalizzazione e selezione delle features sono stati ottimizzati per massimizzare la performance prognostica di un modello di Cox. In totale sono state testate 8 combinazioni di quattro algoritmi di normalizzazione e 2 metodologie di selezione delle features. Si è visto che la combinazione di Z-score e selezione delle features basata sulla significatività (correlazione tra features e Cox multivariato) è quella che massimizza la performance del modello radiomico su un dataset HNC multicentrico (C-index 0.67). Dopo l’ottimizzazione basata sui risultati delle analisi precedenti, il workflow radiomico è stato utilizzato per identificare delle signature prognostiche per OS in HNC e STS. Nel caso di HNC, una signature di 5 features ha fornito una buona performance prognostica sia in cross-validazione (C-index 0.67) che in una validazione esterna (C-index 0.67). In entrambi i casi l’aggiunta delle features radiomiche migliorava la performance dei modelli prognostici basate sulle sole variabili cliniche (da 0.67 a 0.69 e da 0.69 a 0.72, rispettivamente per la cross-validazione e la validazione esterna). Analoghi risultati sono stati trovati per la cross-validazione di un modello radiomico allenato su un dataset STS (C-index 0.74, 0.74 e 0.78, rispettivamente per il modello radiomico, clinico e combinato). I risultati qui descritti mostrano come, utilizzando un adeguato preprocessing, l’analisi radiomica da immagini non standardizzate possa comunque fornire un miglioramento consistente nella performance dei modelli prognostici per OS.
Tesi di dottorato
File allegati
File Dimensione Formato  
Marco_Bologna_XXXII Cycle_PhD_Thesis_Revised.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 15.98 MB
Formato Adobe PDF
15.98 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/169162