Introduction Oropharyngeal cancer is the eighth most common type of cancer. Most of oropharyngeal cancers (around 90%) are squamous cell carcinomas that develop in the epithelial lining of the base of the tongue and the back of the throat. Today the patient's prognosis for oropharyngeal cancer is based on the TNM system (version VIII), which defines staging related to the spread of cancer in the site of origin, in the lymph nodes and in other body areas, forming metastases. The 5-year survival for this pathology is 65%, but this value fluctuates widely based on the presence of other risk factors, such as smoking consumption and whether the tumor is caused by human papillomavirus (HPV+) or not (HPV-). Further studies have been carried out to develop new tools for the creation of prognostic models based on information extracted from clinical images that are commonly acquired throughout the entire process of cancer management (diagnosis, treatment planning, follow-up). These new tools include radiomics, defined as the analysis of medical images through mathematical methods to obtain quantitative information that can be used in clinical field. However, despite having proven their predictive power, radiomics is still being researched and needs to be perfected. Aim of the project The aim of this thesis was to develop a prognostic model based on radiomic data extracted from MRI images to evaluate the probability of overall survival (OS) of patients with oropharyngeal cancer, by analyzing some critical aspects, like features stability, and by optimizing the workflow such as features normalization and features selection. In the first part, a variability analysis was performed on virtual phantoms to assess the vulnerability of the radiomic features extracted from MRI images to variations in image acquisition parameters. The effect of intensity standardization and voxel size resampling on features stability was evaluated and a set of stable features was identified. The radiomic features were then used in the second part of the thesis work to optimize a combination of normalization algorithms and feature selection in order to develop a radiomic-based survival model, whose prognostic performance was assessed with internal cross-validation techniques. The performance of the radiomic model was then compared with that of a model based on clinical data and that of a model created by combining the two types of data. Stability analysis of radiomic features: materials and methods The variability analysis was used to assess the stability of the radiomic features with respect to the following image acquisition parameters: time of echo (TE), time of repetition (TR), pixel spacing (PS) and slice thickness (ST). To achieve this, several T1-weighted (T1w) and T2-weighted (T2w) MRI images were created from quantitative maps of T1, T2 and proton-density (PD). The maps were estimated in MATLAB by solving an inverse problem on a set of 3 different spin-echo MRI obtained using the virtual MRI simulator BrainWeb. Based on these maps, 6 datasets were created for T1w and T2w images (3 datasets each). The first type of dataset included 42 T1w and 48 T2w images with uniform spatial values, but variable TR/TE, allowing to perform a bivariate stability analysis of the features in the original images and in the images following 3 intensity standardization algorithms (Z-score, Linear mapping and Histogram Matching). The second type of dataset included 28 T1w and 28 T2w images and was used to study the stability of the features calculated on images obtained with fixed TR/TE values but with variable spatial resolution, and the effects of applying a linear resampling algorithm to an isotropic resolution. The third type of dataset included 50 T1w and 50 T2w images, obtained by combining the two previous sources of variability and allowed to evaluate the effect of both the intensity standardization and spatial resampling algorithms. On each image, three arbitrary regions of interest (ROIs) were segmented with different levels of heterogeneity, and for each of them the radiomic features with a MATLAB wrapper of the Pyradiomics software. The extracted features can be divided into the Shape, First Order, Gray level co-occurence matrix (GLCM) and Grey-level run length matrix (GLRLM) classes, which were calculated both the original images and on the 8 first level wavelets decompositions, for a total of 536 features for each image type (T1w or T2w). The intra-class correlation coefficient (ICC) was calculated for each feature, to quantify its stability. ICC was also used to classify features based on their stability. The stable feature group includes only the features that were stable (ICC>0.75) in the two bivariate analyzes and in the quadrivariate analysis. Stability analysis of radiomic features: results The results of the variability analysis showed that image pre-processing such as intensity standardization and spatial resampling improved the stability of radiomic features. The application of an intensity standardization algorithm significantly improved the stability of First Order features to changes in TR/TE, especially for T1w images (p = 8.12*10-6). For textural features, both GLCM and GLRLM groups did not show significant improvements in stability after the resampling. In general, GLCM-based features appeared to be more stable to variations in TR/TE than GLRLM-based features. There were no significant differences among the different normalization techniques. Spatial resampling improved the stability of Shape features, which reach maximum value of stability after resampling (ICC=1). For the other groups, there is a general trend of improvement for all groups of both T1w and T2w images, which becomes significant for the wavelets group (p = 1.53*10-12). In the quadrivariate analysis, the effects of the combined algorithms show that Shape features reach maximum stability due to the resampling, while GLCM group is the least affected by pre-processing showing no differences compared to the original images. For the other classes there were differences between the two kind of images. In T1w ones First order, GLRLM and wavelets classes show a significant improvement due to pre-processing (p = 1.10*10-3) while for T2w images there is a trend of improvement for GLRLM group that becomes significant for First Order and Wavelets groups. Since there was no evidence that an intensity standardization algorithm proved significantly better among the different types in terms of stability of the radiomic features, so it was decided to use the linear mapping for the successive analyses, due to the easy implementability. When using the selected pre-processing pipeline (linear mapping of intensities and spatial resampling), the number of features that were stable for all the analyses was 133 and 152 for T1w and T2w images respectively. Radiomics-based survival analysis: materials and methods In total, 201 oropharyngeal cancer patients from a multicenter study were used for this analysis. For each patient, two acquisitions T1w and T2w were acquired using a turbo spin-echo pulse sequence. The images were then processed according to the methods identified in the first part of the thesis, with a resampling algorithm at an isotropic resolution of 3 mm and with a linear mapping gray intensity normalization algorithm. A main ROI that identifies the tumor and a secondary ROI that includes the largest affected lymph node, if available, were segmented manually by a radiologist. An initial set of 536 features was extracted for each combination of MRI image (T1w or T2w) and ROI (tumor or lymph node) for a total of 2144 features. After selecting the stable features set identified in the previous analysis, the number of features was reduced to 570. Clinical data have also been provided for each patient such as the patient's status (alive/dead at the end of the follow-up), the follow-up time and the value of the TNM VIII stage. The radiomic features were used to train a Cox proportional hazard regression model for OS, to estimate the event-free probability to survive in function of time. A post-processing of the features was performed before model creation, including feature normalization and feature selection. To optimize the number of features of the model, a wrapper method with an internal cross-validation with 100 bootstrap iterations was used. Four different features normalization methods have been proposed: Z-score, Tanh, DBnorm preceded or followed by a normalization of the ranges of features carried out with the Z- score. DBnorm method allows to normalize features without altering their distribution unlike the other two more traditional methods but requires a statistical reference distribution, the estimate of which presents complexities. We have proceeded with the evaluation of three feature selection algorithms: Principal Component Analysis (PCA); Maximum relevance minimum redundancy (MRmR) based on the correlation coefficient with the time of survival; a modified MRmR (MRmR_CI) to calculate the relevance value of a feature using the Harrel’s Concordance Index (C-index). This parameter is particularly suitable for survival analyses because it allows to evaluate the predictive value of an element in relation to survival time and taking patient censorship into consideration, but its insertion involves a high computational cost. In this case, therefore, there is a step of feature reduction with Principal Component Analysis, maintaining the components that explain 90% of the overall variance of the data. To identify the best post-processing combination, for each of them a cross-validation with thirty train/validation multiple splits were performed, using as quality metric the C-index. To understand the effects of feature selection and normalization algorithms on the 12 distributions of C-index we used a two -way repeated measures ANOVA test. Once the best post-processing procedure was identified, we did a definitive validation of optimal models. Where possible, we used Leave-One-Out Cross-Validation (LOOCV) to maximize the size of the validation (if a DBnorm normalization was not necessary). Otherwise, a multiple train/validation split was used instead. In the first case for the patients of the validation set it was possible to obtain an unbiased signature and a classification in high and low risk based on the median of the signature values. To evaluate the performance of the models, the validation Concordance index was calculated based on the value of the signature of each patient and their value of OS. Confidence intervals for C-index were estimated trough bootstrap (100 iterations). The log rank test was used to evaluate the significance of the Kaplan Maier curves of the risk classes (high/low risk) defined by radiomics (based on thresholding of the radiomic signature). The performance of the radiomic model was compared with the predictive power of the TNM VIII stage, evaluating its value like if it’s a signature for the patient enabling to calculate a value of C-index and two Kaplan Maier curves between the patients with I-III and the patients with stage IV, the one at highest risk. Eventually, we combined radiomic and clinical data to build a model following the steps used for the radiomic one to evaluate the addictive gain that radiomic data could provide to build prognostic models for OS. Radiomics-based survival analysis: results The two-way ANOVA test results show that there is no interaction between the effects of the normalization and feature selection algorithms, with a p-value = 0.80. The two separate effects show that the MRmR_CI shows better performance for feature selection algorithms, while for the normalization algorithms, Z-score, Tanh and DB_norm+Z-score were equivalent. Z-score and Tanh were considered for the successive analyses, due to simplicity of application and implementation. Also, the validation of the optimal radiomic models was performed using LOOCV, to maximize the size of the validation set. The optimal radiomic models obtained have good performances. The Z-score+MRmR_CI model showed a C-index = 0.62 ± 0.08 but caused a non-significant split of the Kaplan-Meier curves (p-value = 0.19); the Tanh+MRmR_CI showed better performance, with a C-index = 0.66 ± 0.08 and a p-value = 0.02 for the log rank test. The clinical model based on the TNM staging confirmed the predictive power of the clinical data, with C-index = 0.73 ± 0.06 and p= 1.82*10-5 for the log-rank test. By integrating the radiomic data in a radiomic-clinical model an improvement of the prognostic performance was observed (C-index = 0.75 ± 0.06 and C-index = 0.77 ± 0.06 for the models based on Z-score and Tanh respectively). Both models caused significant split in the survival for high and low risk curves (log-rank test p-value 1.82*10-5 and 3.17*10-5 for the models based on Z-score and Tanh respectively). Conclusions This thesis offers an innovative analysis of the implementation of a radiomic workflow for survival analysis of patients with oropharyngeal cancer, where stability evaluation of the features and optimization of features normalization and features selection were performed. The results demonstrated the prognostic power of radiomics, confirming the results obtained so far in literature also for oropharyngeal cancer. The presented results highlight the potential of the application of radiomics as a non-invasive, low cost, prognostic tool for OS in patients with oropharyngeal cancer.

Introduzione Il cancro all’orofaringe è l’ottavo tipo di cancro più diffuso. La maggior parte dei tumori all’orofaringe (circa il 90%) sono carcinomi a cellule squamose che si sviluppano nel rivestimento epiteliale della base della lingua e del retro della gola. Attualmente la prognosi del paziente per il cancro all’orofaringe si determina sulla base del sistema TNM (versione VIII), che definisce la stadiazione sulla base della diffusione del cancro nel sito di origine, nei linfonodi e in altri distretti corporei. La sopravvivenza a 5 anni è del 65%, ma questo valore oscilla ampiamente in base alla presenza di altri fattori di rischio, quali il consumo di fumo e il fatto che il tumore sia causato dal papillomavirus (HPV+) or meno (HPV-). Ulteriori studi sono stati effettuati per sviluppare nuovi strumenti per la creazione di modelli prognostici basati sull’informazione estratta dalle immagini cliniche che vengono comunemente acquisite durante il processo di gestione del cancro (diagnosi, pianificazione del trattamento e follow-up). Questi nuovi strumenti rientrano nel campo della radiomica, definita come l’analisi di immagini mediche attraverso metodi matematici al fine di ottenere informazioni di tipo quantitativo utilizzabili in ambito clinico. Tuttavia, nonostante studi preliminari ne abbiano rivelato l’alto potenziale, la radiomica è ancora in fase di studio e deve essere perfezionata. Scopo del progetto L’obiettivo di questa tesi è stato sviluppare un modello prognostico basato su dati radiomici estratti da immagini MRI per valutare la probabilità di sopravvivenza generica (OS dall’inglese overall survival) di pazienti affetti da tumore all’orofaringe, analizzando alcuni aspetti critici, come la stabilità delle feature, e ottimizzando dei passaggi del workflow come la normalizzazione delle feature e la selezione delle feature. Nella prima parte è stata effettuata un’analisi di variabilità su dei phantom virtuali per valutare la vulnerabilità delle feature radiomiche estratte da immagini MRI rispetto a variazioni nei parametri di acquisizione delle immagini. È stato quindi valutato l’effetto di un algoritmo di normalizzazione dell’intensità e di ricampionamento della dimensione dei voxel sulla stabilità delle feature, andando a identificare un gruppo di feature stabili. Le feature radiomiche sono state quindi utilizzate nella seconda parte del lavoro di tesi per ottimizzare una combinazione di algoritmi di normalizzazione e feature selection al fine di sviluppare un modello prognostico per OS basato sulla radiomica, la cui performance prognostica è stata valutata con delle tecniche di cross-validazione interna. Le prestazioni del modello radiomico sono state quindi confrontate con quelle di un modello basato esclusivamente su dati clinici e su un modello creato combinando i due tipi di dati. Analisi di stabilità delle feature radiomiche: materiali e metodi L’analisi di variabilità è stata usata per valutare la stabilità delle feature radiomiche rispetto ai seguenti parametri di acquisizione: tempo di eco (TE, dall’inglese time of echo), tempo di ripetizione (TR, dall’inglese time of repetition), dimensione dei pixel (PS, dall’inglese pixel spacing) e spessore di fetta (ST, dall’inglese slice thickness). Per realizzarla sono state create molteplici immagini MRI di tipo T1-pesato (T1w, dall’inglese T1-weighted) e T2-pesato (T2w, dall’inglese T2-weighted) ottenute tramite mappe quantitative dei parametri T1, T2 e densità protonica (PD, dall’inglese proton density). Le mappe sono state stimate con il software MATLAB risolvendo un problema inverso su un set di differenti acquisizioni MRI con sequenza Spin-echo ottenute usando un simulatore virtuale di immagini MRI, BrainWeb. Sulla base di queste mappe, sono stati creati 6 dataset per le immagini T1w e T2w (3 dataset ognuno). Il primo tipo di dataset comprende 42 immagini T1w e 48 immagini T2w con valori spaziali uniformi, ma valori di TR/TE variabili, permettendo di effettuare un’analisi di stabilità bivariata sulle feature nelle immagini originali e nelle immagini a seguito di tre algoritmi di normalizzazione dei livelli di grigio (Z-score, Linear mapping e Histogram Matching). Il secondo tipo di dataset comprende 28 immagini T1w e 28 immagini T2w ed è stato utilizzato per studiare la stabilità delle feature calcolate su immagini ottenute con TR/TE fissi ma con risoluzione spaziale variabile, e gli effetti dell’applicazione di un algoritmo di ricampionamento con interpolazione lineare a una risoluzione isotropica. Il terzo tipo di dataset include 50 immagini T1w e 50 immagini T2w, ottenute da una combinazione delle precedenti sorgenti di variabilità e ha permesso di valutare gli effetti dell’applicazione di entrambi gli algoritmi di normalizzazione dell’intensità e di ricampionamento. Su ogni immagine sono state segmentate tre ragioni di interesse (ROI, dall’inglese region of interest) arbitrarie con differenti livelli di eterogeneità, e per ognuna di esse sono state estratte le feature radiomiche con un wrapper MATLAB del software Pyradiomics. Le feature estratte possono essere divise nelle classi Shape, First Order, GLCM (dall’inglese Gray level co-occurence matrix) e GLRLM (dall’inglese Grey-level run length matrix), calcolate sia sulla MRI originale che sulle sue 8 decomposizioni wavelet di primo livello per un totale di 536 feature. Per ogni feature è stato calcolato il coefficiente di correlazione intra-classe (ICC, dall’inglese Intraclass Correlation Coefficient) per quantificarne la stabilità. Il gruppo di feature stabili include solo le feature che sono risultate stabili (ICC>0.75) nelle due analisi bivariate e nell’analisi quadrivariata. Analisi di stabilità delle feature radiomiche: risultati I risultati dell'analisi di variabilità hanno mostrato che il pre-processing dell'immagine con un algoritmo di standardizzazione dell'intensità e di ricampionamento spaziale ha migliorato la stabilità delle feature radiomiche. L’applicazione di un algoritmo di normalizzazione ha migliorato significativamente la stabilità delle feature First Order per variazioni dei valori di TR/TE, specialmente nelle immagini T1w (p = 8.12*10-6). Per quanto riguarda le feature texturali, entrambi i gruppi GLCM e GLRLM non hanno mostrato un miglioramento significativo nella stabilità dopo il ricampionamento. In generale, le feature del tipo GLCM risultano più stabili a variazioni dei parametri TR/TE rispetto alle feature del gruppo GLRLM. Non ci sono differenze significative tra i diversi algoritmi di normalizzazione. Il ricampionamento spaziale ha migliorato la stabilità delle feature Shape, che raggiungono il valore massimo di stabilità dopo il ricampionamento (ICC=1). Per gli altri gruppi, c’è una tendenza generale di miglioramento per tutti i gruppi sia per le immagini T1w che per le T2w, che diventa significativo per il gruppo wavelets (p = 1.53*10-12). Nell’analisi quadrivariata, gli effetti degli algoritmi combinati mostrano che le feature Shape raggiungono stabilità massima grazie al ricampionamento, mentre il gruppo GLCM risulta quello meno influenzato dal pre-processing mostrando poche differenze rispetto alle immagini originali. Nelle immagini T1w i gruppi First order, GLRLM e wavelets mostrano un miglioramento significativo grazie al pre-processing (p = 1.10*10-3) mentre per le immagini T2w si osserva una tendenza al miglioramento per il gruppo GLRLM che diventa significativo per i gruppi First Order e Wavelets. Visto che non è stata trovata nessuna evidenza che un algoritmo di normalizzazione delle intensità si è dimostrato migliore degli altri in termini di stabilità delle feature radiomiche, è stato deciso di usare l’algoritmo di linear mapping per le analisi successive, in base alla semplicità di implementazione. Usando i metodi selezionati (linear mapping per la normalizzazione delle intensità e ricampionamento spaziale), il numero di feature che sono risultate stabili sono 133 per le immagini T1w e 152 per le immagini T2w. Analisi di sopravvivenza basata su dati radiomici: materiali e metodi Per questa analisi sono stati utilizzati 201 pazienti affetti da tumore orofaringeo facenti parte di uno studio multicentrico. Per ciascun paziente sono state raccolte due acquisizioni T1w e T2w ottenute con sequenza turbo spin-eco. Le immagini sono state quindi processate secondo le modalità identificate nella prima parte del lavoro di tesi, ovvero con un algoritmo di ricampionamento ad una risoluzione isotropa di 3 mm e con un algoritmo di normalizzazione delle intensità di grigio di tipo linear mapping. Sono state segmentate manualmente da un radiologo una ROI principale che identifica il tumore e una ROI secondaria che include il linfonodo più grande interessato dal cancro, se presente. Un set iniziale di 536 feature è stato estratto per ogni combinazione di immagine MRI (T1w o T2w) e ROI (tumore o linfonodo) per un totale di 2144 feature. Dopo aver selezionato i set di feature stabili identificati nell’analisi precedente, il numero di feature è stato ridotto a 570. Per ogni paziente sono stati forniti anche dei dati clinici quali lo stato del paziente (vivo o morto alla fine dell’ultimo follow-up), il tempo di sopravvivenza e il valore dello stadio TNM VIII. Le feature radiomiche sono state utilizzate per trainare un modello di regressione di Cox per rischi proporzionali per la sopravvivenza, per identificare la probabilità di un paziente di sopravvivere libero da eventi in funzione del tempo. È stato effettuato un post-processing delle feature prima della creazione del modello che include un metodo di normalizzazione delle feature e di feature selection. Per ottimizzare il numero di feature del modello è stato usato un metodo wrapper con una cross-validazione interna con 100 iterazioni bootstrap. Sono stati proposti quattro diversi metodi di normalizzazione: Z-score, Tanh, DBnorm preceduto o seguito da uno step di normalizzazione del range delle feature effettuato con lo Z-score. Il metodo DBnorm permette di normalizzare le feature senza alterare la loro distribuzione a differenza degli altri due metodi più tradizionali, ma richiede una distribuzione statistica di riferimento su cui normalizzare i dati. Sono stati inoltre considerati tre diversi algoritmi di feature selection: Principal Component Analysis (PCA); Maximum Relevance minimum Redundancy (MRmR) basato sul coefficiente di correlazione; MRmR modificato (MRmR_CI) per calcolare il valore di rilevanza di una feature utilizzando il Concordance Index di Harrel (C-index). Questo parametro risulta particolarmente adatto per le analisi di sopravvivenza, perché permette di valutare il valore prognostico di un elemento in relazione al tempo di sopravvivenza tenendo in considerazione la censura dei pazienti, ma il suo inserimento comporta un alto costo computazionale. In questo caso è prevista quindi una riduzione del numero di feature con la PCA mantenendo le componenti che spiegano il 90% della varianza complessiva dei dati. Per identificare la migliore combinazione di post-processing, per ognuna delle 12 combinazioni (3 algoritmi di feature selection e 4 di normalizzazione) è stata effettuata una cross-validazione con 30 train/validation split multipli usando come metrica di qualità il C-index. Per identificare gli effetti degli algoritmi di normalizzazione e feature selection sulle 12 distribuzioni di C-index usando un test ANOVA a due vie per misure ripetute. Una volta identificata la migliore procedura di post-processing, abbiamo effettuato una validazione definitiva dei modelli ottimali. Laddove possibile, abbiamo usato la Leave-One-Out Cross-Validation per massimizzare la dimensione del dataset di validazione (se la normalizzazione DBnorm non era necessaria). Altrimenti viene utilizzata una cross-validazione del tipo train/validation split. Nel primo caso per i pazienti del dataset di validazione è stato possibile ottenere una signature non polarizzata e una classificazione in alto e basso rischio basata sulla mediana dei valori della signature. Per valutare le prestazioni dei modelli, è stato calcolato un C-index di validazione basato sui valori della signature di ogni paziente e i loro valori di tempo di sopravvivenza. Gli intervalli di confidenza per il C-index sono stati calcolati attraverso 100 iterazioni bootstrap. Il log rank test è stato usato per valutare la significatività delle curve di Kaplan Maier delle classi di rischio (alto/basso rischio) definito dalla radiomica (basate sul valore di soglia della signature radiomica). Le prestazioni del modello radiomico sono state confrontate con il potere predittivo dello stage TNM VIII, valutando il suo valore come se fosse una signature per il paziente permettendo di calcolare un valore di C-Index e due curve di Kaplan Maier tra i pazienti con un valore di stage da I a III e i pazienti con valore di stage pari a IV, che corrisponde con la probabilità di rischio maggiore. Infine, abbiamo combinato i dati radiomici e clinici per costruire un modello seguendo i passaggi usati per il modello radiomico per valutare il guadagno additivo che i dati radiomici possono fornire per la creazione di modelli di sopravvivenza. Analisi di sopravvivenza basata su dati radiomici: risultati I risultati del test ANOVA a due vie mostrano che non c’è interazione tra gli effetti degli algoritmi di normalizzazione e feature selection, con un p-value = 0,80. I due effetti separati mostrano che per gli algoritmi di feature selection MRmR_CI dimostra prestazioni migliori, mentre per gli algoritmi di normalizzazione, Z-score, Tanh and DB_norm+Z-score erano equivalenti. Per le successive analisi sono stati utilizzati i metodi Z-score e Tanh per la loro facilità di applicazione e implementazione. Inoltre, la validazione dei modelli radiomici ottimali è stata effettuata usando la LOOCV per massimizzare la dimensione del dataset di validazione. I modelli radiomici ottimali ottenuti hanno buone prestazioni. Il modello Z-score+MRmR_CI presenta un C-index = 0.62 ± 0.08 ma non presenta una divisione significativa delle curve di Kaplan-Meier (p-value = 0.19); il Tanh+MRmR_CI presenta prestazioni migliori, con un C-index = 0.66 ± 0.08 e un p-value = 0.02 per il log rank test. Il modello clinico basato sul valore di stage TNM VIII conferma il potere predittivo dei dati clinici, con un C-index = 0,73 ± 0,06 e un p-value = 1,8230e-05 per il log rank test. Integrando i dati radiomici in un modello radiomico-clinico è stato osservato un miglioramento delle performance prognostiche (C-index = 0.75 ± 0.06 e C-index = 0.77 ± 0.06 per il modello basato su rispettivamente Z-score e Tanh). Entrambi i modelli hanno presentato degli split significativi per le curve di alto e basso rischio (log-rank test p-value 1.82*10-5 e 3.17*10-5 per i modelli basati su rispettivamente Z-score and Tanh). Conclusioni Questa tesi offre un’analisi innovativa dell’implementazione di un workflow radiomico per lo studio della sopravvivenza di pazienti affetti da tumore orofaringeo, dove sono stati effettuati una valutazione di stabilità delle feature e un‘ottimizzazione degli algoritmi di normalizzazione delle feature e di feature selection. I risultati hanno dimostrato il potere prognostico della radiomica, confermando i risultati fino ad ora ottenuti in letteratura anche per il cancro orofaringeo. I risultati presentati evidenziano il potenziale delle applicazioni della radiomica come strumento prognostico non invasivo ed a basso costo per l’analisi di sopravvivenza di pazienti con tumore orofaringeo.

Sviluppo e validazione di una signature radiomica da immagini MRI per predire la sopravvivenza di pazienti affetti da tumore orofaringeo

MOIA, STEFANO
2018/2019

Abstract

Introduction Oropharyngeal cancer is the eighth most common type of cancer. Most of oropharyngeal cancers (around 90%) are squamous cell carcinomas that develop in the epithelial lining of the base of the tongue and the back of the throat. Today the patient's prognosis for oropharyngeal cancer is based on the TNM system (version VIII), which defines staging related to the spread of cancer in the site of origin, in the lymph nodes and in other body areas, forming metastases. The 5-year survival for this pathology is 65%, but this value fluctuates widely based on the presence of other risk factors, such as smoking consumption and whether the tumor is caused by human papillomavirus (HPV+) or not (HPV-). Further studies have been carried out to develop new tools for the creation of prognostic models based on information extracted from clinical images that are commonly acquired throughout the entire process of cancer management (diagnosis, treatment planning, follow-up). These new tools include radiomics, defined as the analysis of medical images through mathematical methods to obtain quantitative information that can be used in clinical field. However, despite having proven their predictive power, radiomics is still being researched and needs to be perfected. Aim of the project The aim of this thesis was to develop a prognostic model based on radiomic data extracted from MRI images to evaluate the probability of overall survival (OS) of patients with oropharyngeal cancer, by analyzing some critical aspects, like features stability, and by optimizing the workflow such as features normalization and features selection. In the first part, a variability analysis was performed on virtual phantoms to assess the vulnerability of the radiomic features extracted from MRI images to variations in image acquisition parameters. The effect of intensity standardization and voxel size resampling on features stability was evaluated and a set of stable features was identified. The radiomic features were then used in the second part of the thesis work to optimize a combination of normalization algorithms and feature selection in order to develop a radiomic-based survival model, whose prognostic performance was assessed with internal cross-validation techniques. The performance of the radiomic model was then compared with that of a model based on clinical data and that of a model created by combining the two types of data. Stability analysis of radiomic features: materials and methods The variability analysis was used to assess the stability of the radiomic features with respect to the following image acquisition parameters: time of echo (TE), time of repetition (TR), pixel spacing (PS) and slice thickness (ST). To achieve this, several T1-weighted (T1w) and T2-weighted (T2w) MRI images were created from quantitative maps of T1, T2 and proton-density (PD). The maps were estimated in MATLAB by solving an inverse problem on a set of 3 different spin-echo MRI obtained using the virtual MRI simulator BrainWeb. Based on these maps, 6 datasets were created for T1w and T2w images (3 datasets each). The first type of dataset included 42 T1w and 48 T2w images with uniform spatial values, but variable TR/TE, allowing to perform a bivariate stability analysis of the features in the original images and in the images following 3 intensity standardization algorithms (Z-score, Linear mapping and Histogram Matching). The second type of dataset included 28 T1w and 28 T2w images and was used to study the stability of the features calculated on images obtained with fixed TR/TE values but with variable spatial resolution, and the effects of applying a linear resampling algorithm to an isotropic resolution. The third type of dataset included 50 T1w and 50 T2w images, obtained by combining the two previous sources of variability and allowed to evaluate the effect of both the intensity standardization and spatial resampling algorithms. On each image, three arbitrary regions of interest (ROIs) were segmented with different levels of heterogeneity, and for each of them the radiomic features with a MATLAB wrapper of the Pyradiomics software. The extracted features can be divided into the Shape, First Order, Gray level co-occurence matrix (GLCM) and Grey-level run length matrix (GLRLM) classes, which were calculated both the original images and on the 8 first level wavelets decompositions, for a total of 536 features for each image type (T1w or T2w). The intra-class correlation coefficient (ICC) was calculated for each feature, to quantify its stability. ICC was also used to classify features based on their stability. The stable feature group includes only the features that were stable (ICC>0.75) in the two bivariate analyzes and in the quadrivariate analysis. Stability analysis of radiomic features: results The results of the variability analysis showed that image pre-processing such as intensity standardization and spatial resampling improved the stability of radiomic features. The application of an intensity standardization algorithm significantly improved the stability of First Order features to changes in TR/TE, especially for T1w images (p = 8.12*10-6). For textural features, both GLCM and GLRLM groups did not show significant improvements in stability after the resampling. In general, GLCM-based features appeared to be more stable to variations in TR/TE than GLRLM-based features. There were no significant differences among the different normalization techniques. Spatial resampling improved the stability of Shape features, which reach maximum value of stability after resampling (ICC=1). For the other groups, there is a general trend of improvement for all groups of both T1w and T2w images, which becomes significant for the wavelets group (p = 1.53*10-12). In the quadrivariate analysis, the effects of the combined algorithms show that Shape features reach maximum stability due to the resampling, while GLCM group is the least affected by pre-processing showing no differences compared to the original images. For the other classes there were differences between the two kind of images. In T1w ones First order, GLRLM and wavelets classes show a significant improvement due to pre-processing (p = 1.10*10-3) while for T2w images there is a trend of improvement for GLRLM group that becomes significant for First Order and Wavelets groups. Since there was no evidence that an intensity standardization algorithm proved significantly better among the different types in terms of stability of the radiomic features, so it was decided to use the linear mapping for the successive analyses, due to the easy implementability. When using the selected pre-processing pipeline (linear mapping of intensities and spatial resampling), the number of features that were stable for all the analyses was 133 and 152 for T1w and T2w images respectively. Radiomics-based survival analysis: materials and methods In total, 201 oropharyngeal cancer patients from a multicenter study were used for this analysis. For each patient, two acquisitions T1w and T2w were acquired using a turbo spin-echo pulse sequence. The images were then processed according to the methods identified in the first part of the thesis, with a resampling algorithm at an isotropic resolution of 3 mm and with a linear mapping gray intensity normalization algorithm. A main ROI that identifies the tumor and a secondary ROI that includes the largest affected lymph node, if available, were segmented manually by a radiologist. An initial set of 536 features was extracted for each combination of MRI image (T1w or T2w) and ROI (tumor or lymph node) for a total of 2144 features. After selecting the stable features set identified in the previous analysis, the number of features was reduced to 570. Clinical data have also been provided for each patient such as the patient's status (alive/dead at the end of the follow-up), the follow-up time and the value of the TNM VIII stage. The radiomic features were used to train a Cox proportional hazard regression model for OS, to estimate the event-free probability to survive in function of time. A post-processing of the features was performed before model creation, including feature normalization and feature selection. To optimize the number of features of the model, a wrapper method with an internal cross-validation with 100 bootstrap iterations was used. Four different features normalization methods have been proposed: Z-score, Tanh, DBnorm preceded or followed by a normalization of the ranges of features carried out with the Z- score. DBnorm method allows to normalize features without altering their distribution unlike the other two more traditional methods but requires a statistical reference distribution, the estimate of which presents complexities. We have proceeded with the evaluation of three feature selection algorithms: Principal Component Analysis (PCA); Maximum relevance minimum redundancy (MRmR) based on the correlation coefficient with the time of survival; a modified MRmR (MRmR_CI) to calculate the relevance value of a feature using the Harrel’s Concordance Index (C-index). This parameter is particularly suitable for survival analyses because it allows to evaluate the predictive value of an element in relation to survival time and taking patient censorship into consideration, but its insertion involves a high computational cost. In this case, therefore, there is a step of feature reduction with Principal Component Analysis, maintaining the components that explain 90% of the overall variance of the data. To identify the best post-processing combination, for each of them a cross-validation with thirty train/validation multiple splits were performed, using as quality metric the C-index. To understand the effects of feature selection and normalization algorithms on the 12 distributions of C-index we used a two -way repeated measures ANOVA test. Once the best post-processing procedure was identified, we did a definitive validation of optimal models. Where possible, we used Leave-One-Out Cross-Validation (LOOCV) to maximize the size of the validation (if a DBnorm normalization was not necessary). Otherwise, a multiple train/validation split was used instead. In the first case for the patients of the validation set it was possible to obtain an unbiased signature and a classification in high and low risk based on the median of the signature values. To evaluate the performance of the models, the validation Concordance index was calculated based on the value of the signature of each patient and their value of OS. Confidence intervals for C-index were estimated trough bootstrap (100 iterations). The log rank test was used to evaluate the significance of the Kaplan Maier curves of the risk classes (high/low risk) defined by radiomics (based on thresholding of the radiomic signature). The performance of the radiomic model was compared with the predictive power of the TNM VIII stage, evaluating its value like if it’s a signature for the patient enabling to calculate a value of C-index and two Kaplan Maier curves between the patients with I-III and the patients with stage IV, the one at highest risk. Eventually, we combined radiomic and clinical data to build a model following the steps used for the radiomic one to evaluate the addictive gain that radiomic data could provide to build prognostic models for OS. Radiomics-based survival analysis: results The two-way ANOVA test results show that there is no interaction between the effects of the normalization and feature selection algorithms, with a p-value = 0.80. The two separate effects show that the MRmR_CI shows better performance for feature selection algorithms, while for the normalization algorithms, Z-score, Tanh and DB_norm+Z-score were equivalent. Z-score and Tanh were considered for the successive analyses, due to simplicity of application and implementation. Also, the validation of the optimal radiomic models was performed using LOOCV, to maximize the size of the validation set. The optimal radiomic models obtained have good performances. The Z-score+MRmR_CI model showed a C-index = 0.62 ± 0.08 but caused a non-significant split of the Kaplan-Meier curves (p-value = 0.19); the Tanh+MRmR_CI showed better performance, with a C-index = 0.66 ± 0.08 and a p-value = 0.02 for the log rank test. The clinical model based on the TNM staging confirmed the predictive power of the clinical data, with C-index = 0.73 ± 0.06 and p= 1.82*10-5 for the log-rank test. By integrating the radiomic data in a radiomic-clinical model an improvement of the prognostic performance was observed (C-index = 0.75 ± 0.06 and C-index = 0.77 ± 0.06 for the models based on Z-score and Tanh respectively). Both models caused significant split in the survival for high and low risk curves (log-rank test p-value 1.82*10-5 and 3.17*10-5 for the models based on Z-score and Tanh respectively). Conclusions This thesis offers an innovative analysis of the implementation of a radiomic workflow for survival analysis of patients with oropharyngeal cancer, where stability evaluation of the features and optimization of features normalization and features selection were performed. The results demonstrated the prognostic power of radiomics, confirming the results obtained so far in literature also for oropharyngeal cancer. The presented results highlight the potential of the application of radiomics as a non-invasive, low cost, prognostic tool for OS in patients with oropharyngeal cancer.
BOLOGNA, MARCO
ING - Scuola di Ingegneria Industriale e dell'Informazione
6-giu-2020
2018/2019
Introduzione Il cancro all’orofaringe è l’ottavo tipo di cancro più diffuso. La maggior parte dei tumori all’orofaringe (circa il 90%) sono carcinomi a cellule squamose che si sviluppano nel rivestimento epiteliale della base della lingua e del retro della gola. Attualmente la prognosi del paziente per il cancro all’orofaringe si determina sulla base del sistema TNM (versione VIII), che definisce la stadiazione sulla base della diffusione del cancro nel sito di origine, nei linfonodi e in altri distretti corporei. La sopravvivenza a 5 anni è del 65%, ma questo valore oscilla ampiamente in base alla presenza di altri fattori di rischio, quali il consumo di fumo e il fatto che il tumore sia causato dal papillomavirus (HPV+) or meno (HPV-). Ulteriori studi sono stati effettuati per sviluppare nuovi strumenti per la creazione di modelli prognostici basati sull’informazione estratta dalle immagini cliniche che vengono comunemente acquisite durante il processo di gestione del cancro (diagnosi, pianificazione del trattamento e follow-up). Questi nuovi strumenti rientrano nel campo della radiomica, definita come l’analisi di immagini mediche attraverso metodi matematici al fine di ottenere informazioni di tipo quantitativo utilizzabili in ambito clinico. Tuttavia, nonostante studi preliminari ne abbiano rivelato l’alto potenziale, la radiomica è ancora in fase di studio e deve essere perfezionata. Scopo del progetto L’obiettivo di questa tesi è stato sviluppare un modello prognostico basato su dati radiomici estratti da immagini MRI per valutare la probabilità di sopravvivenza generica (OS dall’inglese overall survival) di pazienti affetti da tumore all’orofaringe, analizzando alcuni aspetti critici, come la stabilità delle feature, e ottimizzando dei passaggi del workflow come la normalizzazione delle feature e la selezione delle feature. Nella prima parte è stata effettuata un’analisi di variabilità su dei phantom virtuali per valutare la vulnerabilità delle feature radiomiche estratte da immagini MRI rispetto a variazioni nei parametri di acquisizione delle immagini. È stato quindi valutato l’effetto di un algoritmo di normalizzazione dell’intensità e di ricampionamento della dimensione dei voxel sulla stabilità delle feature, andando a identificare un gruppo di feature stabili. Le feature radiomiche sono state quindi utilizzate nella seconda parte del lavoro di tesi per ottimizzare una combinazione di algoritmi di normalizzazione e feature selection al fine di sviluppare un modello prognostico per OS basato sulla radiomica, la cui performance prognostica è stata valutata con delle tecniche di cross-validazione interna. Le prestazioni del modello radiomico sono state quindi confrontate con quelle di un modello basato esclusivamente su dati clinici e su un modello creato combinando i due tipi di dati. Analisi di stabilità delle feature radiomiche: materiali e metodi L’analisi di variabilità è stata usata per valutare la stabilità delle feature radiomiche rispetto ai seguenti parametri di acquisizione: tempo di eco (TE, dall’inglese time of echo), tempo di ripetizione (TR, dall’inglese time of repetition), dimensione dei pixel (PS, dall’inglese pixel spacing) e spessore di fetta (ST, dall’inglese slice thickness). Per realizzarla sono state create molteplici immagini MRI di tipo T1-pesato (T1w, dall’inglese T1-weighted) e T2-pesato (T2w, dall’inglese T2-weighted) ottenute tramite mappe quantitative dei parametri T1, T2 e densità protonica (PD, dall’inglese proton density). Le mappe sono state stimate con il software MATLAB risolvendo un problema inverso su un set di differenti acquisizioni MRI con sequenza Spin-echo ottenute usando un simulatore virtuale di immagini MRI, BrainWeb. Sulla base di queste mappe, sono stati creati 6 dataset per le immagini T1w e T2w (3 dataset ognuno). Il primo tipo di dataset comprende 42 immagini T1w e 48 immagini T2w con valori spaziali uniformi, ma valori di TR/TE variabili, permettendo di effettuare un’analisi di stabilità bivariata sulle feature nelle immagini originali e nelle immagini a seguito di tre algoritmi di normalizzazione dei livelli di grigio (Z-score, Linear mapping e Histogram Matching). Il secondo tipo di dataset comprende 28 immagini T1w e 28 immagini T2w ed è stato utilizzato per studiare la stabilità delle feature calcolate su immagini ottenute con TR/TE fissi ma con risoluzione spaziale variabile, e gli effetti dell’applicazione di un algoritmo di ricampionamento con interpolazione lineare a una risoluzione isotropica. Il terzo tipo di dataset include 50 immagini T1w e 50 immagini T2w, ottenute da una combinazione delle precedenti sorgenti di variabilità e ha permesso di valutare gli effetti dell’applicazione di entrambi gli algoritmi di normalizzazione dell’intensità e di ricampionamento. Su ogni immagine sono state segmentate tre ragioni di interesse (ROI, dall’inglese region of interest) arbitrarie con differenti livelli di eterogeneità, e per ognuna di esse sono state estratte le feature radiomiche con un wrapper MATLAB del software Pyradiomics. Le feature estratte possono essere divise nelle classi Shape, First Order, GLCM (dall’inglese Gray level co-occurence matrix) e GLRLM (dall’inglese Grey-level run length matrix), calcolate sia sulla MRI originale che sulle sue 8 decomposizioni wavelet di primo livello per un totale di 536 feature. Per ogni feature è stato calcolato il coefficiente di correlazione intra-classe (ICC, dall’inglese Intraclass Correlation Coefficient) per quantificarne la stabilità. Il gruppo di feature stabili include solo le feature che sono risultate stabili (ICC>0.75) nelle due analisi bivariate e nell’analisi quadrivariata. Analisi di stabilità delle feature radiomiche: risultati I risultati dell'analisi di variabilità hanno mostrato che il pre-processing dell'immagine con un algoritmo di standardizzazione dell'intensità e di ricampionamento spaziale ha migliorato la stabilità delle feature radiomiche. L’applicazione di un algoritmo di normalizzazione ha migliorato significativamente la stabilità delle feature First Order per variazioni dei valori di TR/TE, specialmente nelle immagini T1w (p = 8.12*10-6). Per quanto riguarda le feature texturali, entrambi i gruppi GLCM e GLRLM non hanno mostrato un miglioramento significativo nella stabilità dopo il ricampionamento. In generale, le feature del tipo GLCM risultano più stabili a variazioni dei parametri TR/TE rispetto alle feature del gruppo GLRLM. Non ci sono differenze significative tra i diversi algoritmi di normalizzazione. Il ricampionamento spaziale ha migliorato la stabilità delle feature Shape, che raggiungono il valore massimo di stabilità dopo il ricampionamento (ICC=1). Per gli altri gruppi, c’è una tendenza generale di miglioramento per tutti i gruppi sia per le immagini T1w che per le T2w, che diventa significativo per il gruppo wavelets (p = 1.53*10-12). Nell’analisi quadrivariata, gli effetti degli algoritmi combinati mostrano che le feature Shape raggiungono stabilità massima grazie al ricampionamento, mentre il gruppo GLCM risulta quello meno influenzato dal pre-processing mostrando poche differenze rispetto alle immagini originali. Nelle immagini T1w i gruppi First order, GLRLM e wavelets mostrano un miglioramento significativo grazie al pre-processing (p = 1.10*10-3) mentre per le immagini T2w si osserva una tendenza al miglioramento per il gruppo GLRLM che diventa significativo per i gruppi First Order e Wavelets. Visto che non è stata trovata nessuna evidenza che un algoritmo di normalizzazione delle intensità si è dimostrato migliore degli altri in termini di stabilità delle feature radiomiche, è stato deciso di usare l’algoritmo di linear mapping per le analisi successive, in base alla semplicità di implementazione. Usando i metodi selezionati (linear mapping per la normalizzazione delle intensità e ricampionamento spaziale), il numero di feature che sono risultate stabili sono 133 per le immagini T1w e 152 per le immagini T2w. Analisi di sopravvivenza basata su dati radiomici: materiali e metodi Per questa analisi sono stati utilizzati 201 pazienti affetti da tumore orofaringeo facenti parte di uno studio multicentrico. Per ciascun paziente sono state raccolte due acquisizioni T1w e T2w ottenute con sequenza turbo spin-eco. Le immagini sono state quindi processate secondo le modalità identificate nella prima parte del lavoro di tesi, ovvero con un algoritmo di ricampionamento ad una risoluzione isotropa di 3 mm e con un algoritmo di normalizzazione delle intensità di grigio di tipo linear mapping. Sono state segmentate manualmente da un radiologo una ROI principale che identifica il tumore e una ROI secondaria che include il linfonodo più grande interessato dal cancro, se presente. Un set iniziale di 536 feature è stato estratto per ogni combinazione di immagine MRI (T1w o T2w) e ROI (tumore o linfonodo) per un totale di 2144 feature. Dopo aver selezionato i set di feature stabili identificati nell’analisi precedente, il numero di feature è stato ridotto a 570. Per ogni paziente sono stati forniti anche dei dati clinici quali lo stato del paziente (vivo o morto alla fine dell’ultimo follow-up), il tempo di sopravvivenza e il valore dello stadio TNM VIII. Le feature radiomiche sono state utilizzate per trainare un modello di regressione di Cox per rischi proporzionali per la sopravvivenza, per identificare la probabilità di un paziente di sopravvivere libero da eventi in funzione del tempo. È stato effettuato un post-processing delle feature prima della creazione del modello che include un metodo di normalizzazione delle feature e di feature selection. Per ottimizzare il numero di feature del modello è stato usato un metodo wrapper con una cross-validazione interna con 100 iterazioni bootstrap. Sono stati proposti quattro diversi metodi di normalizzazione: Z-score, Tanh, DBnorm preceduto o seguito da uno step di normalizzazione del range delle feature effettuato con lo Z-score. Il metodo DBnorm permette di normalizzare le feature senza alterare la loro distribuzione a differenza degli altri due metodi più tradizionali, ma richiede una distribuzione statistica di riferimento su cui normalizzare i dati. Sono stati inoltre considerati tre diversi algoritmi di feature selection: Principal Component Analysis (PCA); Maximum Relevance minimum Redundancy (MRmR) basato sul coefficiente di correlazione; MRmR modificato (MRmR_CI) per calcolare il valore di rilevanza di una feature utilizzando il Concordance Index di Harrel (C-index). Questo parametro risulta particolarmente adatto per le analisi di sopravvivenza, perché permette di valutare il valore prognostico di un elemento in relazione al tempo di sopravvivenza tenendo in considerazione la censura dei pazienti, ma il suo inserimento comporta un alto costo computazionale. In questo caso è prevista quindi una riduzione del numero di feature con la PCA mantenendo le componenti che spiegano il 90% della varianza complessiva dei dati. Per identificare la migliore combinazione di post-processing, per ognuna delle 12 combinazioni (3 algoritmi di feature selection e 4 di normalizzazione) è stata effettuata una cross-validazione con 30 train/validation split multipli usando come metrica di qualità il C-index. Per identificare gli effetti degli algoritmi di normalizzazione e feature selection sulle 12 distribuzioni di C-index usando un test ANOVA a due vie per misure ripetute. Una volta identificata la migliore procedura di post-processing, abbiamo effettuato una validazione definitiva dei modelli ottimali. Laddove possibile, abbiamo usato la Leave-One-Out Cross-Validation per massimizzare la dimensione del dataset di validazione (se la normalizzazione DBnorm non era necessaria). Altrimenti viene utilizzata una cross-validazione del tipo train/validation split. Nel primo caso per i pazienti del dataset di validazione è stato possibile ottenere una signature non polarizzata e una classificazione in alto e basso rischio basata sulla mediana dei valori della signature. Per valutare le prestazioni dei modelli, è stato calcolato un C-index di validazione basato sui valori della signature di ogni paziente e i loro valori di tempo di sopravvivenza. Gli intervalli di confidenza per il C-index sono stati calcolati attraverso 100 iterazioni bootstrap. Il log rank test è stato usato per valutare la significatività delle curve di Kaplan Maier delle classi di rischio (alto/basso rischio) definito dalla radiomica (basate sul valore di soglia della signature radiomica). Le prestazioni del modello radiomico sono state confrontate con il potere predittivo dello stage TNM VIII, valutando il suo valore come se fosse una signature per il paziente permettendo di calcolare un valore di C-Index e due curve di Kaplan Maier tra i pazienti con un valore di stage da I a III e i pazienti con valore di stage pari a IV, che corrisponde con la probabilità di rischio maggiore. Infine, abbiamo combinato i dati radiomici e clinici per costruire un modello seguendo i passaggi usati per il modello radiomico per valutare il guadagno additivo che i dati radiomici possono fornire per la creazione di modelli di sopravvivenza. Analisi di sopravvivenza basata su dati radiomici: risultati I risultati del test ANOVA a due vie mostrano che non c’è interazione tra gli effetti degli algoritmi di normalizzazione e feature selection, con un p-value = 0,80. I due effetti separati mostrano che per gli algoritmi di feature selection MRmR_CI dimostra prestazioni migliori, mentre per gli algoritmi di normalizzazione, Z-score, Tanh and DB_norm+Z-score erano equivalenti. Per le successive analisi sono stati utilizzati i metodi Z-score e Tanh per la loro facilità di applicazione e implementazione. Inoltre, la validazione dei modelli radiomici ottimali è stata effettuata usando la LOOCV per massimizzare la dimensione del dataset di validazione. I modelli radiomici ottimali ottenuti hanno buone prestazioni. Il modello Z-score+MRmR_CI presenta un C-index = 0.62 ± 0.08 ma non presenta una divisione significativa delle curve di Kaplan-Meier (p-value = 0.19); il Tanh+MRmR_CI presenta prestazioni migliori, con un C-index = 0.66 ± 0.08 e un p-value = 0.02 per il log rank test. Il modello clinico basato sul valore di stage TNM VIII conferma il potere predittivo dei dati clinici, con un C-index = 0,73 ± 0,06 e un p-value = 1,8230e-05 per il log rank test. Integrando i dati radiomici in un modello radiomico-clinico è stato osservato un miglioramento delle performance prognostiche (C-index = 0.75 ± 0.06 e C-index = 0.77 ± 0.06 per il modello basato su rispettivamente Z-score e Tanh). Entrambi i modelli hanno presentato degli split significativi per le curve di alto e basso rischio (log-rank test p-value 1.82*10-5 e 3.17*10-5 per i modelli basati su rispettivamente Z-score and Tanh). Conclusioni Questa tesi offre un’analisi innovativa dell’implementazione di un workflow radiomico per lo studio della sopravvivenza di pazienti affetti da tumore orofaringeo, dove sono stati effettuati una valutazione di stabilità delle feature e un‘ottimizzazione degli algoritmi di normalizzazione delle feature e di feature selection. I risultati hanno dimostrato il potere prognostico della radiomica, confermando i risultati fino ad ora ottenuti in letteratura anche per il cancro orofaringeo. I risultati presentati evidenziano il potenziale delle applicazioni della radiomica come strumento prognostico non invasivo ed a basso costo per l’analisi di sopravvivenza di pazienti con tumore orofaringeo.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2020_06_Moia.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 1.75 MB
Formato Adobe PDF
1.75 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/153813