Survival Prediction models in Cancer Research are useful for several reasons such as Early detection systems, which increases the likelihood of positive outcomes for a patient, the monitoring of the progression of the tumour and the comprehension of the leading factors that determine an event such as death or recurrence. The focus of this thesis is to understand if features extracted from the training of a 3D Convolutional Autoencoder over Computed Tomography (CT) images are relevant for the Survival Prediction of Non-Small Cell Lung Cancer (NSCLC) patients. In addition to Autoencoder features, also Clinical and Radiomics features were included and extracted from the dataset, to investigate if the combination of different types of features leads to a more powerful model. The autoencoder was trained considering different types of input such as patches extracted from the tumour ROI (Region of Interest) or the ROI itself, discarding all the other information available from the image. The results show that the best-performing model was the one trained on the patches in which the signature extracted from the Autoencoder was able to split the population into high-risk and low-risk with Hazard Ratio = 4.58, while the Radiomics signature obtained from the Radiomics features was able to obtain a Hazard Ratio = 3.03. Among the best Survival Prediction models, Linear SVM and Random Survival Forest were able to reach $C-index = 0.663 pm 0.027$ and $C-index = 0.642 pm 0.018$ respectively, only on Autoencoder Features; the latter model was also able to reach $C-index = 0.656 pm 0.024$ with a combination of Autoencoder, Radiomics and Clinical features. In conclusion, this work show that 3D Convolutional Autoencoder trained on CT scans are able to extract features that are relevant for the Survival Prediction, improving the accuracy of models based on Radiomics and Clinical features.

La predizione della sopravvivenza nella ricerca sul cancro è utile per diversi motivi tra cui lo sviluppo di sistemi per la diagnosi precoce, che aiutano nell'aumentare la possiblità di esiti positivi per i pazienti, sistemi utili per monitorare il progresso dei tumori e la comprensione dei fattori principali che determinano eventi come la morte o la loro ricorrenza. L'obiettivo di questa tesi è capire se le feature estratte dall'addestramento di un 3D Convolutional Autoencoder su TAC (Tomografia Assiale Computerizzata) siano rilevanti per la predizione della sopravvivenza di pazienti affetti da cancro al polmone non a piccole cellule. In aggiunta alle feature estratte dall'autoencoder, sono state considerate ed estratte anche le informazioni Cliniche e le feature Radiomiche, in modo tale da investigare la possibilità di modelli più accurati considerando una combinazione di informazioni. L'Autoencoder è stato addestrato considerando diversi tipi di input come patch estratte intorno al ROI (Region of Interest) o il volume stesso del tumore, rimuovendo tutto il resto dell'immagine. I risultati mostrano come la signature estratta dall'Autoencoder addestrato sulle patch sia in grado di dividere la popolazione in alto rischio e basso rischio con un Hazard Ratio = 4.58, rispetto alla signature Radiomica ottenuta dalle features Radiomiche che riporta un Hazard Ratio = 3.03. Tra i migliori modelli per la predizione della sopravvivenza ci sono Linear SVM e Random Survival Forest che sono stati in grado di raggiungere $C-index = 0.663 pm 0.027$ e $C-index = 0.642 pm 0.018$ rispettivamente, solo sulle feature estratte dall'Autoencoder; Inoltre, il secondo modello è stato in grado di ottenere $C-index = 0.656 pm 0.024$ con una combinazione di feature estratte dall'Autoencoder, Radiomiche e Cliniche. In conclusione, questo lavoro mostra che il 3D Convolutional Autoencoder addestrato sulle TAC è in grado di estrarre features che sono rilevanti per la predizione della sopravvivenza, migliorando l'accuratezza di modelli basati su feature Radiomiche e Cliniche.

Survival prediction of Non-Small Cell Lung Cancer (NSCLC) patients through 3D Autoencoder-based features extraction from CT scans

Dispoto, Giovanni
2022/2023

Abstract

Survival Prediction models in Cancer Research are useful for several reasons such as Early detection systems, which increases the likelihood of positive outcomes for a patient, the monitoring of the progression of the tumour and the comprehension of the leading factors that determine an event such as death or recurrence. The focus of this thesis is to understand if features extracted from the training of a 3D Convolutional Autoencoder over Computed Tomography (CT) images are relevant for the Survival Prediction of Non-Small Cell Lung Cancer (NSCLC) patients. In addition to Autoencoder features, also Clinical and Radiomics features were included and extracted from the dataset, to investigate if the combination of different types of features leads to a more powerful model. The autoencoder was trained considering different types of input such as patches extracted from the tumour ROI (Region of Interest) or the ROI itself, discarding all the other information available from the image. The results show that the best-performing model was the one trained on the patches in which the signature extracted from the Autoencoder was able to split the population into high-risk and low-risk with Hazard Ratio = 4.58, while the Radiomics signature obtained from the Radiomics features was able to obtain a Hazard Ratio = 3.03. Among the best Survival Prediction models, Linear SVM and Random Survival Forest were able to reach $C-index = 0.663 pm 0.027$ and $C-index = 0.642 pm 0.018$ respectively, only on Autoencoder Features; the latter model was also able to reach $C-index = 0.656 pm 0.024$ with a combination of Autoencoder, Radiomics and Clinical features. In conclusion, this work show that 3D Convolutional Autoencoder trained on CT scans are able to extract features that are relevant for the Survival Prediction, improving the accuracy of models based on Radiomics and Clinical features.
ING - Scuola di Ingegneria Industriale e dell'Informazione
4-mag-2023
2022/2023
La predizione della sopravvivenza nella ricerca sul cancro è utile per diversi motivi tra cui lo sviluppo di sistemi per la diagnosi precoce, che aiutano nell'aumentare la possiblità di esiti positivi per i pazienti, sistemi utili per monitorare il progresso dei tumori e la comprensione dei fattori principali che determinano eventi come la morte o la loro ricorrenza. L'obiettivo di questa tesi è capire se le feature estratte dall'addestramento di un 3D Convolutional Autoencoder su TAC (Tomografia Assiale Computerizzata) siano rilevanti per la predizione della sopravvivenza di pazienti affetti da cancro al polmone non a piccole cellule. In aggiunta alle feature estratte dall'autoencoder, sono state considerate ed estratte anche le informazioni Cliniche e le feature Radiomiche, in modo tale da investigare la possibilità di modelli più accurati considerando una combinazione di informazioni. L'Autoencoder è stato addestrato considerando diversi tipi di input come patch estratte intorno al ROI (Region of Interest) o il volume stesso del tumore, rimuovendo tutto il resto dell'immagine. I risultati mostrano come la signature estratta dall'Autoencoder addestrato sulle patch sia in grado di dividere la popolazione in alto rischio e basso rischio con un Hazard Ratio = 4.58, rispetto alla signature Radiomica ottenuta dalle features Radiomiche che riporta un Hazard Ratio = 3.03. Tra i migliori modelli per la predizione della sopravvivenza ci sono Linear SVM e Random Survival Forest che sono stati in grado di raggiungere $C-index = 0.663 pm 0.027$ e $C-index = 0.642 pm 0.018$ rispettivamente, solo sulle feature estratte dall'Autoencoder; Inoltre, il secondo modello è stato in grado di ottenere $C-index = 0.656 pm 0.024$ con una combinazione di feature estratte dall'Autoencoder, Radiomiche e Cliniche. In conclusione, questo lavoro mostra che il 3D Convolutional Autoencoder addestrato sulle TAC è in grado di estrarre features che sono rilevanti per la predizione della sopravvivenza, migliorando l'accuratezza di modelli basati su feature Radiomiche e Cliniche.
File allegati
File Dimensione Formato  
2023_05_Dispoto_Executive_Summary_02.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: executive summary
Dimensione 1.93 MB
Formato Adobe PDF
1.93 MB Adobe PDF   Visualizza/Apri
2023_05_Dispoto_Tesi_01.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: tesi
Dimensione 8.14 MB
Formato Adobe PDF
8.14 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/208390