Colorectal cancer (CRC) represents one of the leading causes of death worldwide. In recent years, radiomics—a methodology that automatically extracts quantitative information from medical images—has offered new prospects for personalizing oncological treatments by providing non-invasive biomarkers that complement traditional clinical and genetic data. This thesis investigates the integration of clinical, genetic, and radiomic data to improve the prediction of survival in patients with CRC liver metastases. In particular, we apply survival models based on Random Survival Forests, which, through an accurate variable selection process based on the Boruta algorithm, evaluate the predictive power of features extracted from pre-intervention CT scans, both in the neoadjuvant pre-chemotherapy phase and in the pre-operative phase. The results show that the addition of radiomic information from the primary lesion, especially the one related to the central tumor, significantly increases the performance of survival models compared to the isolated use of clinical and genetic data. Furthermore, intra-patient metastasis heterogeneity is explored using tree-clustering techniques based on edit distances between dendrograms, revealing that patients with more homogeneous metastases or with high variability present distinct survival profiles. However, the integration of this stratification into the Random Survival Forest models does not lead to significant improvements in predictive performance, suggesting that the information regarding lesion variability is already partially captured by the radiomic characteristics of the primary lesion. The study supports the use of radiomics as a complementary tool for prognostic assessment in CRC liver metastases and opens new prospects for more personalized treatment strategies.

Il carcinoma del colon-retto (CRC) rappresenta una delle principali cause di mortalità a livello mondiale. Negli ultimi anni, la radiomica – una metodologia che consente di estrarre automaticamente informazioni quantitative da immagini mediche – ha offerto nuove prospettive per la personalizzazione dei trattamenti oncologici, fornendo biomarcatori non invasivi e complementari ai tradizionali dati clinici e genetici. Questa tesi indaga l'integrazione di dati clinici, genetici e radiomici per migliorare la previsione della sopravvivenza nei pazienti affetti da metastasi epatiche da CRC. In particolare, abbiamo sviluppato modelli di sopravvivenza basati su Random Survival Forest che, mediante un accurato processo di selezione delle variabili (basato sull’algoritmo Boruta), valutano la potenza predittiva di caratteristiche estratte da scansioni TC pre-intervento, sia nella fase pre-chemioterapia neoadiuvante che pre-operatoria. I risultati mostrano che l’aggiunta delle informazioni radiomiche della lesione primaria, soprattutto quelle relative al tumore centrale, incrementa significativamente le performance dei modelli di sopravvivenza rispetto all’uso isolato di dati clinici e genetici. Inoltre, abbiamo esplorato l’eterogeneità intra-paziente delle metastasi attraverso tecniche di tree-clustering basate su distanze di edit tra dendrogrammi, evidenziando che pazienti con metastasi più omogenee o con elevate variazioni presentano profili di sopravvivenza distinti. Tuttavia, l’integrazione di tale stratificazione nei modelli di Random Survival Forest non porta a miglioramenti significativi nelle prestazioni predittive, suggerendo che le informazioni sulla variabilità delle lesioni siano già in parte catturate dalle caratteristiche radiomiche della lesione primaria. Lo studio supporta l’utilizzo della radiomica come strumento complementare per la valutazione prognostica nelle metastasi epatiche da CRC e apre nuove prospettive per strategie di trattamento più personalizzate.

Integration of radiomic features and intra-patient heterogeneity of colorectal cancer metastases for prognostic modeling

MATTEUCCI, GILDA
2023/2024

Abstract

Colorectal cancer (CRC) represents one of the leading causes of death worldwide. In recent years, radiomics—a methodology that automatically extracts quantitative information from medical images—has offered new prospects for personalizing oncological treatments by providing non-invasive biomarkers that complement traditional clinical and genetic data. This thesis investigates the integration of clinical, genetic, and radiomic data to improve the prediction of survival in patients with CRC liver metastases. In particular, we apply survival models based on Random Survival Forests, which, through an accurate variable selection process based on the Boruta algorithm, evaluate the predictive power of features extracted from pre-intervention CT scans, both in the neoadjuvant pre-chemotherapy phase and in the pre-operative phase. The results show that the addition of radiomic information from the primary lesion, especially the one related to the central tumor, significantly increases the performance of survival models compared to the isolated use of clinical and genetic data. Furthermore, intra-patient metastasis heterogeneity is explored using tree-clustering techniques based on edit distances between dendrograms, revealing that patients with more homogeneous metastases or with high variability present distinct survival profiles. However, the integration of this stratification into the Random Survival Forest models does not lead to significant improvements in predictive performance, suggesting that the information regarding lesion variability is already partially captured by the radiomic characteristics of the primary lesion. The study supports the use of radiomics as a complementary tool for prognostic assessment in CRC liver metastases and opens new prospects for more personalized treatment strategies.
CAVINATO, LARA
MASCI, CHIARA
ING - Scuola di Ingegneria Industriale e dell'Informazione
3-apr-2025
2023/2024
Il carcinoma del colon-retto (CRC) rappresenta una delle principali cause di mortalità a livello mondiale. Negli ultimi anni, la radiomica – una metodologia che consente di estrarre automaticamente informazioni quantitative da immagini mediche – ha offerto nuove prospettive per la personalizzazione dei trattamenti oncologici, fornendo biomarcatori non invasivi e complementari ai tradizionali dati clinici e genetici. Questa tesi indaga l'integrazione di dati clinici, genetici e radiomici per migliorare la previsione della sopravvivenza nei pazienti affetti da metastasi epatiche da CRC. In particolare, abbiamo sviluppato modelli di sopravvivenza basati su Random Survival Forest che, mediante un accurato processo di selezione delle variabili (basato sull’algoritmo Boruta), valutano la potenza predittiva di caratteristiche estratte da scansioni TC pre-intervento, sia nella fase pre-chemioterapia neoadiuvante che pre-operatoria. I risultati mostrano che l’aggiunta delle informazioni radiomiche della lesione primaria, soprattutto quelle relative al tumore centrale, incrementa significativamente le performance dei modelli di sopravvivenza rispetto all’uso isolato di dati clinici e genetici. Inoltre, abbiamo esplorato l’eterogeneità intra-paziente delle metastasi attraverso tecniche di tree-clustering basate su distanze di edit tra dendrogrammi, evidenziando che pazienti con metastasi più omogenee o con elevate variazioni presentano profili di sopravvivenza distinti. Tuttavia, l’integrazione di tale stratificazione nei modelli di Random Survival Forest non porta a miglioramenti significativi nelle prestazioni predittive, suggerendo che le informazioni sulla variabilità delle lesioni siano già in parte catturate dalle caratteristiche radiomiche della lesione primaria. Lo studio supporta l’utilizzo della radiomica come strumento complementare per la valutazione prognostica nelle metastasi epatiche da CRC e apre nuove prospettive per strategie di trattamento più personalizzate.
File allegati
File Dimensione Formato  
2025_04_Matteucci_Tesi.pdf

accessibile in internet per tutti

Descrizione: Testo Tesi
Dimensione 29.63 MB
Formato Adobe PDF
29.63 MB Adobe PDF Visualizza/Apri
2025_04_Matteucci_Executive_Summary.pdf

accessibile in internet per tutti

Descrizione: Executive Summary
Dimensione 1.34 MB
Formato Adobe PDF
1.34 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/235926