Opposed to the classical tumor classification that classifies the disease based on the primary site of origin, cancer subtyping is a personalized medicine approach that aims at identifying subgroups of individuals based on specific characteristics in order to deliver tailor-made treatments to every patient. A way to perform cancer subtyping is by means of survival clustering: a clustering method that takes into account differences in the survival outcome of the individuals in addtion to clinical features. In the context of medical imaging analysis, radiomics are a quantitative approach that allows non-invasive tumour characterization by extracting numerical variables from segmented regions of interest on the images. During the diagnosis and monitoring time of a disease such as colorectal cancer, CT scans are executed multiple times, giving the possibility to extract information about the evolution of the mea sured observed variables in relation with time and treatments. In this thesis, the Multi State Survival Supervised Clustering (MS3C) method for cancer subtyping is proposed. MS3C extends previously existing works in order to perform cancer subtyping on a longitudinal dataset, modelling the data with a Multi State Model where transition intensity functions are Cox Proportional Hazard Model. Instead of building a similarity matrix and running an unsupervised clustering algorithm, MS3C learns the similarity matrix with an adaptive process alongside with the coefficients of the regressors in the transition intesity functions of the Multi State Model. The estimated risks in the learning stage of the MSM are used as supervised information in the similarity matrix learning stage in an alternating iterative optimization algorithm. The application of MS3C to a dataset of patients affected by Colorectal Liver Metastases showcases the ability of the proposed algorithm to identify two subgroups with different disease-free survival expectations.

Contrariamente alla classificazione classica dei tumori che classifica la malattia in base al sito primario di origine, la sottotipizzazione del cancro è un approccio di medicina personalizzata che mira a identificare sottogruppi di individui sulla base di caratteristiche specifiche al fine di somministrare trattamenti su misura per ogni paziente. Un modo per effettuare la sottotipizzazione del cancro è attraverso il clustering di sopravvivenza: un metodo di clustering che tiene conto delle differenze nella sopravvivenza degli individui, oltre alle caratteristiche cliniche. Nel contesto dell’analisi delle immagini mediche, la radiomica è un approccio quantitativo che consente una caratterizzazione non invasiva del tumore estraendo variabili numeriche dalle regioni di interesse segmentate nelle immagini. Durante la fase di diagnosi e monitoraggio di una malattia come il cancro del colon-retto, esami di tomografia vengono eseguite più volte, offrendo la possibilità di estrarre informazioni sull’evoluzione delle variabili osservate misurate in relazione al tempo e alle terapie. In questa tesi, viene proposto il metodo Multi State Survival Supervised Clustering (MS3C) per la sottotipizzazione del cancro. MS3C estende approcci pre-esistenti al fine di eseguire la sottotipizzazione del cancro su un set di dati longitudinali, modellando i dati con un modello multi stato dove le funzioni di intensità di transizione sono modellate con il modello dei rischi proporzionali di Cox. Piuttosto che costruire una matrice di similarità e applicare un algoritmo di clustering non supervisionato, MS3C stima sia la matrice di similarità tramite un processo adattativo che i coefficienti nelle funzioni di intensità di transizione del modello multistato. I rischi stimati nella fase di stima del modello multistato vengono utilizzati come informazioni supervisionate nella fase di stima della matrice di similarità con un algoritmo di ottimizzazione iterativa alternata. L’applicazione di MS3C a un set di dati di pazienti affetti da metastasi epatiche da tumore del colon-retto dimostra la capacità dell’algoritmo proposto di identificare due sotto-gruppi con diverse aspettative di sopravvivenza senza recidiva.

Multi state survival supervised clustering for radiomics-based cancer subtyping

Rocchi, Marco
2024/2025

Abstract

Opposed to the classical tumor classification that classifies the disease based on the primary site of origin, cancer subtyping is a personalized medicine approach that aims at identifying subgroups of individuals based on specific characteristics in order to deliver tailor-made treatments to every patient. A way to perform cancer subtyping is by means of survival clustering: a clustering method that takes into account differences in the survival outcome of the individuals in addtion to clinical features. In the context of medical imaging analysis, radiomics are a quantitative approach that allows non-invasive tumour characterization by extracting numerical variables from segmented regions of interest on the images. During the diagnosis and monitoring time of a disease such as colorectal cancer, CT scans are executed multiple times, giving the possibility to extract information about the evolution of the mea sured observed variables in relation with time and treatments. In this thesis, the Multi State Survival Supervised Clustering (MS3C) method for cancer subtyping is proposed. MS3C extends previously existing works in order to perform cancer subtyping on a longitudinal dataset, modelling the data with a Multi State Model where transition intensity functions are Cox Proportional Hazard Model. Instead of building a similarity matrix and running an unsupervised clustering algorithm, MS3C learns the similarity matrix with an adaptive process alongside with the coefficients of the regressors in the transition intesity functions of the Multi State Model. The estimated risks in the learning stage of the MSM are used as supervised information in the similarity matrix learning stage in an alternating iterative optimization algorithm. The application of MS3C to a dataset of patients affected by Colorectal Liver Metastases showcases the ability of the proposed algorithm to identify two subgroups with different disease-free survival expectations.
ING - Scuola di Ingegneria Industriale e dell'Informazione
3-apr-2025
2024/2025
Contrariamente alla classificazione classica dei tumori che classifica la malattia in base al sito primario di origine, la sottotipizzazione del cancro è un approccio di medicina personalizzata che mira a identificare sottogruppi di individui sulla base di caratteristiche specifiche al fine di somministrare trattamenti su misura per ogni paziente. Un modo per effettuare la sottotipizzazione del cancro è attraverso il clustering di sopravvivenza: un metodo di clustering che tiene conto delle differenze nella sopravvivenza degli individui, oltre alle caratteristiche cliniche. Nel contesto dell’analisi delle immagini mediche, la radiomica è un approccio quantitativo che consente una caratterizzazione non invasiva del tumore estraendo variabili numeriche dalle regioni di interesse segmentate nelle immagini. Durante la fase di diagnosi e monitoraggio di una malattia come il cancro del colon-retto, esami di tomografia vengono eseguite più volte, offrendo la possibilità di estrarre informazioni sull’evoluzione delle variabili osservate misurate in relazione al tempo e alle terapie. In questa tesi, viene proposto il metodo Multi State Survival Supervised Clustering (MS3C) per la sottotipizzazione del cancro. MS3C estende approcci pre-esistenti al fine di eseguire la sottotipizzazione del cancro su un set di dati longitudinali, modellando i dati con un modello multi stato dove le funzioni di intensità di transizione sono modellate con il modello dei rischi proporzionali di Cox. Piuttosto che costruire una matrice di similarità e applicare un algoritmo di clustering non supervisionato, MS3C stima sia la matrice di similarità tramite un processo adattativo che i coefficienti nelle funzioni di intensità di transizione del modello multistato. I rischi stimati nella fase di stima del modello multistato vengono utilizzati come informazioni supervisionate nella fase di stima della matrice di similarità con un algoritmo di ottimizzazione iterativa alternata. L’applicazione di MS3C a un set di dati di pazienti affetti da metastasi epatiche da tumore del colon-retto dimostra la capacità dell’algoritmo proposto di identificare due sotto-gruppi con diverse aspettative di sopravvivenza senza recidiva.
File allegati
File Dimensione Formato  
Multi_State_Survival_Supervised_Clustering_for_radiomics_based_cancer_subtyping.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 2.36 MB
Formato Adobe PDF
2.36 MB Adobe PDF Visualizza/Apri
Executive_Summary___Multi_State_Survival_Supervised_Clustering_for_radiomics_based_cancer_subtyping.pdf

accessibile in internet per tutti

Descrizione: Executive Summary della tesi
Dimensione 654.67 kB
Formato Adobe PDF
654.67 kB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/235813