Lung cancer, with the most frequent histology of Non-Small Cells Lung Cancer (NSCLC), is still on top of the rankings as the leading cause of tumor-related deaths in both men and women. Among the many treatments available nowadays, immunotherapy (IO) with checkpoint inhibitors (ICI) has provided substantial survival benefits despite only a small percentage of patients benefit from it. Currently, choosing the ideal candidate for the therapy is based on the expression of the Programmed Death Cell Ligand (PD-L1) even if its predictive accuracy shows many limitations. The scientific community has employed much effort to find an alternative biomarker ranging from liquid biopsy to radiomic signatures. Indeed, an increasing interest has been rising to the emerging field of radiomics: a process that translates medical images into minable data which are structured in features (i.e., image- based descriptors). Radiomics gathers information that can be imperceptible even by the most expert human eye, which may result in a non-invasive biomarker useful in the NSCLC framework. The complexity of the prediction problem is most likely to require different parameters to predict the outcome. For this reason, seems reasonable to exploit the huge variety of data, traditional or radiomic, nowadays available for each patient. Using ML techniques, this work aimed to design a binary classificator to predict the response to IO and explore the predictive and prognostic power of radiomic features. The study focused on 184 patients from the National Cancer Institute of Milan. A modular workflow was applied: four binary classificators were trained and tested on three different sets of features. The first contained Real World Evidence, the second radiomic data and the last combined the previous two. The first two assessed respectively the predictive power of RW and radiomic features, the last one evaluated the results obtained on integrated data. The predictive models investigated a response outcome (DCR) and two survival outcomes (PFS, OS). The performances obtained showed good preliminary results on the DCR outcome, achieving an AUC = 0.76 on the integrated dataset, validating the hypothesis that embedding different evidence and information is a powerful tool to better manage the selection of the IO candidate. A further analysis was later conducted in terms of feature importance. This evaluation led two different conclusions. In terms of clinical features, the PD-L1 seems to be necessary but not sufficient to the model. For what concerns the radiomic features, the ones describing the texture homogeneity of the lesion achieved high scores in terms of feature importance supporting the hypothesis that texture analysis correlates with prognosis and clinical outcomes in certain tumor types.
Il cancro del polmone, con l'istologia più frequente di cancro del polmone tumore polmonare a grandi cellule (NSCLC), è ancora in testa alle classifiche come la principale causa di decessi correlati al tumore negli uomini e nelle donne . Tra i molti trattamenti oggi disponibili, l'immunoterapia (IO), nello specifico gli inibitori dei checkpoint immunologici (ICI), ha fornito sostanziali benefici in termini di sopravvivenza anche se solo una piccola percentuale di pazienti ne trae beneficio. Attualmente, la scelta del candidato ideale per la terapia si basa sull'espressione del Programmed Death Cell Ligand (PD-L1) anche se la sua accuratezza predittiva risulta limitata. La comunità scientifica ha impiegato molti sforzi per trovare un biomarcatore alternativo spaziando dalla biopsia liquida alle caratteristiche radiomiche. Difatti, sta crescendo l'interesse per il campo emergente della radiomica: un processo che traduce le immagini mediche in dati minabili che sono strutturati in features (cioè, descrittori basati su immagini). La radiomica raccoglie informazioni che potrebbero essere impercettibili anche dall'occhio umano più esperto, che possono risultare utili a scoprire un biomarcatore non invasivo utile nel contesto del NSCLC. È verosimile che la complessità della questione relativa alla predizione richieda parametri diversi per predire l'esito della terapia, per questo motivo sembra ragionevole sfruttare l'enorme varietà di dati, tradizionali o radiomici, oggi disponibili per ciascun paziente per affrontare questo problema. Utilizzando tecniche di ML, questo lavoro mira a progettare un classificatore binario per predire la risposta all’IO ed esplorare il potere predittivo e prognostico delle feature radiomiche. Lo studio ha coinvolto 184 pazienti curati presso l’Istituto Nazionale dei Tumori di Milano. Un approccio modulare è stato applicato: inizialmente quattro classificatori binari sono stati allenati e testati su tre diversi set di feature. Il primo contenente solo dati Real World, il secondo solo dati di radiomica e il terzo un insieme dei due precedenti. I primi due sono serviti a stabilire il potere predittivo rispettivamente di dati Real World e feature radiomiche, il terzo è invece servito per valutare la performance ottenuta sui dati integrati. I modelli predittivi hanno osservato i risultati in termini di risposta alla terapia (DCR) e di sopravvivenza in seguito alla terapia (PFS, OS). Le prestazioni ottenute hanno mostrato buoni risultati preliminari in termini di DCR, ottenendo un AUC = 0,76 sul dataset integrato, convalidando l'ipotesi che incorporare diverse evidenze e informazioni sia un potente strumento per gestire al meglio la selezione del candidato ideale per l’IO. Un'ulteriore analisi è stata condotta in termini di rilevanza delle feature. Questa valutazione ha portato a due diverse conclusioni. In termini di feature cliniche, il PD-L1 sembra essere necessario ma non sufficiente per il modello. Per quanto riguarda le feature radiomiche, quelle che descrivono l'omogeneità del tessuto della lesione hanno ottenuto punteggi elevati in termini di importanza a sostegno dell'ipotesi che, in alcuni tipi di tumore, l’omogeneità o disomogeneità della lesione sia correlata alla prognosi e agli esiti clinici.
Prediction of Immunotherapy response in NSCLC based on RW evidence and radiomic features
MONTELEONE, MARIAGRAZIA
2021/2022
Abstract
Lung cancer, with the most frequent histology of Non-Small Cells Lung Cancer (NSCLC), is still on top of the rankings as the leading cause of tumor-related deaths in both men and women. Among the many treatments available nowadays, immunotherapy (IO) with checkpoint inhibitors (ICI) has provided substantial survival benefits despite only a small percentage of patients benefit from it. Currently, choosing the ideal candidate for the therapy is based on the expression of the Programmed Death Cell Ligand (PD-L1) even if its predictive accuracy shows many limitations. The scientific community has employed much effort to find an alternative biomarker ranging from liquid biopsy to radiomic signatures. Indeed, an increasing interest has been rising to the emerging field of radiomics: a process that translates medical images into minable data which are structured in features (i.e., image- based descriptors). Radiomics gathers information that can be imperceptible even by the most expert human eye, which may result in a non-invasive biomarker useful in the NSCLC framework. The complexity of the prediction problem is most likely to require different parameters to predict the outcome. For this reason, seems reasonable to exploit the huge variety of data, traditional or radiomic, nowadays available for each patient. Using ML techniques, this work aimed to design a binary classificator to predict the response to IO and explore the predictive and prognostic power of radiomic features. The study focused on 184 patients from the National Cancer Institute of Milan. A modular workflow was applied: four binary classificators were trained and tested on three different sets of features. The first contained Real World Evidence, the second radiomic data and the last combined the previous two. The first two assessed respectively the predictive power of RW and radiomic features, the last one evaluated the results obtained on integrated data. The predictive models investigated a response outcome (DCR) and two survival outcomes (PFS, OS). The performances obtained showed good preliminary results on the DCR outcome, achieving an AUC = 0.76 on the integrated dataset, validating the hypothesis that embedding different evidence and information is a powerful tool to better manage the selection of the IO candidate. A further analysis was later conducted in terms of feature importance. This evaluation led two different conclusions. In terms of clinical features, the PD-L1 seems to be necessary but not sufficient to the model. For what concerns the radiomic features, the ones describing the texture homogeneity of the lesion achieved high scores in terms of feature importance supporting the hypothesis that texture analysis correlates with prognosis and clinical outcomes in certain tumor types.File | Dimensione | Formato | |
---|---|---|---|
Master Thesis Mariagrazia Monteleone.pdf
accessibile in internet solo dagli utenti autorizzati
Descrizione: Master Thesis Monteleone
Dimensione
3.06 MB
Formato
Adobe PDF
|
3.06 MB | Adobe PDF | Visualizza/Apri |
Executive Summary Mariagrazia Monteleone.pdf
accessibile in internet solo dagli utenti autorizzati
Descrizione: Executive Summary Monteleone
Dimensione
711.32 kB
Formato
Adobe PDF
|
711.32 kB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/195692