Among colorectal cancer patients, RAS-mutated patients are those who present somatic mutations within the genes of the RAS group (KRAS, NRAS, HRAS). These mutations are known to make the patient less responsive to therapy, worsening the prognosis. It is therefore of crucial interest to investigate frequent patterns of mutations associated with RAS mutations, to identify genes that can be targeted by new therapies. In my thesis, I have developed a robust and statistically rigorous pipeline for discovering these mutational patterns, called mutational signatures. The pipeline relies on an innovative encoding of the mutational data, to my knowledge never used before, able to incorporate information about genes, variants and hotspot membership of the detected mutations, while maintaining full interpretability. Results of this work are both methodological and applicative. The designed encoding is very general and can be applied to virtually any problem involving mutational data. The same is true for the pipeline, which can be applied to the extraction of mutational signatures of any cohort of patients. Concerning the application to RAS-mutated patients, I identified signature genes already known for their oncological role and new promising genes, whose role for targeted therapies has yet to be evaluated by doctors and biologists. This thesis was developed in collaboration with the “Candiolo Cancer Center” and in the context of the “GerSom project”, a multicentric project implemented by “Alleanza contro il cancro” and promoted by the Italian Ministry of Health.
Tra i pazienti affetti da cancro del colon-retto, i pazienti RAS mutati sono coloro che presentano mutazioni somatiche nei geni del gruppo RAS (KRAS, NRAS, HRAS). È noto che mutazioni di questo gruppo rendono il paziente meno responsivo alle terapie, peggiorandone la prognosi. Nella mia tesi, ho sviluppato una pipeline robusta e statisticamente rigorosa per l’estrazione delle firme mutazionali associate a tali pazienti. L'obiettivo è comprendere meglio le dinamiche associate alle mutazioni RAS, ma soprattutto identificare mutazioni co-occorrenti che possono essere prese come target di nuove terapie mirate. La pipeline che ho progettato si basa su una codifica innovativa del dato mutazionale, a mia conoscenza mai usata prima, che permette di includere informazioni relative ai geni, alle varianti e all’appartenenza a hotspot delle mutazioni rilevate, mantenendo allo stesso tempo una perfetta interpretabilità. I risultati di questo lavoro sono sia metodologici che applicativi. La codifica che ho sviluppato è molto generale e può essere utilizzata in tutte le situazioni in cui sono presenti dati mutazionali. Lo stesso vale per la pipeline, che può essere impiegata per l'estrazione delle firme mutazionali di qualunque coorte di pazienti. Applicando tali metodologie al caso dei pazienti RAS mutati, tra i geni estratti vi sono sia geni oncogeni già noti, sia geni nuovi e promettenti, il cui ruolo per terapie mirate deve essere ancora valutato da medici e biologi. Questa tesi è stata sviluppata in collaborazione con il Centro Oncologico di Candiolo e nel contesto del “Progetto GerSom”, un progetto multicentrico promosso dal Ministero della Salute e implementato da “Alleanza contro il Cancro”.
Statistical and machine learning methods for discovering mutational signatures in RAS-mutated colorectal cancer patients
Bellomo, Michele
2021/2022
Abstract
Among colorectal cancer patients, RAS-mutated patients are those who present somatic mutations within the genes of the RAS group (KRAS, NRAS, HRAS). These mutations are known to make the patient less responsive to therapy, worsening the prognosis. It is therefore of crucial interest to investigate frequent patterns of mutations associated with RAS mutations, to identify genes that can be targeted by new therapies. In my thesis, I have developed a robust and statistically rigorous pipeline for discovering these mutational patterns, called mutational signatures. The pipeline relies on an innovative encoding of the mutational data, to my knowledge never used before, able to incorporate information about genes, variants and hotspot membership of the detected mutations, while maintaining full interpretability. Results of this work are both methodological and applicative. The designed encoding is very general and can be applied to virtually any problem involving mutational data. The same is true for the pipeline, which can be applied to the extraction of mutational signatures of any cohort of patients. Concerning the application to RAS-mutated patients, I identified signature genes already known for their oncological role and new promising genes, whose role for targeted therapies has yet to be evaluated by doctors and biologists. This thesis was developed in collaboration with the “Candiolo Cancer Center” and in the context of the “GerSom project”, a multicentric project implemented by “Alleanza contro il cancro” and promoted by the Italian Ministry of Health.File | Dimensione | Formato | |
---|---|---|---|
Thesis_MicheleBellomo_final.pdf
non accessibile
Dimensione
2.75 MB
Formato
Adobe PDF
|
2.75 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/189987