Ovarian cancer is the most lethal gynecologic cancer, causing annually a large number of deaths throughout the world. In particular, high-grade serous ovarian adenocarcinoma (HGS-OC) is the most common type of ovarian epithelial carcinomas and has the worst prognosis; it is a rapidly growing carcinoma, it is believed to have a tubal origin with a high chromosomal instability. Poor prognosis in HGS-OC is largely related to chemoresistance: although patients usually respond to initial therapy and cytoreductive surgery followed by adjuvant chemotherapy with platinum and paclitaxel, ∼70% of those with advanced-stage ovarian cancer experience recurrence; in many cases, the disease becomes incurable mainly due to the development of drug resistance. This thesis is born as cooperation with Istitituto di Ricerche Farmacologiche Mario Negri, particularly driven from biologist Sergio Marchini, who has the intuition that using CNA data would provide interesting results in terms of early diagnosis of the disease. The analysis present in this work is done in collaboration with a parallel thesis, which is presented to a different committee. The focus of this work is on the biological aspects and results of the research, while the emphasis of the other one by Sara Sansone is on the computational methods implemented to achieve the final goal. One of HGS-OC peculiarity its the relapse timing of patients, that may be used as a predictor or as a label. By using it in the first way, we performed survival analysis to discriminate the drug-responsiveness of patients through their time to relapse. The results obtained with this model were quite poor, therefore we decided to use the relapse timing as a label to classify patients in classes, and specifically, we focused on therapy-resistant and therapy-sensitive patients, where the former ones are identified by relapse within a short interval of just six months since diagnosis. To do so, many different data types have been integrated - as gene and miRNA expression data, DNA methylation data and CNA data - because of their involvement in ovarian cancer spreading and development; these data-types were downloaded from The Cancer Genome Atlas (TCGA) repository and the information needed to implement the models have been extracted through the use of GenoMetric Query Language (GMQL), developed at Politecnico di Milano. Building an effective classifier through an integrative approach was the most difficult part of the thesis; based on this approach we were able to find significant results. These results are promising, and the integration of multiple data-types can be considered an innovation for this case of study. The most significant biological contribution was then integration of the genome portions that characterize the classifier, useful for explaining from a biological point of view the main distinctive features of resistant patients. An important outcome was the identification of the Notch Signaling Pathway, considered to be one of the most important signalling pathways in drug-resistance tumor cells.

Il carcinoma ovarico è il tumore ginecologico più letale, e ogni anno causa un numero elevatissimo di decessi in tutto il mondo. In particolare, l’adenocarcinoma ovarico sieroso di alto grado (HGS-OC) è il tipo più comune di carcinoma epiteliale ovarico e presenta la prognosi peggiore; ´e un carcinoma caratterizzato da una rapida crescita, che si ritiene abbia origine tubarica con un’acuta instabilità cromosomica. La prognosi sfavorevole dell’HGS-OC è soprattutto dovuta alla chemioresistenza: sebbene le pazienti di solito rispondano alla terapia iniziale e alla chirurgia citoriduttiva seguita da chemioterapia adiuvante con platino e paclitaxel, circa il 70% di quelle affette da carcinoma ovarico in stadio avanzato presenta recidiva; in molti casi, la malattia diventa incurabile principalmente a causa dello sviluppo della resistenza ai farmaci. Questa tesi nasce come collaborazione con Istitituto di Ricerche Farmacologiche Mario Negri, in particolare dall’intuizione di Sergio Marchini che l’uso dei dati di CNA fornirebbe risultati interessanti in termini di diagnosi precoce della malattia. L’analisi presente in questo lavoro viene effettuata in collaborazione con una tesi parallela, che viene presentata a un comitato diverso. Il focus di questo lavoro riguarda gli aspetti e i risultati biologici della ricerca condotta, mentre l’enfasi di quello presentato da Sara Sansone è posta sui metodi computazionali implementati per raggiungere l’obiettivo finale. Una delle peculiarità di questa malattia è la tempistica di ricaduta delle pazienti, che può essere utilizzata come predittore o come etichetta. Usandola nel primo modo, ha reso possibile l’esecuzione di un’analisi di sopravvivenza per discriminare la reattività farmacologica delle pazienti; tuttavia, i risultati ottenuti con questo modello sono stati piuttosto scarsi, quindi si è deciso di utilizzare i tempi di ricaduta come etichetta per classificare i pazienti in classi e, in particolare, ci siamo concentrati su pazienti resistenti alla terapia e sensibili ad essa, in cui i primi sono identificati da recidiva entro un breve intervallo di soli sei mesi dalla diagnosi. Per fare questo, sono stati integrati molti diversi tipi di dati - come dati di espressione genica e miRNA, dati di metilazione del DNA e dati CNA per via del loro coinvolgimento nella diffusione e nello sviluppo del cancro ovarico; questi tipi di dati sono stati scaricati da The Cancer Genome Atlas (TCGA) e le informazioni necessarie per implementare i modelli sono state estratte attraverso l’uso di GenoMetric Query Language (GMQL), sviluppato presso il Politecnico di Milano. Costruire un classificatore efficace attraverso un approccio integrativo è stata la parte piu` difficile della tesi; sulla base di questo approccio siamo riusciti a trovare risultati significativi. Questi risultati sono promettenti e l’integrazione di più tipi di dato può essere considerata un’innovazione per questo caso di studio. Il contributo biologico più significativo è stato quindi l’integrazione delle porzioni del genoma che caratterizzano il classificatore, utile per spiegare da un punto di vista biologico le principali caratteristiche distintive dei pazienti resistenti. Un risultato importante è stata l’identificazione del Notch Signaling Pathway, considerato uno dei pathway più rilevanti per quanto riguarda lo studio delle cellule tumorali resistenti ai farmaci.

Genome-based chemoresistance prediction in high-grade serous ovarian adenocarcinoma

LALLI, GIADA
2018/2019

Abstract

Ovarian cancer is the most lethal gynecologic cancer, causing annually a large number of deaths throughout the world. In particular, high-grade serous ovarian adenocarcinoma (HGS-OC) is the most common type of ovarian epithelial carcinomas and has the worst prognosis; it is a rapidly growing carcinoma, it is believed to have a tubal origin with a high chromosomal instability. Poor prognosis in HGS-OC is largely related to chemoresistance: although patients usually respond to initial therapy and cytoreductive surgery followed by adjuvant chemotherapy with platinum and paclitaxel, ∼70% of those with advanced-stage ovarian cancer experience recurrence; in many cases, the disease becomes incurable mainly due to the development of drug resistance. This thesis is born as cooperation with Istitituto di Ricerche Farmacologiche Mario Negri, particularly driven from biologist Sergio Marchini, who has the intuition that using CNA data would provide interesting results in terms of early diagnosis of the disease. The analysis present in this work is done in collaboration with a parallel thesis, which is presented to a different committee. The focus of this work is on the biological aspects and results of the research, while the emphasis of the other one by Sara Sansone is on the computational methods implemented to achieve the final goal. One of HGS-OC peculiarity its the relapse timing of patients, that may be used as a predictor or as a label. By using it in the first way, we performed survival analysis to discriminate the drug-responsiveness of patients through their time to relapse. The results obtained with this model were quite poor, therefore we decided to use the relapse timing as a label to classify patients in classes, and specifically, we focused on therapy-resistant and therapy-sensitive patients, where the former ones are identified by relapse within a short interval of just six months since diagnosis. To do so, many different data types have been integrated - as gene and miRNA expression data, DNA methylation data and CNA data - because of their involvement in ovarian cancer spreading and development; these data-types were downloaded from The Cancer Genome Atlas (TCGA) repository and the information needed to implement the models have been extracted through the use of GenoMetric Query Language (GMQL), developed at Politecnico di Milano. Building an effective classifier through an integrative approach was the most difficult part of the thesis; based on this approach we were able to find significant results. These results are promising, and the integration of multiple data-types can be considered an innovation for this case of study. The most significant biological contribution was then integration of the genome portions that characterize the classifier, useful for explaining from a biological point of view the main distinctive features of resistant patients. An important outcome was the identification of the Notch Signaling Pathway, considered to be one of the most important signalling pathways in drug-resistance tumor cells.
CANAKOGLU, ARIF
IEVA, FRANCESCA
PINOLI, PIETRO
ING - Scuola di Ingegneria Industriale e dell'Informazione
18-dic-2019
2018/2019
Il carcinoma ovarico è il tumore ginecologico più letale, e ogni anno causa un numero elevatissimo di decessi in tutto il mondo. In particolare, l’adenocarcinoma ovarico sieroso di alto grado (HGS-OC) è il tipo più comune di carcinoma epiteliale ovarico e presenta la prognosi peggiore; ´e un carcinoma caratterizzato da una rapida crescita, che si ritiene abbia origine tubarica con un’acuta instabilità cromosomica. La prognosi sfavorevole dell’HGS-OC è soprattutto dovuta alla chemioresistenza: sebbene le pazienti di solito rispondano alla terapia iniziale e alla chirurgia citoriduttiva seguita da chemioterapia adiuvante con platino e paclitaxel, circa il 70% di quelle affette da carcinoma ovarico in stadio avanzato presenta recidiva; in molti casi, la malattia diventa incurabile principalmente a causa dello sviluppo della resistenza ai farmaci. Questa tesi nasce come collaborazione con Istitituto di Ricerche Farmacologiche Mario Negri, in particolare dall’intuizione di Sergio Marchini che l’uso dei dati di CNA fornirebbe risultati interessanti in termini di diagnosi precoce della malattia. L’analisi presente in questo lavoro viene effettuata in collaborazione con una tesi parallela, che viene presentata a un comitato diverso. Il focus di questo lavoro riguarda gli aspetti e i risultati biologici della ricerca condotta, mentre l’enfasi di quello presentato da Sara Sansone è posta sui metodi computazionali implementati per raggiungere l’obiettivo finale. Una delle peculiarità di questa malattia è la tempistica di ricaduta delle pazienti, che può essere utilizzata come predittore o come etichetta. Usandola nel primo modo, ha reso possibile l’esecuzione di un’analisi di sopravvivenza per discriminare la reattività farmacologica delle pazienti; tuttavia, i risultati ottenuti con questo modello sono stati piuttosto scarsi, quindi si è deciso di utilizzare i tempi di ricaduta come etichetta per classificare i pazienti in classi e, in particolare, ci siamo concentrati su pazienti resistenti alla terapia e sensibili ad essa, in cui i primi sono identificati da recidiva entro un breve intervallo di soli sei mesi dalla diagnosi. Per fare questo, sono stati integrati molti diversi tipi di dati - come dati di espressione genica e miRNA, dati di metilazione del DNA e dati CNA per via del loro coinvolgimento nella diffusione e nello sviluppo del cancro ovarico; questi tipi di dati sono stati scaricati da The Cancer Genome Atlas (TCGA) e le informazioni necessarie per implementare i modelli sono state estratte attraverso l’uso di GenoMetric Query Language (GMQL), sviluppato presso il Politecnico di Milano. Costruire un classificatore efficace attraverso un approccio integrativo è stata la parte piu` difficile della tesi; sulla base di questo approccio siamo riusciti a trovare risultati significativi. Questi risultati sono promettenti e l’integrazione di più tipi di dato può essere considerata un’innovazione per questo caso di studio. Il contributo biologico più significativo è stato quindi l’integrazione delle porzioni del genoma che caratterizzano il classificatore, utile per spiegare da un punto di vista biologico le principali caratteristiche distintive dei pazienti resistenti. Un risultato importante è stata l’identificazione del Notch Signaling Pathway, considerato uno dei pathway più rilevanti per quanto riguarda lo studio delle cellule tumorali resistenti ai farmaci.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2019_12_Lalli.pdf

Open Access dal 03/12/2020

Descrizione: Testo della tesi
Dimensione 18.28 MB
Formato Adobe PDF
18.28 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/152615