Cornelia de Lange Syndrome (CdLS) is a multi-systemic disease that involves the individual's physical, cognitive and behavioural sphere. The CdLS does not involve the manifestation of a unique phenotype, even if it is easily identifiable in paediatric age due to some aspects that occur with greater frequency, such as craniofacial and limb malformations. The cause of 70% of the CdLS cases concerns the mutation of the NIPBL (Nipped-B-Like Protein) gene, which together with other 4 genes (SMC1A, SMC3, HDAC8, RAD21, NIPBL), encode 5 proteins that are very important in the regulation of the cohesin complex. The Cohesin complex is a protein complex that regulates the segregation of sister chromatids during cell division, mitosis and meiosis. The loading of the cohesin complex onto the chromatin is mediated by NIPBL, which is why the latter has a very important role for the correct performance of the functions previously illustrated, such as DNA repair, in response to oxidative stress and RNA biogenesis. In this regard, the CdLS is part of a group of pathologies, called Cohesinopathies, that is genetic diseases associated with delayed mental development and various malformations concerning the heart, hands, legs, bones, internal organs and facial features. About 50% of the mutations of the NIPBL gene responsible for the appearance of CdLS are of the point type (single nucleotide), in one of the 2 alleles of the gene. This is the case examined in a 5-year-old patient, on whom the study and analysis of the thesis project was focused. In particular, the patient has a missense nucleotide mutation G5483A, which leads to the synthesis of a protein with the Arg1828Gln mutation, where this mutation is believed to have a causal link with the onset of the CdLS. Given the importance of the NIPBL gene for the development of different embryonic tissues, the research and laboratory activity has been focused on the in vitro cultures of induced Pluripotent Stem Cells (iPSCs) derived from peripheral blood mononuclear cells (PBMC) of the patient and her parents (healthy mother and father). In fact, iPSCs are believed to represent a reliable and highly interesting cell model for studying the consequences of the mutation of the NIPBL protein on the tissue formation process. Starting from the creation and molecular characterization of a stem cell model based on iPSCs cells of the patient's (mutated) and parental (normal), the aim of the research is to identify the level of expression of the active genes inside the cultured cells under conditions proliferation, and check computationally whether the transformation into iPSCs has occurred correctly through the analysis of the karyotype and the confirmation of the maintenance of the point mutation in NIPBL. We also want, through the aid of the expressed mRNA sequencing technology (RNA-Seq), to evaluate the expression profiles differentially expressed in the patient with respect to parental controls, in order to identify the genetic "networks" potentially implicated in the cell growth and proliferation processes, and the pathways that are modulated in their activity by the mutated NIPBL protein. The final goal is therefore to identify an alternative way to cure the disease, as it is not possible to act directly on the mutation. This is since the disease is caused by malformations that occurred during development, therefore we cannot think of reversing the malformations and treating the patient. On the other hand, we can think of alleviating the symptoms by identifying and targeting the genes implicated in the biological processes involved in some of the significant pathways obtained from the enrichment analysis. This research project must however be framed as a first pilot phase aimed at creating a simplified cellular model capable of allowing us to identify new drug targets for the development of therapeutic approaches in the context of the CdLS. The next step consists in inducing the differentiation of iPSCs into suitable cell types, in order to test the pharmacological targets in the pathways identified in the transcriptomic analysis, and evaluate their effects by means of a further RNA-Seq analysis and an analysis of the three-dimensional structure chromatin using the "High-throughput Sequencing for Chromosome Conformation Capture" (Hi-C) technique. Both the RNA-Seq and DNA-Seq data were obtained through the sequencer "NextSeq 500 Illumina". As regards the computational methods used, in order to obtain the starting data for the RNA-Seq analysis, the "STAR" alignment tool was used on the "Bash Shell" platform. This allowed to align the starting genomic sequences, and to be able to continue with the RNA-Seq analysis of the data. The transcriptomic analysis was therefore carried out using the R packages "DESeq2" and "GSEABase". The alignment of the "Shallow Whole Genome" data for DNA-Seq analysis was carried out using the "BWA" alignment tool. The analysis of the Karyotype and the "Copy Number Variations" was then carried out using the R "KaryoploteR" and "QDNAseq" packages. The analysis for the identification of SNP and INDEL point mutations was also performed on Bash using the "VarScan" tool. Analysing the results obtained, as far as DNA sequencing is concerned, the analysis of the karyotype and the CNVs allowed to demonstrate that the in vitro manipulation process of the PBMC did not introduce alterations in the genome. In addition, the analysis of point mutations using VarScan confirmed the presence of the point mutation in NIPBL after transformation into iPSCs, and the non-presence of other pathogenic point mutations. Through the RNA-Seq analysis it has been observed that the levels of the transcript (mRNA) originating from the NIPBL gene are very similar in the iPSCs cells of the patient and the 2 parents. This observation suggests that the mutation present in one of the two alleles of the NIPBL gene has no effect on the transcription of the same gene, while evidently it has an effect on protein function. Also, from the transcriptomic analysis, it was found that even the mRNA levels of the genes of the cohesin complex do not show significant differences in expression in the cells of the patient and the 2 parents. The RNA-Seq analysis was also carried out trying to separate the coding genes from the non-coding ones, on the base of the work done by Schwarzer et al., of 2017, in order to ascertain whether the expression levels of the non-coding genes were up-regulated in the patient's mutated samples compared to parental control, in order to validate the thesis that the lack of TAD formation and excessive compartmentalization would activate genes that are usually inactive and non-coding. The data obtained with the RNA-seq experiments also made it possible to obtain a whole series of genes differentially expressed between the patient and the parents. These differentially expressed genes were subjected to an enrichment analysis in order to identify the biological processes in which they are involved. Among the most significant results, it is interesting to note an enrichment of the processes involved in the morphogenesis and development of embryos and of various organs such as the kidney, ear, eye and central nervous system. These data are interesting because they indicate that the mutation of the NIPBL gene alters the expression of other genes that probably have an important role in the formation of a series of organs whose development is defective in the CdLS. Overall, the enrichment analysis carried out suggest that some of the genes involved in the morphogenesis and organ development processes mentioned above may represent pharmacological targets for possible therapeutic strategies based on the development of specific inhibitors, assuming that these treatments have the ability to mitigate or reverse the developmental problems in the organs. Another very interesting result found concerns a pathway related to methylation ("LIANG_SILENCED_BY_METHYLATION_2"), which is depleted in the patient compared to all 3 controls carried out. This pathway concerns genes that are up regulated after treatment with a demethylant called "Decitabine", a drug used to activate some genes that are inactivated by hyper-methylation in some cases of tumorigenesis. The fact that this pathway is depleted suggests that there may be a methylation or hypermethylation taking place in the patient, and therefore the silencing of some genes. This finding is very relevant, as the NIPBL mutation in question, and the problems related to the cohesin complex, affect the chromatin architecture and the structural organization of DNA, which is in turn linked to methylation phenomena. These results therefore suggest the way to undertake in the following steps, that is to proceed in the differentiation of iPSCs cells towards renal, neuronal, hepatocyte and cardiac cells in vitro, to be used in further studies aimed at identifying relevant pharmacological targets in the different target organs to develop new therapeutic strategies. Furthermore, a further step is to proceed by evaluating the chromosome structure and organization using the Hi-C technique, both in basal conditions and following treatment with demethylating drugs, as suggested by the RNA-Seq enrichment analysis, and always check the implications with a further transcriptomic analysis.

La Sindrome di Cornelia de Lange (CdLS) è una malattia multi-sistemica che coinvolge la sfera fisica, cognitiva e comportamentale dell’individuo. La CdLS non comporta la manifestazione di un fenotipo univoco, anche se risulta facilmente identificabile in età pediatrica a causa di alcuni aspetti che si manifestano con maggiore frequenza, quali malformazioni cranio-facciali e degli arti. La causa del 70% delle casistiche di CdLS riguarda la mutazione del gene NIPBL (Nipped-B-Like Protein), che insieme ad altri 4 geni (SMC1A, SMC3, HDAC8, RAD21, NIPBL), codificano per 5 proteine che sono molto importanti nella regolazione del complesso della coesina. Il complesso della Coesina è un complesso proteico che regola la segregazione dei cromatidi fratelli durante la divisione cellulare, la mitosi e la meiosi. Il caricamento del complesso della coesina sulla cromatina è mediato da NIPBL, motivo per il quale quest’ultimo ha un ruolo molto importante per il corretto svolgimento delle funzioni precedentemente illustrate, quali riparazione del DNA, riposta allo stress ossidativo e biogenesi dell’RNA. A tal proposito, la CdLS fa parte di un gruppo di patologie, chiamate Coesinopatie, ovvero malattie genetiche associate ad un ritardo dello sviluppo mentale e varie malformazioni riguardanti cuore, mani, gambe, ossa, organi interni e caratteristiche facciali. Circa il 50% delle mutazioni del gene NIPBL responsabili della comparsa delle CdLS sono di tipo puntiforme (a singolo nucleotide), in uno dei 2 alleli del gene. È questo il caso preso in esame in una paziente dell’età di 5 anni, sul quale è stato incentrato lo studio e l’analisi del progetto di tesi. In particolare, la paziente presenta una mutazione nucleotidica missenso G5483A, che porta alla sintesi di una proteina con la mutazione Arg1828Gln, dove si ritiene che tale mutazione abbia un nesso causale con l’insorgenza della CdLS. Data l’importanza del gene NIPBL per lo sviluppo di diversi tessuti embrionali, l’attività di ricerca e di laboratorio è stata incentrata sulle colture in vitro di cellule staminali pluripotenti indotte iPSCs (Induced Pluripotent Stem Cells) provenienti dalle cellule mononucleate da sangue periferico (PBMC) della paziente e dei suoi genitori (madre e padre sani). Si ritiene infatti che le iPSCs rappresentino un modello cellulare affidabile e di grande interesse per studiare le conseguenze della mutazione della proteina NIPBL sul processo di formazione dei tessuti. Partendo dalla realizzazione e dalla caratterizzazione molecolare di un modello cellulare staminale basato sulle cellule iPSCs della paziente (mutato) e parentale (normale), lo scopo della ricerca è quello di identificare il livello di espressione dei geni attivi all’interno delle cellule in coltura in condizioni di proliferazione, e verificare computazionalmente se la trasformazione in iPSCs è avvenuta correttamente tramite l’analisi del Cariotipo e del riscontro del mantenimento della mutazione puntiforme in NIPBL. Si vuole inoltre, mediante l’ausilio della tecnologia di sequenziamento degli mRNA espressi (RNA-Seq), valutare i profili di espressione differenzialmente espressi nella paziente rispetto ai controlli parentali, al fine di identificare i “network” genetici potenzialmente implicati nei processi di crescita e proliferazione cellulare, ed i pathway che sono modulati nella loro attività da parte della proteina NIPBL mutata. L’obbiettivo finale consiste quindi nell’identificare una via alternativa alla cura della patologia, in quanto non risulta possibile agire direttamente sulla mutazione. Ciò è dovuto dal fatto che la malattia è causata da malformazioni che sono avvenute durante lo sviluppo, pertanto non si può pensare di revertire le malformazioni e curare la paziente. Bensì, si può pensare di alleviarne i sintomi, identificando e targettando i geni coinvolti nei processi biologici implicati in alcuni dei pathway significativi ottenuti dall’analisi di arricchimento. Tale progetto di ricerca deve comunque essere inquadrato come una prima fase pilota mirato alla realizzazione di un modello cellulare semplificato in grado di permetterci l’identificazione di nuovi bersagli farmacologici per lo sviluppo di approcci terapeutici nell’ambito della CdLS. Lo step successivo consiste nell’induzione del differenziamento delle iPSCs nei tipi cellulari idonei, al fine di testare i target farmacologici nei pathway identificati nell’analisi trascrittomica, e valutarne gli effetti mediante un’ulteriore analisi RNA-Seq ed un’analisi della struttura tridimensionale della cromatina mediante la tecnica di “High-throughput Sequencing for Chromosome Conformation Capture” (Hi-C). Sia i dati di RNA-Seq che di DNA-Seq sono stati ottenuti tramite il sequenziatore “NextSeq 500 Illumina”. Per quanto riguarda le metodiche computazionali impiegate, al fine di ottenere i dati di partenza per l’analisi RNA-Seq è stato impiegato sulla piattaforma “Bash Shell” il tool di allineamento “STAR”. Ciò ha permesso di allineare le sequenze genomiche di partenza, e poter proseguire con l’analisi RNA-Seq dei dati. L’analisi trascrittomica è stata quindi effettuata mediante i pacchetti R “DESeq2” e “GSEABase”. L’allineamento dei dati di “Shallow Whole Genome” per l’analisi di DNA-Seq è stato effettuato tramite il tool di allineamento “BWA”. L’analisi del Cariotipo e delle “Copy Number Variation” è stata quindi effettuata mediante i pacchetti R “KaryoploteR” e “QDNAseq”. Su Bash è stata effettuata anche l’analisi per l’identificazione delle mutazioni puntiformi SNP ed INDEL mediante il tool “VarScan”. Analizzando i risultati ottenuti, per quanto riguarda il sequenziamento del DNA, le analisi del cariotipo e delle CNVs hanno permesso di dimostrare che il processo di manipolazione in vitro dei PBMC non ha introdotto alterazioni nel genoma. Inoltre, l’analisi delle mutazioni puntiformi mediante VarScan ha confermato la presenza della mutazione puntiforme in NIPBL dopo la trasformazione in iPSCs, e la non-presenza di altre mutazioni puntiformi patogeniche. Tramite l’analisi RNA-Seq è stato osservato che i livelli del trascritto (mRNA) originato dal gene NIPBL sono molto simili nelle cellule iPSCs della paziente e dei 2 genitori. Tale osservazione suggerisce che la mutazione presente in uno dei due alleli del gene NIPBL non ha alcun effetto sulla trascrizione del gene stesso, mentre evidentemente ha un effetto sulla funzione della proteina. Sempre dall’analisi trascrittomica, è stato constatato che anche i livelli degli mRNA dei geni del complesso della coesina non presentano differenze significative di espressione nelle cellule della paziente e dei 2 genitori. Si è svolta anche l’analisi RNA-Seq cercando di separare i geni codificanti da quelli non codificanti, sulla falsa riga del lavoro svolto da Schwarzer et al., del 2017, al fine di constatare se i livelli di espressione dei geni non codificanti fossero up-regolati nei campioni mutati della paziente rispetto al controllo dei genitori, al fine di validare la tesi per la quale la mancata formazione dei TAD e l'eccessiva compartimentalizzazione andasse ad attivare geni solitamente inattivi e non-codificanti. I dati ottenuti con gli esperimenti di RNA-seq hanno inoltre permesso di ottenere tutta una serie di geni differenzialmente espressi nei confronti tra la paziente ed i genitori. Tali geni differenzialmente espressi sono stati sottoposti ad un’analisi di arricchimento al fine di identificare i processi biologici in cui sono coinvolti. Tra i risultati maggiormente significativi è interessante notare un arricchimento dei processi coinvolti nella morfogenesi e sviluppo degli embrioni e di vari organi quali il rene, l’orecchio, l’occhio ed il sistema nervoso centrale. Questi dati sono interessanti perché indicano che la mutazione del gene NIPBL altera l’espressione di altri geni che probabilmente hanno un ruolo importante nella formazione di una serie di organi il cui sviluppo è difettivo nella CdLS. Nel complesso, le analisi di arricchimento effettuate suggeriscono che alcuni dei geni implicati nei processi di morfogenesi e sviluppo degli organi di cui sopra possano rappresentare bersagli farmacologici per possibili strategie terapeutiche basate sullo sviluppo di inibitori specifici, ipotizzando che tali trattamenti abbiano la capacità di mitigare o invertire i problemi di sviluppo negli organi. Un altro risultato molto interessante trovato riguarda un pathway correlato alla metilazione (“LIANG_SILENCED_BY_METHYLATION_2”), che risulta arricchito in negativo nella paziente rispetto a tutti e 3 i controlli effettuati. Tale pathway riguarda geni che risultano up-regolati dopo il trattamento con un demetilante chiamato “Decitabina”, un farmaco impiegato per attivare alcuni geni che vengono inattivati da una iper-metilazione in alcuni casi di tumorigenesi. Il fatto che tale pathway sia arricchito negativamente suggerisce che può esserci in atto una metilazione o iper-metilazione nella paziente, e quindi il silenziamento di alcuni geni. Tale riscontro risulta molto rilevante, in quanto la mutazione di NIPBL in questione, ed i problemi relativi al complesso della coesina, si ripercuotono nell’architettura della cromatina e nell’organizzazione strutturale del DNA, che è a sua volta legata a fenomeni di metilazione. Questi risultati ci suggeriscono quindi le mosse da adottare negli step successivi, ovvero procedere nella differenziazione delle cellule iPSCs verso cellule renali, neuronali, epatocitarie e cardiache in vitro, per essere impiegate in ulteriori studi volti ad identificare target farmacologici rilevanti nei diversi organi bersaglio per sviluppare nuove strategie terapeutiche. Inoltre, un ulteriore step è quello procedere valutando la struttura e l’organizzazione cromosomica mediante la tecnica Hi-C, sia in condizioni basali che in seguito a trattamento con farmaci demetilanti, come suggerito dall’analisi di arricchimento RNA-Seq, e verificarne le implicazioni sempre con un ulteriore analisi trascrittomica.

Multi-omic computational analysis to develop a new strategy for pharmacological treatment of Cornelia de Lange syndrome

GUARRERA, LUCA
2018/2019

Abstract

Cornelia de Lange Syndrome (CdLS) is a multi-systemic disease that involves the individual's physical, cognitive and behavioural sphere. The CdLS does not involve the manifestation of a unique phenotype, even if it is easily identifiable in paediatric age due to some aspects that occur with greater frequency, such as craniofacial and limb malformations. The cause of 70% of the CdLS cases concerns the mutation of the NIPBL (Nipped-B-Like Protein) gene, which together with other 4 genes (SMC1A, SMC3, HDAC8, RAD21, NIPBL), encode 5 proteins that are very important in the regulation of the cohesin complex. The Cohesin complex is a protein complex that regulates the segregation of sister chromatids during cell division, mitosis and meiosis. The loading of the cohesin complex onto the chromatin is mediated by NIPBL, which is why the latter has a very important role for the correct performance of the functions previously illustrated, such as DNA repair, in response to oxidative stress and RNA biogenesis. In this regard, the CdLS is part of a group of pathologies, called Cohesinopathies, that is genetic diseases associated with delayed mental development and various malformations concerning the heart, hands, legs, bones, internal organs and facial features. About 50% of the mutations of the NIPBL gene responsible for the appearance of CdLS are of the point type (single nucleotide), in one of the 2 alleles of the gene. This is the case examined in a 5-year-old patient, on whom the study and analysis of the thesis project was focused. In particular, the patient has a missense nucleotide mutation G5483A, which leads to the synthesis of a protein with the Arg1828Gln mutation, where this mutation is believed to have a causal link with the onset of the CdLS. Given the importance of the NIPBL gene for the development of different embryonic tissues, the research and laboratory activity has been focused on the in vitro cultures of induced Pluripotent Stem Cells (iPSCs) derived from peripheral blood mononuclear cells (PBMC) of the patient and her parents (healthy mother and father). In fact, iPSCs are believed to represent a reliable and highly interesting cell model for studying the consequences of the mutation of the NIPBL protein on the tissue formation process. Starting from the creation and molecular characterization of a stem cell model based on iPSCs cells of the patient's (mutated) and parental (normal), the aim of the research is to identify the level of expression of the active genes inside the cultured cells under conditions proliferation, and check computationally whether the transformation into iPSCs has occurred correctly through the analysis of the karyotype and the confirmation of the maintenance of the point mutation in NIPBL. We also want, through the aid of the expressed mRNA sequencing technology (RNA-Seq), to evaluate the expression profiles differentially expressed in the patient with respect to parental controls, in order to identify the genetic "networks" potentially implicated in the cell growth and proliferation processes, and the pathways that are modulated in their activity by the mutated NIPBL protein. The final goal is therefore to identify an alternative way to cure the disease, as it is not possible to act directly on the mutation. This is since the disease is caused by malformations that occurred during development, therefore we cannot think of reversing the malformations and treating the patient. On the other hand, we can think of alleviating the symptoms by identifying and targeting the genes implicated in the biological processes involved in some of the significant pathways obtained from the enrichment analysis. This research project must however be framed as a first pilot phase aimed at creating a simplified cellular model capable of allowing us to identify new drug targets for the development of therapeutic approaches in the context of the CdLS. The next step consists in inducing the differentiation of iPSCs into suitable cell types, in order to test the pharmacological targets in the pathways identified in the transcriptomic analysis, and evaluate their effects by means of a further RNA-Seq analysis and an analysis of the three-dimensional structure chromatin using the "High-throughput Sequencing for Chromosome Conformation Capture" (Hi-C) technique. Both the RNA-Seq and DNA-Seq data were obtained through the sequencer "NextSeq 500 Illumina". As regards the computational methods used, in order to obtain the starting data for the RNA-Seq analysis, the "STAR" alignment tool was used on the "Bash Shell" platform. This allowed to align the starting genomic sequences, and to be able to continue with the RNA-Seq analysis of the data. The transcriptomic analysis was therefore carried out using the R packages "DESeq2" and "GSEABase". The alignment of the "Shallow Whole Genome" data for DNA-Seq analysis was carried out using the "BWA" alignment tool. The analysis of the Karyotype and the "Copy Number Variations" was then carried out using the R "KaryoploteR" and "QDNAseq" packages. The analysis for the identification of SNP and INDEL point mutations was also performed on Bash using the "VarScan" tool. Analysing the results obtained, as far as DNA sequencing is concerned, the analysis of the karyotype and the CNVs allowed to demonstrate that the in vitro manipulation process of the PBMC did not introduce alterations in the genome. In addition, the analysis of point mutations using VarScan confirmed the presence of the point mutation in NIPBL after transformation into iPSCs, and the non-presence of other pathogenic point mutations. Through the RNA-Seq analysis it has been observed that the levels of the transcript (mRNA) originating from the NIPBL gene are very similar in the iPSCs cells of the patient and the 2 parents. This observation suggests that the mutation present in one of the two alleles of the NIPBL gene has no effect on the transcription of the same gene, while evidently it has an effect on protein function. Also, from the transcriptomic analysis, it was found that even the mRNA levels of the genes of the cohesin complex do not show significant differences in expression in the cells of the patient and the 2 parents. The RNA-Seq analysis was also carried out trying to separate the coding genes from the non-coding ones, on the base of the work done by Schwarzer et al., of 2017, in order to ascertain whether the expression levels of the non-coding genes were up-regulated in the patient's mutated samples compared to parental control, in order to validate the thesis that the lack of TAD formation and excessive compartmentalization would activate genes that are usually inactive and non-coding. The data obtained with the RNA-seq experiments also made it possible to obtain a whole series of genes differentially expressed between the patient and the parents. These differentially expressed genes were subjected to an enrichment analysis in order to identify the biological processes in which they are involved. Among the most significant results, it is interesting to note an enrichment of the processes involved in the morphogenesis and development of embryos and of various organs such as the kidney, ear, eye and central nervous system. These data are interesting because they indicate that the mutation of the NIPBL gene alters the expression of other genes that probably have an important role in the formation of a series of organs whose development is defective in the CdLS. Overall, the enrichment analysis carried out suggest that some of the genes involved in the morphogenesis and organ development processes mentioned above may represent pharmacological targets for possible therapeutic strategies based on the development of specific inhibitors, assuming that these treatments have the ability to mitigate or reverse the developmental problems in the organs. Another very interesting result found concerns a pathway related to methylation ("LIANG_SILENCED_BY_METHYLATION_2"), which is depleted in the patient compared to all 3 controls carried out. This pathway concerns genes that are up regulated after treatment with a demethylant called "Decitabine", a drug used to activate some genes that are inactivated by hyper-methylation in some cases of tumorigenesis. The fact that this pathway is depleted suggests that there may be a methylation or hypermethylation taking place in the patient, and therefore the silencing of some genes. This finding is very relevant, as the NIPBL mutation in question, and the problems related to the cohesin complex, affect the chromatin architecture and the structural organization of DNA, which is in turn linked to methylation phenomena. These results therefore suggest the way to undertake in the following steps, that is to proceed in the differentiation of iPSCs cells towards renal, neuronal, hepatocyte and cardiac cells in vitro, to be used in further studies aimed at identifying relevant pharmacological targets in the different target organs to develop new therapeutic strategies. Furthermore, a further step is to proceed by evaluating the chromosome structure and organization using the Hi-C technique, both in basal conditions and following treatment with demethylating drugs, as suggested by the RNA-Seq enrichment analysis, and always check the implications with a further transcriptomic analysis.
BOLIS, MARCO
GARATTINI, ENRICO
FRATELLI, MADDALENA
ING - Scuola di Ingegneria Industriale e dell'Informazione
29-apr-2020
2018/2019
La Sindrome di Cornelia de Lange (CdLS) è una malattia multi-sistemica che coinvolge la sfera fisica, cognitiva e comportamentale dell’individuo. La CdLS non comporta la manifestazione di un fenotipo univoco, anche se risulta facilmente identificabile in età pediatrica a causa di alcuni aspetti che si manifestano con maggiore frequenza, quali malformazioni cranio-facciali e degli arti. La causa del 70% delle casistiche di CdLS riguarda la mutazione del gene NIPBL (Nipped-B-Like Protein), che insieme ad altri 4 geni (SMC1A, SMC3, HDAC8, RAD21, NIPBL), codificano per 5 proteine che sono molto importanti nella regolazione del complesso della coesina. Il complesso della Coesina è un complesso proteico che regola la segregazione dei cromatidi fratelli durante la divisione cellulare, la mitosi e la meiosi. Il caricamento del complesso della coesina sulla cromatina è mediato da NIPBL, motivo per il quale quest’ultimo ha un ruolo molto importante per il corretto svolgimento delle funzioni precedentemente illustrate, quali riparazione del DNA, riposta allo stress ossidativo e biogenesi dell’RNA. A tal proposito, la CdLS fa parte di un gruppo di patologie, chiamate Coesinopatie, ovvero malattie genetiche associate ad un ritardo dello sviluppo mentale e varie malformazioni riguardanti cuore, mani, gambe, ossa, organi interni e caratteristiche facciali. Circa il 50% delle mutazioni del gene NIPBL responsabili della comparsa delle CdLS sono di tipo puntiforme (a singolo nucleotide), in uno dei 2 alleli del gene. È questo il caso preso in esame in una paziente dell’età di 5 anni, sul quale è stato incentrato lo studio e l’analisi del progetto di tesi. In particolare, la paziente presenta una mutazione nucleotidica missenso G5483A, che porta alla sintesi di una proteina con la mutazione Arg1828Gln, dove si ritiene che tale mutazione abbia un nesso causale con l’insorgenza della CdLS. Data l’importanza del gene NIPBL per lo sviluppo di diversi tessuti embrionali, l’attività di ricerca e di laboratorio è stata incentrata sulle colture in vitro di cellule staminali pluripotenti indotte iPSCs (Induced Pluripotent Stem Cells) provenienti dalle cellule mononucleate da sangue periferico (PBMC) della paziente e dei suoi genitori (madre e padre sani). Si ritiene infatti che le iPSCs rappresentino un modello cellulare affidabile e di grande interesse per studiare le conseguenze della mutazione della proteina NIPBL sul processo di formazione dei tessuti. Partendo dalla realizzazione e dalla caratterizzazione molecolare di un modello cellulare staminale basato sulle cellule iPSCs della paziente (mutato) e parentale (normale), lo scopo della ricerca è quello di identificare il livello di espressione dei geni attivi all’interno delle cellule in coltura in condizioni di proliferazione, e verificare computazionalmente se la trasformazione in iPSCs è avvenuta correttamente tramite l’analisi del Cariotipo e del riscontro del mantenimento della mutazione puntiforme in NIPBL. Si vuole inoltre, mediante l’ausilio della tecnologia di sequenziamento degli mRNA espressi (RNA-Seq), valutare i profili di espressione differenzialmente espressi nella paziente rispetto ai controlli parentali, al fine di identificare i “network” genetici potenzialmente implicati nei processi di crescita e proliferazione cellulare, ed i pathway che sono modulati nella loro attività da parte della proteina NIPBL mutata. L’obbiettivo finale consiste quindi nell’identificare una via alternativa alla cura della patologia, in quanto non risulta possibile agire direttamente sulla mutazione. Ciò è dovuto dal fatto che la malattia è causata da malformazioni che sono avvenute durante lo sviluppo, pertanto non si può pensare di revertire le malformazioni e curare la paziente. Bensì, si può pensare di alleviarne i sintomi, identificando e targettando i geni coinvolti nei processi biologici implicati in alcuni dei pathway significativi ottenuti dall’analisi di arricchimento. Tale progetto di ricerca deve comunque essere inquadrato come una prima fase pilota mirato alla realizzazione di un modello cellulare semplificato in grado di permetterci l’identificazione di nuovi bersagli farmacologici per lo sviluppo di approcci terapeutici nell’ambito della CdLS. Lo step successivo consiste nell’induzione del differenziamento delle iPSCs nei tipi cellulari idonei, al fine di testare i target farmacologici nei pathway identificati nell’analisi trascrittomica, e valutarne gli effetti mediante un’ulteriore analisi RNA-Seq ed un’analisi della struttura tridimensionale della cromatina mediante la tecnica di “High-throughput Sequencing for Chromosome Conformation Capture” (Hi-C). Sia i dati di RNA-Seq che di DNA-Seq sono stati ottenuti tramite il sequenziatore “NextSeq 500 Illumina”. Per quanto riguarda le metodiche computazionali impiegate, al fine di ottenere i dati di partenza per l’analisi RNA-Seq è stato impiegato sulla piattaforma “Bash Shell” il tool di allineamento “STAR”. Ciò ha permesso di allineare le sequenze genomiche di partenza, e poter proseguire con l’analisi RNA-Seq dei dati. L’analisi trascrittomica è stata quindi effettuata mediante i pacchetti R “DESeq2” e “GSEABase”. L’allineamento dei dati di “Shallow Whole Genome” per l’analisi di DNA-Seq è stato effettuato tramite il tool di allineamento “BWA”. L’analisi del Cariotipo e delle “Copy Number Variation” è stata quindi effettuata mediante i pacchetti R “KaryoploteR” e “QDNAseq”. Su Bash è stata effettuata anche l’analisi per l’identificazione delle mutazioni puntiformi SNP ed INDEL mediante il tool “VarScan”. Analizzando i risultati ottenuti, per quanto riguarda il sequenziamento del DNA, le analisi del cariotipo e delle CNVs hanno permesso di dimostrare che il processo di manipolazione in vitro dei PBMC non ha introdotto alterazioni nel genoma. Inoltre, l’analisi delle mutazioni puntiformi mediante VarScan ha confermato la presenza della mutazione puntiforme in NIPBL dopo la trasformazione in iPSCs, e la non-presenza di altre mutazioni puntiformi patogeniche. Tramite l’analisi RNA-Seq è stato osservato che i livelli del trascritto (mRNA) originato dal gene NIPBL sono molto simili nelle cellule iPSCs della paziente e dei 2 genitori. Tale osservazione suggerisce che la mutazione presente in uno dei due alleli del gene NIPBL non ha alcun effetto sulla trascrizione del gene stesso, mentre evidentemente ha un effetto sulla funzione della proteina. Sempre dall’analisi trascrittomica, è stato constatato che anche i livelli degli mRNA dei geni del complesso della coesina non presentano differenze significative di espressione nelle cellule della paziente e dei 2 genitori. Si è svolta anche l’analisi RNA-Seq cercando di separare i geni codificanti da quelli non codificanti, sulla falsa riga del lavoro svolto da Schwarzer et al., del 2017, al fine di constatare se i livelli di espressione dei geni non codificanti fossero up-regolati nei campioni mutati della paziente rispetto al controllo dei genitori, al fine di validare la tesi per la quale la mancata formazione dei TAD e l'eccessiva compartimentalizzazione andasse ad attivare geni solitamente inattivi e non-codificanti. I dati ottenuti con gli esperimenti di RNA-seq hanno inoltre permesso di ottenere tutta una serie di geni differenzialmente espressi nei confronti tra la paziente ed i genitori. Tali geni differenzialmente espressi sono stati sottoposti ad un’analisi di arricchimento al fine di identificare i processi biologici in cui sono coinvolti. Tra i risultati maggiormente significativi è interessante notare un arricchimento dei processi coinvolti nella morfogenesi e sviluppo degli embrioni e di vari organi quali il rene, l’orecchio, l’occhio ed il sistema nervoso centrale. Questi dati sono interessanti perché indicano che la mutazione del gene NIPBL altera l’espressione di altri geni che probabilmente hanno un ruolo importante nella formazione di una serie di organi il cui sviluppo è difettivo nella CdLS. Nel complesso, le analisi di arricchimento effettuate suggeriscono che alcuni dei geni implicati nei processi di morfogenesi e sviluppo degli organi di cui sopra possano rappresentare bersagli farmacologici per possibili strategie terapeutiche basate sullo sviluppo di inibitori specifici, ipotizzando che tali trattamenti abbiano la capacità di mitigare o invertire i problemi di sviluppo negli organi. Un altro risultato molto interessante trovato riguarda un pathway correlato alla metilazione (“LIANG_SILENCED_BY_METHYLATION_2”), che risulta arricchito in negativo nella paziente rispetto a tutti e 3 i controlli effettuati. Tale pathway riguarda geni che risultano up-regolati dopo il trattamento con un demetilante chiamato “Decitabina”, un farmaco impiegato per attivare alcuni geni che vengono inattivati da una iper-metilazione in alcuni casi di tumorigenesi. Il fatto che tale pathway sia arricchito negativamente suggerisce che può esserci in atto una metilazione o iper-metilazione nella paziente, e quindi il silenziamento di alcuni geni. Tale riscontro risulta molto rilevante, in quanto la mutazione di NIPBL in questione, ed i problemi relativi al complesso della coesina, si ripercuotono nell’architettura della cromatina e nell’organizzazione strutturale del DNA, che è a sua volta legata a fenomeni di metilazione. Questi risultati ci suggeriscono quindi le mosse da adottare negli step successivi, ovvero procedere nella differenziazione delle cellule iPSCs verso cellule renali, neuronali, epatocitarie e cardiache in vitro, per essere impiegate in ulteriori studi volti ad identificare target farmacologici rilevanti nei diversi organi bersaglio per sviluppare nuove strategie terapeutiche. Inoltre, un ulteriore step è quello procedere valutando la struttura e l’organizzazione cromosomica mediante la tecnica Hi-C, sia in condizioni basali che in seguito a trattamento con farmaci demetilanti, come suggerito dall’analisi di arricchimento RNA-Seq, e verificarne le implicazioni sempre con un ulteriore analisi trascrittomica.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Tesi Laurea Magistrale - Luca Guarrera.pdf

non accessibile

Descrizione: Testo della Tesi
Dimensione 9.31 MB
Formato Adobe PDF
9.31 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/154469