Parkinson's disease (PD) is known for its clinical heterogeneity, making it difficult for researchers to understand its progression and develop effective treatments. This study aims to address these challenges through an integrative bioinformatics approach. PD subtypes are defined using patient clustering techniques applied to the longitudinal RNA-seq data of 640 patients, from the Parkinson's Progression Markers Initiative (PPMI). Moreover, genes were clustered according to their change in expression values during the disease progression. The patient clustering approach was initially constructed and validated using gene expression data from The Cancer Genome Atlas (TCGA). Unsupervised machine learning algorithms, including the Leiden algorithm, Self-Organizing Maps, and Spectral clustering, were utilized for patient clustering based on their molecular features. Functional analysis using tools like g:Profiler elucidated key genes and pathways relevant to PD subtypes. While the pipeline did not definitively identify patient clusters, it effectively identified significant gene clusters. This study contributes to the field by offering a more holistic approach to PD subtyping, combining patient and gene clustering with functional analysis. This integrated approach provides novel insights into PD heterogeneity and lays a foundation for future research in personalized medicine for PD patients.

La malattia di Parkinson (PD) è nota per la sua eterogeneità clinica, rendendo difficile per i ricercatori comprendere la sua progressione e sviluppare trattamenti efficaci. Questo studio mira ad affrontare queste sfide attraverso un approccio integrato di bioinformatica. Per definire i sottotipi di PD sono state applicate tecniche di clustering a dati longitudinali di RNA-Seq di 640 pazienti provenienti dall’Iniziativa per i Marker della Progressione del Parkinson (PPMI). Inoltre, i geni sono stati raggruppati in base alla variazione dei valori di espressione durante la progressione della malattia. L'approccio di clustering dei pazienti è stato inizialmente costruito e convalidato utilizzando dati di espressione genica del The Cancer Genome Atlas (TCGA). Algoritmi di apprendimento automatico non supervisionato, tra cui l'algoritmo Leiden, le mappe auto-organizzanti e il clustering spettrale, sono stati utilizzati per il clustering dei pazienti in base alle loro caratteristiche molecolari. Sebbene la pipeline non abbia identificato cluster di pazienti, ha identificato efficacemente cluster genici significativi. L'analisi funzionale dei geni identificati è stata svolta utilizzando g:Profiler e ha evidenziato pathway rilevanti nella patologia di PD. Questo studio contribuisce alla ricerca offrendo un approccio più olistico alla sottoclassificazione del PD, combinando il clustering dei pazienti e dei geni con l'analisi funzionale. Inoltre, questo approccio integrato fornisce nuove prospettive sull'eterogeneità del PD e getta le basi per futuri studi nella medicina personalizzata per i pazienti affetti da PD.

Integrative bioinformatics analysis of a transcriptomic dataset for Parkinson's disease patient stratification and identification of disease progression markers

PRASCEVIC, MARKO
2023/2024

Abstract

Parkinson's disease (PD) is known for its clinical heterogeneity, making it difficult for researchers to understand its progression and develop effective treatments. This study aims to address these challenges through an integrative bioinformatics approach. PD subtypes are defined using patient clustering techniques applied to the longitudinal RNA-seq data of 640 patients, from the Parkinson's Progression Markers Initiative (PPMI). Moreover, genes were clustered according to their change in expression values during the disease progression. The patient clustering approach was initially constructed and validated using gene expression data from The Cancer Genome Atlas (TCGA). Unsupervised machine learning algorithms, including the Leiden algorithm, Self-Organizing Maps, and Spectral clustering, were utilized for patient clustering based on their molecular features. Functional analysis using tools like g:Profiler elucidated key genes and pathways relevant to PD subtypes. While the pipeline did not definitively identify patient clusters, it effectively identified significant gene clusters. This study contributes to the field by offering a more holistic approach to PD subtyping, combining patient and gene clustering with functional analysis. This integrated approach provides novel insights into PD heterogeneity and lays a foundation for future research in personalized medicine for PD patients.
MESSA, LETIZIA
ING - Scuola di Ingegneria Industriale e dell'Informazione
9-apr-2024
2023/2024
La malattia di Parkinson (PD) è nota per la sua eterogeneità clinica, rendendo difficile per i ricercatori comprendere la sua progressione e sviluppare trattamenti efficaci. Questo studio mira ad affrontare queste sfide attraverso un approccio integrato di bioinformatica. Per definire i sottotipi di PD sono state applicate tecniche di clustering a dati longitudinali di RNA-Seq di 640 pazienti provenienti dall’Iniziativa per i Marker della Progressione del Parkinson (PPMI). Inoltre, i geni sono stati raggruppati in base alla variazione dei valori di espressione durante la progressione della malattia. L'approccio di clustering dei pazienti è stato inizialmente costruito e convalidato utilizzando dati di espressione genica del The Cancer Genome Atlas (TCGA). Algoritmi di apprendimento automatico non supervisionato, tra cui l'algoritmo Leiden, le mappe auto-organizzanti e il clustering spettrale, sono stati utilizzati per il clustering dei pazienti in base alle loro caratteristiche molecolari. Sebbene la pipeline non abbia identificato cluster di pazienti, ha identificato efficacemente cluster genici significativi. L'analisi funzionale dei geni identificati è stata svolta utilizzando g:Profiler e ha evidenziato pathway rilevanti nella patologia di PD. Questo studio contribuisce alla ricerca offrendo un approccio più olistico alla sottoclassificazione del PD, combinando il clustering dei pazienti e dei geni con l'analisi funzionale. Inoltre, questo approccio integrato fornisce nuove prospettive sull'eterogeneità del PD e getta le basi per futuri studi nella medicina personalizzata per i pazienti affetti da PD.
File allegati
File Dimensione Formato  
2024_04_Prascevic_Executive_Summary_02.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Executive Summary
Dimensione 1.92 MB
Formato Adobe PDF
1.92 MB Adobe PDF   Visualizza/Apri
2024_04_Prascevic_Thesis_01.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Thesis
Dimensione 4.45 MB
Formato Adobe PDF
4.45 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/218269