Prognostic prediction of cardiovascular diseases (CVDs) is particularly relevant, as these conditions, although largely preventable, remain the leading cause of morbidity and mortality worldwide. By improving cardiovascular risk assessment, primary prevention can be more effective in addressing the global burden of CVDs, which is projected to increase in the coming years. At present, primary prevention strategies assess the cardiovascular risk mainly relying on clinical and lifestyle factors; however, these factors may not fully capture the heterogeneity of CVDs, which include a diverse group of conditions with different etiologies and underlying mechanisms. This thesis aims to evaluate whether, and to what extent, integrating genetic data alongside traditional risk factors can improve the prognostic prediction for such diseases. Using data from the UK Biobank cohort, the analysis focuses on three cardiovascular conditions — coronary artery disease, dilated cardiomyopathy, and heart failure — for which multiple types of raw genetic and genetic-derived data are considered, including polygenic risk scores (PRSs), single-nucleotide polymorphisms (SNPs), and rare variants. By applying statistical learning approaches, this work aims to quantify the impact of genetic features on each of the considered endpoints. The results show that incorporating genetic data can significantly improve predictive performance, but the magnitude of this improvement is disease-specific. For example, while prognostic models targeting dilated cardiomyopathy, which is known to have a strong genetic component, benefit significantly from the inclusion of such information, models for complex multifactorial diseases, such as heart failure, show only slight improvement. Moreover, even among diseases with a significant genetic basis, the predictive value of each type of genetic data is highly dependent on the specific condition. These findings highlight the need for tailored genetic strategies in cardiovascular risk assessment, as there is no "one-size-fits-all" approach for the inclusion of such data.
La predizione prognostica di malattie cardiovascolari è particolarmente rilevante, dal momento che queste condizioni, seppure in larga parte prevenibili, rimangono la causa principale di morbilità e mortalità nel mondo. Migliorando la valutazione del rischio cardiovascolare, la prevenzione primaria può essere più efficace nel ridurre il peso globale delle malattie cardiovascolari, che secondo le stime aumenterà significativamente nei prossimi anni. Al momento, la valutazione del rischio cardiovascolare nella prevenzione primaria si basa principalmente su fattori clinici oppure legati allo stile di vita; tuttavia, tali fattori possono non essere sufficienti per racchiudere l’eterogeneità delle malattie cardiovascolari, che includono condizioni caratterizzate da varie eziologie e meccanismi sottostanti. L’obiettivo principale di questa tesi è valutare se, e in quale misura, l’integrazione di dati genetici insieme a fattori di rischio tradizionali può migliorare la predizione prognostica per tali malattie. Basandosi sui dati della coorte di UK Biobank, l'analisi si focalizza su tre condizioni cardiovascolari — coronaropatia, cardiomiopatia dilatativa e insufficienza cardiaca — per le quali vengono valutati diversi tipi di dati genetici grezzi e derivati, inclusi i punteggi di rischio poligenico (PRSs), i polimorfismi a singolo nucleotide (SNPs) e le varianti rare. Applicando approcci di statistical learning, lo scopo di questo lavoro è quantificare l’impatto delle variabili genetiche su ciascun endpoint considerato. Dai risultati emerge che l’inclusione di dati genetici ha un impatto significativo in termini di prestazioni predittive; tuttavia, l’entità di questo miglioramento dipende dalla specifica condizione considerata. Ad esempio, mentre i modelli prognostici mirati alla cardiomiopatia dilatativa, una condizione caratterizzata da una forte componente genetica, traggono notevole beneficio dall'inclusione di tali informazioni, i modelli per malattie multifattoriali, come l'insufficienza cardiaca, mostrano un miglioramento minimo. Anche focalizzandosi solo su malattie con una forte base genetica, l'impatto predittivo di diverse forme di dato genetico varia a seconda della specifica condizione. Questi risultati evidenziano la necessità di strategie genetiche mirate nella valutazione del rischio cardiovascolare, dal momento che non vi è un approccio universale per l’inclusione di tali dati.
Integrating genetic data in cardiovascular risk prediction
Krychkovska, Marta
2024/2025
Abstract
Prognostic prediction of cardiovascular diseases (CVDs) is particularly relevant, as these conditions, although largely preventable, remain the leading cause of morbidity and mortality worldwide. By improving cardiovascular risk assessment, primary prevention can be more effective in addressing the global burden of CVDs, which is projected to increase in the coming years. At present, primary prevention strategies assess the cardiovascular risk mainly relying on clinical and lifestyle factors; however, these factors may not fully capture the heterogeneity of CVDs, which include a diverse group of conditions with different etiologies and underlying mechanisms. This thesis aims to evaluate whether, and to what extent, integrating genetic data alongside traditional risk factors can improve the prognostic prediction for such diseases. Using data from the UK Biobank cohort, the analysis focuses on three cardiovascular conditions — coronary artery disease, dilated cardiomyopathy, and heart failure — for which multiple types of raw genetic and genetic-derived data are considered, including polygenic risk scores (PRSs), single-nucleotide polymorphisms (SNPs), and rare variants. By applying statistical learning approaches, this work aims to quantify the impact of genetic features on each of the considered endpoints. The results show that incorporating genetic data can significantly improve predictive performance, but the magnitude of this improvement is disease-specific. For example, while prognostic models targeting dilated cardiomyopathy, which is known to have a strong genetic component, benefit significantly from the inclusion of such information, models for complex multifactorial diseases, such as heart failure, show only slight improvement. Moreover, even among diseases with a significant genetic basis, the predictive value of each type of genetic data is highly dependent on the specific condition. These findings highlight the need for tailored genetic strategies in cardiovascular risk assessment, as there is no "one-size-fits-all" approach for the inclusion of such data.| File | Dimensione | Formato | |
|---|---|---|---|
|
2025_12_Krychkovska_Executive_Summary.pdf
non accessibile
Dimensione
456.1 kB
Formato
Adobe PDF
|
456.1 kB | Adobe PDF | Visualizza/Apri |
|
2025_12_Krychkovska_Tesi.pdf
non accessibile
Dimensione
4.35 MB
Formato
Adobe PDF
|
4.35 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/246898