Understanding the genetic basis of phenotypic traits is a central goal in evolutionary quantitative genetics. Our study evaluates the performance of two genomic prediction methods—Bayesian Principal Components Ridge Regression (BPCRR) and BayesR—that estimate the genetic component of traits, across various genetic architectures, which represent different distributions and magnitudes of genetic effects in the genome. BPCRR employs singular value decomposition on the matrix of genetic markers (SNPs) for dimensionality reduction, combined with Bayesian ridge shrinkage to manage high-dimensional datasets efficiently. In contrast, BayesR applies shrinkage directly to all genetic marker effects. Using a large SNP dataset, we simulated multiple genetic architectures and found that both methods achieve accurate and comparable predictions regardless of the underlying trait architecture. However, BPCRR showed significant computational efficiency as SNP count increased. Additionally, we assessed a frequentist approach using ridge regression on principal components, which provides a fast and accurate alternative to predict additive genetic effects alone. Our findings support BPCRR’s potential applicability to wild populations, which present greater complexity compared to the breeding populations widely studied so far, with future applications to real phenotypes that include environmental effects and population structure. Furthermore, we provide a comprehensive overview of BayesR's prediction performance across a wide range of genetic architectures.

La comprensione della base genetica dei tratti fenotipici è un obiettivo centrale nella genetica quantitativa evoluzionistica. Il nostro studio valuta la performance di due metodi di predizione genomica— Bayesian Principal Components Ridge Regression (BPCRR) e BayesR—per stimare la componente genetica dei tratti, in vari contesti di architettura genetica, che rappresenta distribuzioni e magnitudini variabili degli effetti genetici nel genoma. BPCRR riduce la dimensionalità tramite decomposizione ai valori singolari sulla matrice di marcatori genetici (SNP), combinata a uno shrinkage Bayesiano di tipo ridge per gestire in modo efficiente dataset ad alto numero di SNP. Al contrario, BayesR applica lo shrinkage direttamente a tutti gli effetti dei marcatori genetici. Utilizzando un ampio dataset di SNP, abbiamo simulato diverse architetture genetiche e scoperto che entrambi i metodi raggiungono predizioni accurate e comparabili, indipendentemente dall'architettura genetica del tratto. Tuttavia, BPCRR ha mostrato una significativa efficienza computazionale con l’aumento del numero di SNP. Abbiamo anche valutato un approccio frequentista utilizzando una regressione ridge sulle componenti principali, che fornisce un’alternativa veloce e precisa per predire gli effetti genetici additivi. I nostri risultati supportano l’applicabilità di BPCRR a popolazioni selvatiche, caratterizzate da maggiore complessità rispetto a quelle di allevamento ampiamente studiate sinora, con future applicazioni a fenotipi reali che includano effetti ambientali e struttura della popolazione. Inoltre, forniamo una panoramica completa della performance predittiva di BayesR su una vasta gamma di architetture genetiche.

Bayesian modelling for genomic prediction in quantitative genetics: a comparative study across genetic architectures

ZELIOLI, CHIARA
2023/2024

Abstract

Understanding the genetic basis of phenotypic traits is a central goal in evolutionary quantitative genetics. Our study evaluates the performance of two genomic prediction methods—Bayesian Principal Components Ridge Regression (BPCRR) and BayesR—that estimate the genetic component of traits, across various genetic architectures, which represent different distributions and magnitudes of genetic effects in the genome. BPCRR employs singular value decomposition on the matrix of genetic markers (SNPs) for dimensionality reduction, combined with Bayesian ridge shrinkage to manage high-dimensional datasets efficiently. In contrast, BayesR applies shrinkage directly to all genetic marker effects. Using a large SNP dataset, we simulated multiple genetic architectures and found that both methods achieve accurate and comparable predictions regardless of the underlying trait architecture. However, BPCRR showed significant computational efficiency as SNP count increased. Additionally, we assessed a frequentist approach using ridge regression on principal components, which provides a fast and accurate alternative to predict additive genetic effects alone. Our findings support BPCRR’s potential applicability to wild populations, which present greater complexity compared to the breeding populations widely studied so far, with future applications to real phenotypes that include environmental effects and population structure. Furthermore, we provide a comprehensive overview of BayesR's prediction performance across a wide range of genetic architectures.
MUFF, STEFANIE
ING - Scuola di Ingegneria Industriale e dell'Informazione
11-dic-2024
2023/2024
La comprensione della base genetica dei tratti fenotipici è un obiettivo centrale nella genetica quantitativa evoluzionistica. Il nostro studio valuta la performance di due metodi di predizione genomica— Bayesian Principal Components Ridge Regression (BPCRR) e BayesR—per stimare la componente genetica dei tratti, in vari contesti di architettura genetica, che rappresenta distribuzioni e magnitudini variabili degli effetti genetici nel genoma. BPCRR riduce la dimensionalità tramite decomposizione ai valori singolari sulla matrice di marcatori genetici (SNP), combinata a uno shrinkage Bayesiano di tipo ridge per gestire in modo efficiente dataset ad alto numero di SNP. Al contrario, BayesR applica lo shrinkage direttamente a tutti gli effetti dei marcatori genetici. Utilizzando un ampio dataset di SNP, abbiamo simulato diverse architetture genetiche e scoperto che entrambi i metodi raggiungono predizioni accurate e comparabili, indipendentemente dall'architettura genetica del tratto. Tuttavia, BPCRR ha mostrato una significativa efficienza computazionale con l’aumento del numero di SNP. Abbiamo anche valutato un approccio frequentista utilizzando una regressione ridge sulle componenti principali, che fornisce un’alternativa veloce e precisa per predire gli effetti genetici additivi. I nostri risultati supportano l’applicabilità di BPCRR a popolazioni selvatiche, caratterizzate da maggiore complessità rispetto a quelle di allevamento ampiamente studiate sinora, con future applicazioni a fenotipi reali che includano effetti ambientali e struttura della popolazione. Inoltre, forniamo una panoramica completa della performance predittiva di BayesR su una vasta gamma di architetture genetiche.
File allegati
File Dimensione Formato  
2024_12_Zelioli_ExecutiveSummary.pdf

accessibile in internet per tutti

Descrizione: Executive Summary
Dimensione 517.57 kB
Formato Adobe PDF
517.57 kB Adobe PDF Visualizza/Apri
2024_12_Zelioli_Tesi.pdf

accessibile in internet per tutti

Descrizione: Tesi
Dimensione 1.85 MB
Formato Adobe PDF
1.85 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/230984