In recent years functional data analysis (FDA) have received a great deal of attention, many useful theories and applications have been reported. In a functional setting each data unit is a curve and it is assumed to be a realization of a random process. Quantitative genetics happens to find the functional approach extremely useful for the analysis of functions such as growth and growth rate over time. The main objective of any genetic analysis is the estimation of the covariance function of the generator process and its main eigenfunctions, these elements can give insights into the dynamics of the underlying process and suggest patterns for selection. More specifically the analysis of these quantities is strictly related to variation and covariation among relatives and to the dynamics of evolutionary change in a particular trait across generations. Some R packages (pedigreemm, Vazquez et al., 2010) proposed a fitting strategy for multi-variate and simple genetic models. The first part of this work is dedicated to the development of an algorithmic routine for the fitting and covariance estimation of general functional models, providing a customizable fitting procedure, able to deal with several kind of processes. This routine will allow the estimation of the suitable parameters of a model in a general functional setting as opposed to the previous limited multivariate approaches. Some different techniques have been proposed for the estimation of the quantities of interest, however, the uncertainty around these estimates is generally not examined. The second part of the work proposes an inference criterion for the estimated quantities (covariance function and eigenfunctions) based on a parametric bootstrapping strategy. We will build simultaneous confidence bands, which will prove to be the right choice in a functional setting, and assess the reliability of the estimates generated in the first part of the work. The fitting procedure and inference criterion will be tested first on simulated data, at this stage the inference strategy will prove to be effective for the assessment of uncertainty. Then we will analyze growth trajectories in larval flour beetleTriboleum Castaneum, estimating evolutionary constraints and predicting the generational response under different selection regimes.

Negli ultimi anni la functional data analysis (FDA) ha ricevuto molta attenzione, sono state riportate molte teorie e applicazioni utili. In un'impostazione funzionale ogni unità di dati è una curva e si assume che sia una realizzazione di un processo stocastico. La genetica quantitativa trova l'approccio funzionale estremamente utile per l'analisi di funzioni come la crescita e il tasso di crescita nel tempo. L'obiettivo principale di qualsiasi analisi genetica è la stima della funzione di covarianza del processo e delle sue principali autofunzioni, questi elementi possono dare informazioni sulla dinamica del processo sottostante e suggerire modelli di selezione. Più specificamente l'analisi di queste quantità è strettamente legata alla variazione e alla covariazione tra parenti e alla dinamica del cambiamento evolutivo di un particolare tratto nel corso delle generazioni. Alcuni pacchetti R (pedigreemm, Vazquez et al., 2010) hanno proposto una strategia di fitting per modelli genetici semplici e multivariati. La prima parte di questo lavoro è dedicata allo sviluppo di una routine per il fitting e la stima della covarianza di modelli funzionali generali, fornendo una procedura personalizzabile, in grado di trattare diversi tipi di processi. Questa routine permetterà la stima dei parametri di un modello in un ambiente funzionale generale, in contrasto con i precedenti approcci multivariati. Diverse tecniche sono state proposte per la stima delle quantità di interesse, tuttavia, l'incertezza intorno a queste stime non è generalmente esaminata. La seconda parte del lavoro propone un criterio di inferenza per le quantità stimate (funzione di covarianza e autofunzioni) basato su una strategia di bootstrapping parametrico. Costruiremo bande di confidenza simultanee, che si riveleranno la scelta giusta in un contesto funzionale, e valuteremo l'affidabilità delle stime generate nella prima parte del lavoro. La procedura di adattamento e il criterio di inferenza saranno testati prima su dati simulati, in questa fase la strategia di inferenza si dimostrerà efficace per la valutazione dell'incertezza. Poi analizzeremo le traiettorie di crescita nelle larve di Triboleum Castaneum, stimando i vincoli evolutivi e prevedendo la risposta generazionale sotto diversi regimi di selezione.

Random regression model for genetic applications

Biazzo, Marco
2020/2021

Abstract

In recent years functional data analysis (FDA) have received a great deal of attention, many useful theories and applications have been reported. In a functional setting each data unit is a curve and it is assumed to be a realization of a random process. Quantitative genetics happens to find the functional approach extremely useful for the analysis of functions such as growth and growth rate over time. The main objective of any genetic analysis is the estimation of the covariance function of the generator process and its main eigenfunctions, these elements can give insights into the dynamics of the underlying process and suggest patterns for selection. More specifically the analysis of these quantities is strictly related to variation and covariation among relatives and to the dynamics of evolutionary change in a particular trait across generations. Some R packages (pedigreemm, Vazquez et al., 2010) proposed a fitting strategy for multi-variate and simple genetic models. The first part of this work is dedicated to the development of an algorithmic routine for the fitting and covariance estimation of general functional models, providing a customizable fitting procedure, able to deal with several kind of processes. This routine will allow the estimation of the suitable parameters of a model in a general functional setting as opposed to the previous limited multivariate approaches. Some different techniques have been proposed for the estimation of the quantities of interest, however, the uncertainty around these estimates is generally not examined. The second part of the work proposes an inference criterion for the estimated quantities (covariance function and eigenfunctions) based on a parametric bootstrapping strategy. We will build simultaneous confidence bands, which will prove to be the right choice in a functional setting, and assess the reliability of the estimates generated in the first part of the work. The fitting procedure and inference criterion will be tested first on simulated data, at this stage the inference strategy will prove to be effective for the assessment of uncertainty. Then we will analyze growth trajectories in larval flour beetleTriboleum Castaneum, estimating evolutionary constraints and predicting the generational response under different selection regimes.
PIGOLI, DAVIDE
ING - Scuola di Ingegneria Industriale e dell'Informazione
7-ott-2021
2020/2021
Negli ultimi anni la functional data analysis (FDA) ha ricevuto molta attenzione, sono state riportate molte teorie e applicazioni utili. In un'impostazione funzionale ogni unità di dati è una curva e si assume che sia una realizzazione di un processo stocastico. La genetica quantitativa trova l'approccio funzionale estremamente utile per l'analisi di funzioni come la crescita e il tasso di crescita nel tempo. L'obiettivo principale di qualsiasi analisi genetica è la stima della funzione di covarianza del processo e delle sue principali autofunzioni, questi elementi possono dare informazioni sulla dinamica del processo sottostante e suggerire modelli di selezione. Più specificamente l'analisi di queste quantità è strettamente legata alla variazione e alla covariazione tra parenti e alla dinamica del cambiamento evolutivo di un particolare tratto nel corso delle generazioni. Alcuni pacchetti R (pedigreemm, Vazquez et al., 2010) hanno proposto una strategia di fitting per modelli genetici semplici e multivariati. La prima parte di questo lavoro è dedicata allo sviluppo di una routine per il fitting e la stima della covarianza di modelli funzionali generali, fornendo una procedura personalizzabile, in grado di trattare diversi tipi di processi. Questa routine permetterà la stima dei parametri di un modello in un ambiente funzionale generale, in contrasto con i precedenti approcci multivariati. Diverse tecniche sono state proposte per la stima delle quantità di interesse, tuttavia, l'incertezza intorno a queste stime non è generalmente esaminata. La seconda parte del lavoro propone un criterio di inferenza per le quantità stimate (funzione di covarianza e autofunzioni) basato su una strategia di bootstrapping parametrico. Costruiremo bande di confidenza simultanee, che si riveleranno la scelta giusta in un contesto funzionale, e valuteremo l'affidabilità delle stime generate nella prima parte del lavoro. La procedura di adattamento e il criterio di inferenza saranno testati prima su dati simulati, in questa fase la strategia di inferenza si dimostrerà efficace per la valutazione dell'incertezza. Poi analizzeremo le traiettorie di crescita nelle larve di Triboleum Castaneum, stimando i vincoli evolutivi e prevedendo la risposta generazionale sotto diversi regimi di selezione.
File allegati
File Dimensione Formato  
Tesi_Marco_Biazzo.pdf

accessibile in internet per tutti

Dimensione 1.34 MB
Formato Adobe PDF
1.34 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/179485