The statistical analysis of data belonging to Riemannian manifolds is becoming increasingly important in many applications, such as shape analysis, diffusion tensor imaging and, in general, the numerous studies regarding covariance matrices. In many cases data are spatially distributed but, because of the non-linear geometry of the manifold, it is not trivial to take into account this spatial dependence, making kriging prediction much more demanding than for scalar data. We start exploring two approaches to this issue recently introduced (Menafoglio et al., 2018; Pigoli et al., 2016). The first one exploits a tangent space approximation of the manifold, but needs to assume stationarity for the random field generating the data. The second one relaxes this assumption and recovers local stationarity by embedding the analysis in a Random Domain Decomposition (RDD) procedure. We here propose an innovative methodology to tackle non-stationarity. The underlying idea is to estimate, through a non-parametric approach, a system of local tangent points, which allows for the fitting of a global model assuming stationarity in the residual field, once the trend encoded in the tangent points is removed. To this end, we use the differential geometry concept of parallel transport to combine data from different tangent spaces into a unique Hilbert space where the analysis is finally performed. Eventually, the three methods are tested and compared on an extensive simulation study which allows us to highlight strengths and weaknesses of each one of them.
L’analisi statistica di dati appartenenti a varietà Riemanniane sta diventando sempre più importante in molte applicazioni, come ad esempio in shape analysis, diffusion tensor imaging e, in generale, nei numerosi studi riguardanti matrici di covarianza. In molti casi i dati sono spazialmente distribuiti ma, a causa della geometria non lineare della varietà, non è facile tener conto di questa dipendenza spaziale, rendendo la predizione di kriging molto più difficile rispetto al caso di dati scalari. Iniziamo esplorando due approcci a questo problema recentemente introdotti (Menafoglio et al., 2018; Pigoli et al., 2016). Il primo sfrutta un piano tangente per approssimare la varietà, ma richiede di assumere stazionarietà nel processo stocastico che genera i dati. Il secondo rilassa questa assunzione e recupera stazionarietà a livello locale con l’inserimento dell’analisi in una procedura di Random Domain Decomposition (RDD). Noi qui proponiamo un metodo innovativo per affrontare il problema della non-stazionarietà dei dati. L’idea sottostante è quella di stimare, attraverso un approccio non parametrico, un sistema di punti tangenti locali, che permetta di fittare un modello globale assumendo stazionarietà nel campo residuo, una volta rimosso il trend codificato nei punti tangenti. A questo scopo utilizziamo il concetto di trasporto parallelo in geometria differenziale per combinare dati provenienti da diversi spazi tangenti alla varietà in un unico spazio di Hilbert, dove l’analisi viene effettivamente sviluppata. Infine, i tre metodi sono stati testati e comparati su una batteria di dati simulati che ci permette di evidenziare debolezze e punti di forza di ciascuno.
Mixed random domain decomposition : an innovative approach for kriging prediction of manifold valued data
TORRIANI, LUCA;SARTORI, ILARIA
2017/2018
Abstract
The statistical analysis of data belonging to Riemannian manifolds is becoming increasingly important in many applications, such as shape analysis, diffusion tensor imaging and, in general, the numerous studies regarding covariance matrices. In many cases data are spatially distributed but, because of the non-linear geometry of the manifold, it is not trivial to take into account this spatial dependence, making kriging prediction much more demanding than for scalar data. We start exploring two approaches to this issue recently introduced (Menafoglio et al., 2018; Pigoli et al., 2016). The first one exploits a tangent space approximation of the manifold, but needs to assume stationarity for the random field generating the data. The second one relaxes this assumption and recovers local stationarity by embedding the analysis in a Random Domain Decomposition (RDD) procedure. We here propose an innovative methodology to tackle non-stationarity. The underlying idea is to estimate, through a non-parametric approach, a system of local tangent points, which allows for the fitting of a global model assuming stationarity in the residual field, once the trend encoded in the tangent points is removed. To this end, we use the differential geometry concept of parallel transport to combine data from different tangent spaces into a unique Hilbert space where the analysis is finally performed. Eventually, the three methods are tested and compared on an extensive simulation study which allows us to highlight strengths and weaknesses of each one of them.File | Dimensione | Formato | |
---|---|---|---|
tesi_Sartori_Torriani.pdf
accessibile in internet solo dagli utenti autorizzati
Descrizione: Testo della tesi
Dimensione
7.78 MB
Formato
Adobe PDF
|
7.78 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/147874