This work concerns the statistical field of spatially distributed functional data. The aim is the extension of some geostatistical methodologies, already known in vectorial data cases, to non-stationary functional random fields. This purpose is reached with a Functional Data Analysis approach, considering each statistical unit as a point of an infinite-dimensional space, assumed to be Hilbert. An extension of Ordinary and Universal Kriging methods, based on constant coefficients, to elements of a Hilbert space is proposed, in coherent frame of definitions and hypotheses. The theoretical study is carried out through an abstract approach, based on global definition of covariogram and variogram; moreover, a relation with operatorial definition of cross-covariance is derived. The algorithms developed in this work are focused on variogram estimation and spatial prediction of functional variables at unsampled location. Strong distributional hypotheses on the functional process are avoided applying semiparametric bootstrap methods for assessing the uncertainty of the variogram empirical estimator. The obtained approximation is used to construct confidence intervals and fit a variogram valid model. The behavior of the proposed algorithms is evaluated through a simulation study on stationary functional data. Moreover, a methodology for the prediction of non-stationary spatial dependent functional data, consistently with the established theoretical results, is proposed and then developed in three steps: model selection for the drift term, dichotomization of the original process into a deterministic term (the drift) and a residual stochastic process, Universal Kriging prediction. Algorithms validation is carried out through their application to simulated and real data. The proposed procedures are applied to Canada's Maritime Provinces Temperatures dataset, that collects daily mean temperatures data, observed in 35 meteorological stations located in Canada's Maritimes Provinces. Geostatistical analysis is performed using a non-Euclidean metric on the spatial domain and modeling the deterministic variability through a drift term. The results are finally compared with the reference temperature maps of the Meteorological Service of Canada and with the analysis of the same dataset already presented in literature.

Il presente lavoro di tesi si colloca nell'ambito della statistica per dati funzionali georeferenziati. L'obiettivo del lavoro è l'estensione di alcune metodologie geostatistiche, note nel caso di dati vettoriali, alla situazione in cui i dati siano funzionali e spazialmente distribuiti in modo non stazionario, considerando ciascuna osservazione come un punto di uno spazio infinito-dimensionale, assunto di Hilbert, secondo l'approccio tipico della Analisi di Dati Funzionali. Il problema è affrontato, dal punto di vista teorico, proponendo un'estensione dei metodi di Ordinary e Universal Kriging a coefficienti costanti al caso di elementi di uno spazio di Hilbert, in un quadro coerente di definizioni e ipotesi. L'approccio usato è di tipo astratto, basato su nuove definizioni globali di covariogramma e variogramma, di cui è individuato il legame con la definizione operatoriale di cross-covarianza. Le proposte algoritmiche del lavoro si focalizzano sulla stima della funzione variogramma e sulla previsione dei dati non osservati. E’ proposta l'applicazione di metodi bootstrap semiparametrici per l'approssimazione della distribuzione dello stimatore variografico empirico, l'adattamento a un modello valido e la costruzione di stime intervallari, in ipotesi distribuzionali lasche. La bontà dell'approssimazione ottenuta è analizzata con uno studio di simulazione. E’ quindi sviluppata una metodologia per la previsione di dati funzionali non stazionari, coerente con i nuovi risultati teorici e consistente in tre fasi: la selezione della forma funzionale per la modellazione del drift, il disaccoppiamento del drift dal residuo, l'Universal Kriging. La validazione degli algoritmi sviluppati è condotta attraverso l'applicazione a dati sintetici e reali. La metodologia proposta è applicata al dataset Canada's Maritime Provinces Temperatures, che raccoglie le temperature medie giornaliere registrate in 35 stazioni meteorologiche delle province Marittime del Canada. L'analisi geostatistica è condotta adottando una distanza non euclidea sul dominio spaziale e modellando un termine di drift. I risultati ottenuti sono confrontati con le mappe di temperatura del Servizio Meteorologico del Canada e con le analisi dello stesso dataset già presenti in letteratura.

Geostatistica per elementi di uno spazio di Hilbert : teoria e applicazioni ai dati funzionali

MENAFOGLIO, ALESSANDRA
2010/2011

Abstract

This work concerns the statistical field of spatially distributed functional data. The aim is the extension of some geostatistical methodologies, already known in vectorial data cases, to non-stationary functional random fields. This purpose is reached with a Functional Data Analysis approach, considering each statistical unit as a point of an infinite-dimensional space, assumed to be Hilbert. An extension of Ordinary and Universal Kriging methods, based on constant coefficients, to elements of a Hilbert space is proposed, in coherent frame of definitions and hypotheses. The theoretical study is carried out through an abstract approach, based on global definition of covariogram and variogram; moreover, a relation with operatorial definition of cross-covariance is derived. The algorithms developed in this work are focused on variogram estimation and spatial prediction of functional variables at unsampled location. Strong distributional hypotheses on the functional process are avoided applying semiparametric bootstrap methods for assessing the uncertainty of the variogram empirical estimator. The obtained approximation is used to construct confidence intervals and fit a variogram valid model. The behavior of the proposed algorithms is evaluated through a simulation study on stationary functional data. Moreover, a methodology for the prediction of non-stationary spatial dependent functional data, consistently with the established theoretical results, is proposed and then developed in three steps: model selection for the drift term, dichotomization of the original process into a deterministic term (the drift) and a residual stochastic process, Universal Kriging prediction. Algorithms validation is carried out through their application to simulated and real data. The proposed procedures are applied to Canada's Maritime Provinces Temperatures dataset, that collects daily mean temperatures data, observed in 35 meteorological stations located in Canada's Maritimes Provinces. Geostatistical analysis is performed using a non-Euclidean metric on the spatial domain and modeling the deterministic variability through a drift term. The results are finally compared with the reference temperature maps of the Meteorological Service of Canada and with the analysis of the same dataset already presented in literature.
DALLA ROSA, MATILDE
ING II - Scuola di Ingegneria dei Sistemi
20-dic-2011
2010/2011
Il presente lavoro di tesi si colloca nell'ambito della statistica per dati funzionali georeferenziati. L'obiettivo del lavoro è l'estensione di alcune metodologie geostatistiche, note nel caso di dati vettoriali, alla situazione in cui i dati siano funzionali e spazialmente distribuiti in modo non stazionario, considerando ciascuna osservazione come un punto di uno spazio infinito-dimensionale, assunto di Hilbert, secondo l'approccio tipico della Analisi di Dati Funzionali. Il problema è affrontato, dal punto di vista teorico, proponendo un'estensione dei metodi di Ordinary e Universal Kriging a coefficienti costanti al caso di elementi di uno spazio di Hilbert, in un quadro coerente di definizioni e ipotesi. L'approccio usato è di tipo astratto, basato su nuove definizioni globali di covariogramma e variogramma, di cui è individuato il legame con la definizione operatoriale di cross-covarianza. Le proposte algoritmiche del lavoro si focalizzano sulla stima della funzione variogramma e sulla previsione dei dati non osservati. E’ proposta l'applicazione di metodi bootstrap semiparametrici per l'approssimazione della distribuzione dello stimatore variografico empirico, l'adattamento a un modello valido e la costruzione di stime intervallari, in ipotesi distribuzionali lasche. La bontà dell'approssimazione ottenuta è analizzata con uno studio di simulazione. E’ quindi sviluppata una metodologia per la previsione di dati funzionali non stazionari, coerente con i nuovi risultati teorici e consistente in tre fasi: la selezione della forma funzionale per la modellazione del drift, il disaccoppiamento del drift dal residuo, l'Universal Kriging. La validazione degli algoritmi sviluppati è condotta attraverso l'applicazione a dati sintetici e reali. La metodologia proposta è applicata al dataset Canada's Maritime Provinces Temperatures, che raccoglie le temperature medie giornaliere registrate in 35 stazioni meteorologiche delle province Marittime del Canada. L'analisi geostatistica è condotta adottando una distanza non euclidea sul dominio spaziale e modellando un termine di drift. I risultati ottenuti sono confrontati con le mappe di temperatura del Servizio Meteorologico del Canada e con le analisi dello stesso dataset già presenti in letteratura.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2011_12_Menafoglio.pdf

Open Access dal 27/11/2012

Descrizione: Testo della tesi
Dimensione 41.68 MB
Formato Adobe PDF
41.68 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/33402