Hierarchical Bayesian modeling of large point-referenced space-time data has become in- creasingly popular since the development of adequate Monte Carlo Markov Chain (MCMC) techniques to estimate the posterior distribution of the underlying parameters. However, these techniques require well suited and low-level language computer code that is effi- cient regarding large-scale computations. This thesis develops the R package starr for hierarchical Bayesian modeling of spatio-temporal data, specifically for data that exhibits auto-regressive behaviour. It executes underlying C++ code that will be handling the neccessary algorithmic computations. The user can control several options regarding the prior selection of some parameters, covariance function and tuning of the implemented algorithm. We will test the package and its model fitting capabilities during simulation studies and discuss the possibilities and limitations of the model. We will then apply it to fit a model to real world data, namely the time series of particulate matter (PM) in the region of Lombardy. Specifically, we provide a general overview of the phenomena and the influence of meteorological factors, before analyzing the data collected in 2018 to draw conclusions. We describe the underlying code and methods that were developed for the package, but also programming techniques that were used for efficient computation.
La modellazione bayesiana gerarchica di grandi dati spazio-temporali riferiti a punti è diventata sempre più popolare dopo lo sviluppo di adeguate tecniche di Monte Carlo Markov Chain (MCMC) per stimare la distribuzione posteriore dei parametri sottostanti. Tuttavia, queste tecniche richiedono un codice informatico adatto e di basso livello che sia efficiente per quanto riguarda i calcoli su larga scala. Questa tesi sviluppa il pacchetto R starr per la modellazione bayesiana gerarchica di dati spazio-temporali, in particolare per dati che presentano un comportamento autoregressivo. Il pacchetto esegue il codice C++ sottostante che gestisce i calcoli algoritmici necessari. L’utente può controllare diverse opzioni relative alla selezione preventiva di alcuni parametri, alla funzione di covarianza e alla regolazione dell’algoritmo implementato. Verranno testati il pacchetto e le sue capacità di adattamento del modello durante studi di simulazione e verranno discusse le possibilità e i limiti del modello. In seguito, lo applicheremo per adattare un modello ai dati del mondo reale, ovvero le serie temporali del particolato (PM) nella regione Lombardia. In particolare, forniamo una panoramica generale dei fenomeni e dell’influenza dei fattori meteorologici, prima di analizzare i dati raccolti nel 2018 per trarre conclusioni. Descriviamo inoltre il codice sottostante e i metodi sviluppati per il pacchetto, ma anche le tecniche di programmazione utilizzate per un calcolo efficiente.
An MCMC algorithm for spatiotemporal AR(1) models
Adamovic, Daniel
2022/2023
Abstract
Hierarchical Bayesian modeling of large point-referenced space-time data has become in- creasingly popular since the development of adequate Monte Carlo Markov Chain (MCMC) techniques to estimate the posterior distribution of the underlying parameters. However, these techniques require well suited and low-level language computer code that is effi- cient regarding large-scale computations. This thesis develops the R package starr for hierarchical Bayesian modeling of spatio-temporal data, specifically for data that exhibits auto-regressive behaviour. It executes underlying C++ code that will be handling the neccessary algorithmic computations. The user can control several options regarding the prior selection of some parameters, covariance function and tuning of the implemented algorithm. We will test the package and its model fitting capabilities during simulation studies and discuss the possibilities and limitations of the model. We will then apply it to fit a model to real world data, namely the time series of particulate matter (PM) in the region of Lombardy. Specifically, we provide a general overview of the phenomena and the influence of meteorological factors, before analyzing the data collected in 2018 to draw conclusions. We describe the underlying code and methods that were developed for the package, but also programming techniques that were used for efficient computation.File | Dimensione | Formato | |
---|---|---|---|
2024_04_Adamovic.pdf
accessibile in internet solo dagli utenti autorizzati
Dimensione
4.39 MB
Formato
Adobe PDF
|
4.39 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/218846