This thesis develops Bayesian nonparametric methodologies and computational strategies for the analysis of spatial and spatio-temporal data. From the methodological point of view, this dissertation introduces flexible Bayesian nonparametric models that addresses different applied problems, such as boundary detection, spatial and spatio-temporal clustering, arising, for instance, in studies ranging from socio-economic equity to environmental pollution monitoring. On the computational front, the thesis presents novel Markov Chain Monte Carlo algorithms tailored for large spatial and spatio-temporal datasets. The proposed algorithms, leveraging both on optimised implementation and on parallel processing, are de- signed to scale efficiently with data size and complexity, overcoming the computational bottlenecks associated with Bayesian nonparametric models for these types of data. All algorithms are publicly available as open-source software that enriches the available Bayesian toolbox for spatial data analysis. This thesis, then, tries to bridge the gap between Bayesian nonparametric statistical modelling and real-world applications, equipping researchers with tools to analyse and interpret complex spatial and temporal patterns.

Questa tesi sviluppa metodologie bayesiane non parametriche e strategie computazionali per l'analisi di dati spaziali e spaziotemporali. Dal punto di vista metodologico, la tesi introduce modelli bayesiani non parametrici flessibili che affrontano diversi problemi applicativi: boundary detection, clustering spaziale e spaziotemporale. Questi problemi emergono, ad esempio, in diversi studi, che spaziano dalla uguagliaza socio-economica al monitoraggio dell'inquinamento ambientale. Per qanto riguarda il lato computazionale, la tesi introduce nuovi algoritmi Markov chain Monte Carlo pensati per dataset spaziali e spaziotemporali di grandi dimensioni. Gli algoritmi proposti, sfruttando sia implementazioni ottimizzate sia il calcolo parallelo, sono pensati per scalare efficientemente rispetto alla dimensione e la complessità dei dati, superando i ben noti colli di bottiglia computazionali associati ai modelli bayesiani non parametrici per questi tipi di dato. Tutti gli algoritmi implementati sono disponibili pubblicamente come software open-source e arricchiscono gli strumenti disponibili per l'analisi di dati spaziali con approccio bayesiano. Questa tesi cerca, quindi, di colmare il divario tra la modellizzazione statistica bayesiana non parametrica e le applicazioni di tali modelli a problemi reali, fornendo al contempo ai ricercatori strumenti per analizzare e interpretare dipendenze spaziali e spazio-temporali complesse.

Bayesian nonparametric analysis of spatial and spatio-temporal data: modelling and computation

GIANELLA, MATTEO
2024/2025

Abstract

This thesis develops Bayesian nonparametric methodologies and computational strategies for the analysis of spatial and spatio-temporal data. From the methodological point of view, this dissertation introduces flexible Bayesian nonparametric models that addresses different applied problems, such as boundary detection, spatial and spatio-temporal clustering, arising, for instance, in studies ranging from socio-economic equity to environmental pollution monitoring. On the computational front, the thesis presents novel Markov Chain Monte Carlo algorithms tailored for large spatial and spatio-temporal datasets. The proposed algorithms, leveraging both on optimised implementation and on parallel processing, are de- signed to scale efficiently with data size and complexity, overcoming the computational bottlenecks associated with Bayesian nonparametric models for these types of data. All algorithms are publicly available as open-source software that enriches the available Bayesian toolbox for spatial data analysis. This thesis, then, tries to bridge the gap between Bayesian nonparametric statistical modelling and real-world applications, equipping researchers with tools to analyse and interpret complex spatial and temporal patterns.
CORREGGI, MICHELE
SABADINI, IRENE MARIA
4-feb-2025
Questa tesi sviluppa metodologie bayesiane non parametriche e strategie computazionali per l'analisi di dati spaziali e spaziotemporali. Dal punto di vista metodologico, la tesi introduce modelli bayesiani non parametrici flessibili che affrontano diversi problemi applicativi: boundary detection, clustering spaziale e spaziotemporale. Questi problemi emergono, ad esempio, in diversi studi, che spaziano dalla uguagliaza socio-economica al monitoraggio dell'inquinamento ambientale. Per qanto riguarda il lato computazionale, la tesi introduce nuovi algoritmi Markov chain Monte Carlo pensati per dataset spaziali e spaziotemporali di grandi dimensioni. Gli algoritmi proposti, sfruttando sia implementazioni ottimizzate sia il calcolo parallelo, sono pensati per scalare efficientemente rispetto alla dimensione e la complessità dei dati, superando i ben noti colli di bottiglia computazionali associati ai modelli bayesiani non parametrici per questi tipi di dato. Tutti gli algoritmi implementati sono disponibili pubblicamente come software open-source e arricchiscono gli strumenti disponibili per l'analisi di dati spaziali con approccio bayesiano. Questa tesi cerca, quindi, di colmare il divario tra la modellizzazione statistica bayesiana non parametrica e le applicazioni di tali modelli a problemi reali, fornendo al contempo ai ricercatori strumenti per analizzare e interpretare dipendenze spaziali e spazio-temporali complesse.
File allegati
File Dimensione Formato  
2025_02_Gianella.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: PhD Thesis
Dimensione 51.26 MB
Formato Adobe PDF
51.26 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/232713