CORREGGI, MICHELE
SABADINI, IRENE MARIA
4-feb-2025
Questa tesi sviluppa metodologie bayesiane non parametriche e strategie computazionali per l'analisi di dati spaziali e spaziotemporali. Dal punto di vista metodologico, la tesi introduce modelli bayesiani non parametrici flessibili che affrontano diversi problemi applicativi: boundary detection, clustering spaziale e spaziotemporale. Questi problemi emergono, ad esempio, in diversi studi, che spaziano dalla uguagliaza socio-economica al monitoraggio dell'inquinamento ambientale. Per qanto riguarda il lato computazionale, la tesi introduce nuovi algoritmi Markov chain Monte Carlo pensati per dataset spaziali e spaziotemporali di grandi dimensioni. Gli algoritmi proposti, sfruttando sia implementazioni ottimizzate sia il calcolo parallelo, sono pensati per scalare efficientemente rispetto alla dimensione e la complessità dei dati, superando i ben noti colli di bottiglia computazionali associati ai modelli bayesiani non parametrici per questi tipi di dato. Tutti gli algoritmi implementati sono disponibili pubblicamente come software open-source e arricchiscono gli strumenti disponibili per l'analisi di dati spaziali con approccio bayesiano. Questa tesi cerca, quindi, di colmare il divario tra la modellizzazione statistica bayesiana non parametrica e le applicazioni di tali modelli a problemi reali, fornendo al contempo ai ricercatori strumenti per analizzare e interpretare dipendenze spaziali e spazio-temporali complesse.
This thesis develops Bayesian nonparametric methodologies and computational strategies for the analysis of spatial and spatio-temporal data. From the methodological point of view, this dissertation introduces flexible Bayesian nonparametric models that addresses different applied problems, such as boundary detection, spatial and spatio-temporal clustering, arising, for instance, in studies ranging from socio-economic equity to environmental pollution monitoring. On the computational front, the thesis presents novel Markov Chain Monte Carlo algorithms tailored for large spatial and spatio-temporal datasets. The proposed algorithms, leveraging both on optimised implementation and on parallel processing, are de- signed to scale efficiently with data size and complexity, overcoming the computational bottlenecks associated with Bayesian nonparametric models for these types of data. All algorithms are publicly available as open-source software that enriches the available Bayesian toolbox for spatial data analysis. This thesis, then, tries to bridge the gap between Bayesian nonparametric statistical modelling and real-world applications, equipping researchers with tools to analyse and interpret complex spatial and temporal patterns.