Spatial statistics is a vast research field that comprises all those techniques which study and analyze data while taking into account their topological, geometric, or geographical properties. In this work, we consider the problem of modeling data from I different groups, where each group correspond to a specific areal location. The starting point is a new statistical model that assumes the data distributed as a finite mixture and performs joint density estimation of spatial densities. A Bayesian approach is adopted throughout the analysis, thus suitable priors are introduced to encourage spatial dependence between mixtures. Our goal is to give two important contributions to the aforementioned model. Firstly, we introduce a prior on the number of components in the mixtures, thus requiring the implementation of a transdimensional sampling strategy for posterior inference. Then, we introduce a suitable class of priors to perform boundary detection. We propose a Reversible Jump sampler for managing the joint update of the number of components and the state of the chain that relies on the notion of ``optimal" proposals and, then, a sampling strategy for boundary detection that allows a simultaneous update of multiple links of the graph which describes the spatial structure of the problem. Both cases are then tested on simulated scenarios and finally applied on a real dataset about car accident casualties in Wales.

La statistica spaziale è un vasto ambito di ricerca che comprende tutte quelle tecniche che studiano e analizzano dati o entità tenendo in considerazione le loro proprietà topologiche, geometriche o geografiche. In questo lavoro, consideriamo il problema di modellizzare dati da I gruppi diversi, in cui ogni gruppo coincide con una specifica località areale. Il punto di partenza è un nuovo modello statistico che assume i dati distribuiti come una mistura finita e calcola la stima di densità per il vettore delle densità areali. Viene adottato un approccio bayesiano durante le analisi, quindi si introducono distribuzioni a priori per incoraggiare la dipendenza spaziale tra le misture. Il nostro obiettivo è quello di fornire due importanti contributi al modello sopracitato. Innanzitutto, introduciamo una prior al numero di componenti nella misture, il che richiede l'implementazione di una strategia di simulazione transdimensionale per l'inferenza a posteriori. In seguito, introduciamo una classe di prior adeguata per effettuare rilevazione di confini. Proponiamo un Reversible Jump sampler per l'aggiornamento simultaneo del numero di componenti e dello stato della catena che si basa sul concetto di proposte ``ottime" e, successivamente, una strategia di simulazione per la rilevazione dei confini che permette un aggiornamento simultaneo di molteplici archi del grafo che descrive la struttura spaziale del problema. Entrambi i casi sono quindi testati su scenari simulati ed infine applicati ad un dataset reale sulle vittime di incidenti stradali in Galles.

Spatially dependent mixture models with a random number of components

GIANELLA, MATTEO
2019/2020

Abstract

Spatial statistics is a vast research field that comprises all those techniques which study and analyze data while taking into account their topological, geometric, or geographical properties. In this work, we consider the problem of modeling data from I different groups, where each group correspond to a specific areal location. The starting point is a new statistical model that assumes the data distributed as a finite mixture and performs joint density estimation of spatial densities. A Bayesian approach is adopted throughout the analysis, thus suitable priors are introduced to encourage spatial dependence between mixtures. Our goal is to give two important contributions to the aforementioned model. Firstly, we introduce a prior on the number of components in the mixtures, thus requiring the implementation of a transdimensional sampling strategy for posterior inference. Then, we introduce a suitable class of priors to perform boundary detection. We propose a Reversible Jump sampler for managing the joint update of the number of components and the state of the chain that relies on the notion of ``optimal" proposals and, then, a sampling strategy for boundary detection that allows a simultaneous update of multiple links of the graph which describes the spatial structure of the problem. Both cases are then tested on simulated scenarios and finally applied on a real dataset about car accident casualties in Wales.
BERAHA, MARIO
ING - Scuola di Ingegneria Industriale e dell'Informazione
28-apr-2021
2019/2020
La statistica spaziale è un vasto ambito di ricerca che comprende tutte quelle tecniche che studiano e analizzano dati o entità tenendo in considerazione le loro proprietà topologiche, geometriche o geografiche. In questo lavoro, consideriamo il problema di modellizzare dati da I gruppi diversi, in cui ogni gruppo coincide con una specifica località areale. Il punto di partenza è un nuovo modello statistico che assume i dati distribuiti come una mistura finita e calcola la stima di densità per il vettore delle densità areali. Viene adottato un approccio bayesiano durante le analisi, quindi si introducono distribuzioni a priori per incoraggiare la dipendenza spaziale tra le misture. Il nostro obiettivo è quello di fornire due importanti contributi al modello sopracitato. Innanzitutto, introduciamo una prior al numero di componenti nella misture, il che richiede l'implementazione di una strategia di simulazione transdimensionale per l'inferenza a posteriori. In seguito, introduciamo una classe di prior adeguata per effettuare rilevazione di confini. Proponiamo un Reversible Jump sampler per l'aggiornamento simultaneo del numero di componenti e dello stato della catena che si basa sul concetto di proposte ``ottime" e, successivamente, una strategia di simulazione per la rilevazione dei confini che permette un aggiornamento simultaneo di molteplici archi del grafo che descrive la struttura spaziale del problema. Entrambi i casi sono quindi testati su scenari simulati ed infine applicati ad un dataset reale sulle vittime di incidenti stradali in Galles.
File allegati
File Dimensione Formato  
2021_04_Gianella.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: M.Sc. Thesis
Dimensione 7.2 MB
Formato Adobe PDF
7.2 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/173790