In this thesis the major theme of air pollution is discussed. Specifically, this work focus on the time series of particulate matter (PM) concentrations registered in the Po valley. Once provided a general overview of the phenomenon in the whole area of interest, we deepen the analysis for data collected in Emilia-Romagna during 2018. This choice was driven by the huge dimensionality of the original database received from the ARPA associations of multiple regions. At first, we propose Bayesian spatio-temporal hierarchical models in order to explain the PM10 concentrations trend. Then, well-known posterior predictive goodness-of-fit criteria will be involved to select the "best" model among the proposed ones. Subsequently, we generalized this "best" model to provide model-based clustering for the recording stations in Emilia-Romagna. In general, model-based clustering gives hints on the clustering structure of the individuals that goes beyond the characteristics of the individuals themselves. Applied to our data, this Bayesian non-parametric clustering procedure has provided interesting results, separating the stations located on the Apennines mountains from the other recording sites. Furthermore, the models we have proposed can provide spatio-temporal prediction and allow for the inclusion of data in the whole Po valley over multiple years. We also plan to include new regressors, such as meteorological factors, into the models.

In questa tesi viene affrontato il tema di rilievo dell’inquinamento atmosferico. In particolare, questo lavoro si concentrerà sulle time-series delle concentrazioni di particulate matter (PM) registrate nella Pianura Padana. Una volta fornita una panoramica generale del fenomeno in tutta l’area di interesse, sono state implementate tecniche più complesse considerando solo i dati raccolti in Emilia-Romagna nel corso del 2018. Questa scelta è stata guidata dalle grandi dimensioni del database originale ricevuto dalle associazioni ARPA di più regioni. Inizialmente verranno proposti dei modelli gerarchici spazio-temporali seguendo l’approccio bayesiano, per spiegare l’andamento delle concentrazioni del PM10 nel tempo. Verranno poi utilizzati dei noti criteri di predictive goodness-of-fit per selezionare il modello "migliore" tra quelli proposti. Il modello scelto verrà poi usato come punto di partenza per modelli mistura per il clustering, che verranno applicati ai dati per ottenere una partizione delle stazioni in Emilia-Romagna. I gruppi ottenuti grazie a questi modelli, detti modelli bayesiani non parametrici per il clustering, hanno fornito interessanti scoperte, separando le stazioni situate sugli Appennini dagli altri siti di registrazione. In generale, la clusterizzazione basata su modelli fornisce informazioni aggiuntive sui dati, essendo i gruppi trovati diversi da quelli definiti dalle caratteristiche delle stazioni. Inoltre, i modelli proposti forniscono un buon punto di partenza adatto per lo sviluppo di modelli ancora più complessi, che permetterebbero di ottenere nuovi risultati come la previsione spazio-temporale, l’estensione dei modelli a più regioni in più anni e l’inclusione di nuovi regressori (per esempio i fattori metereologici).

Spatio-temporal models for particulate matter in the Po valley

Frigeri, Michela
2021/2022

Abstract

In this thesis the major theme of air pollution is discussed. Specifically, this work focus on the time series of particulate matter (PM) concentrations registered in the Po valley. Once provided a general overview of the phenomenon in the whole area of interest, we deepen the analysis for data collected in Emilia-Romagna during 2018. This choice was driven by the huge dimensionality of the original database received from the ARPA associations of multiple regions. At first, we propose Bayesian spatio-temporal hierarchical models in order to explain the PM10 concentrations trend. Then, well-known posterior predictive goodness-of-fit criteria will be involved to select the "best" model among the proposed ones. Subsequently, we generalized this "best" model to provide model-based clustering for the recording stations in Emilia-Romagna. In general, model-based clustering gives hints on the clustering structure of the individuals that goes beyond the characteristics of the individuals themselves. Applied to our data, this Bayesian non-parametric clustering procedure has provided interesting results, separating the stations located on the Apennines mountains from the other recording sites. Furthermore, the models we have proposed can provide spatio-temporal prediction and allow for the inclusion of data in the whole Po valley over multiple years. We also plan to include new regressors, such as meteorological factors, into the models.
LONATI, GIOVANNI
ING - Scuola di Ingegneria Industriale e dell'Informazione
6-ott-2022
2021/2022
In questa tesi viene affrontato il tema di rilievo dell’inquinamento atmosferico. In particolare, questo lavoro si concentrerà sulle time-series delle concentrazioni di particulate matter (PM) registrate nella Pianura Padana. Una volta fornita una panoramica generale del fenomeno in tutta l’area di interesse, sono state implementate tecniche più complesse considerando solo i dati raccolti in Emilia-Romagna nel corso del 2018. Questa scelta è stata guidata dalle grandi dimensioni del database originale ricevuto dalle associazioni ARPA di più regioni. Inizialmente verranno proposti dei modelli gerarchici spazio-temporali seguendo l’approccio bayesiano, per spiegare l’andamento delle concentrazioni del PM10 nel tempo. Verranno poi utilizzati dei noti criteri di predictive goodness-of-fit per selezionare il modello "migliore" tra quelli proposti. Il modello scelto verrà poi usato come punto di partenza per modelli mistura per il clustering, che verranno applicati ai dati per ottenere una partizione delle stazioni in Emilia-Romagna. I gruppi ottenuti grazie a questi modelli, detti modelli bayesiani non parametrici per il clustering, hanno fornito interessanti scoperte, separando le stazioni situate sugli Appennini dagli altri siti di registrazione. In generale, la clusterizzazione basata su modelli fornisce informazioni aggiuntive sui dati, essendo i gruppi trovati diversi da quelli definiti dalle caratteristiche delle stazioni. Inoltre, i modelli proposti forniscono un buon punto di partenza adatto per lo sviluppo di modelli ancora più complessi, che permetterebbero di ottenere nuovi risultati come la previsione spazio-temporale, l’estensione dei modelli a più regioni in più anni e l’inclusione di nuovi regressori (per esempio i fattori metereologici).
File allegati
File Dimensione Formato  
2022_10_Frigeri.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Executive summary e testo tesi
Dimensione 11.23 MB
Formato Adobe PDF
11.23 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/195435