Compositional Data Analysis (CoDa) is a field of statistics that deals with data which are positive and subjected to a sum constraint. In this setting, the traditional statistical techniques may result in unacceptable outcomes, due to the fact that the result can possibly violate the constraints. To face this issue, the CoDa community has been using the Aitchison geometry. It is a geometry based on log-ratios, which is meaningful as long as the compositions do not include zeros. In a geostatistical setting, the CoDa literature proposes to transform the data with a log-ratio approach and then apply classical spatial techniques (like kriging) on the transformed data. A new class of transformations of compositional data, named alpha-transformations, has been proposed in the last years. Although allowing to deal with zeros, the alpha-transformation is still only partially studied and used in CoDa, particularly in a geostatistical setting. This work aims at investigating the alpha-transformation when applied to spatial data with a significant regard to the expressions of the spatial structure of data. As an element of innovation, the alpha-BC-transformation is here proposed as a possible alternative to the alpha-transformation, leading to an easier and explicit expression of the spatial covariance function. Unlike the classical log-ratio transform (ilr), it accepts zeros in the compositions and it tends to the ilr for a value alpha=0 of its parameter. The alpha-BC-transformation is here tested on simulated spatial compositional data in order to understand which value of alpha gives the best results in kriging. Several scenarios are studied and positive conclusions are drawn for the use of the alpha-BC-transformation in a geostatistical setting. Finally, a spatial compositional dataset is analysed through the same approach in order to remark the strengths and weaknesses of the proposed transformation.
L'analisi di dati composizionali (CoDa) è un campo della statistica che tratta dati le cui componenti sono positive e soggette a un vincolo sulla somma. In questo specifico campo, le tecniche statistiche tradizionali possono portare a risultati non accettabili nel caso in cui il risultato violi tale vincolo. Per affrontare questo problema, la comunità scienti fica CoDa usa da anni la geometria di Aitchison; è una geometria basata sui log-ratio che fornisce risultati significativi purché le composizioni non contengano zero. In uno scenario geostatistico, la letteratura CoDa propone di trasformare i dati con un approccio basato sui log-ratio per poi applicare tecniche classiche di analisi spaziale (come il kriging) sui dati trasformati. Negli ultimi anni è stata proposta una nuova classe di trasformazioni, chiamate alpha-transformations. Sebbene permettano di trattare gli zeri, queste trasformazioni sono ancora solo parzialmente studiate e utilizzate in CoDa, specialmente in ambito geostatistico. Il presente lavoro mira a approfondire questa trasformazione con particolare attenzione all'espressione della struttura spaziale dei dati. Come elemento di innovazione, l'alpha-Box-Cox-transformation è qui proposta come possibile alternativa alla alpha-transformation, così da permettere di definire una più semplice ed esplicita espressione della funzione di covarianza spaziale. A differenza della classica trasformazione log-ratio (ilr), l'alpha-BC-transformation e applicabile anche su dati che contengono componenti nulle e tende alla ilr per un valore di alpha=0 del suo parametro. L'alpha-BC-transformation è qui sperimentata su dati composizionali spaziali simulati, in modo da cogliere quale valore di alpha dia i migliori risultati nel kriging. Dall'esame di molteplici simulazioni si traggono conclusioni positive riguardo all'uso dell'alpha-BC-transformation in ambito geostatistico. Infine, nel lavoro si esamina un dataset composizionale spaziale tramite l'utilizzo dello stesso approccio, con l'obiettivo di rimarcare gli aspetti positivi e i punti deboli dell'alpha-BC-transformation proposta.
Spatial statistics of compositional data based on alpha-transformations
CLAROTTO, LUCIA
2019/2020
Abstract
Compositional Data Analysis (CoDa) is a field of statistics that deals with data which are positive and subjected to a sum constraint. In this setting, the traditional statistical techniques may result in unacceptable outcomes, due to the fact that the result can possibly violate the constraints. To face this issue, the CoDa community has been using the Aitchison geometry. It is a geometry based on log-ratios, which is meaningful as long as the compositions do not include zeros. In a geostatistical setting, the CoDa literature proposes to transform the data with a log-ratio approach and then apply classical spatial techniques (like kriging) on the transformed data. A new class of transformations of compositional data, named alpha-transformations, has been proposed in the last years. Although allowing to deal with zeros, the alpha-transformation is still only partially studied and used in CoDa, particularly in a geostatistical setting. This work aims at investigating the alpha-transformation when applied to spatial data with a significant regard to the expressions of the spatial structure of data. As an element of innovation, the alpha-BC-transformation is here proposed as a possible alternative to the alpha-transformation, leading to an easier and explicit expression of the spatial covariance function. Unlike the classical log-ratio transform (ilr), it accepts zeros in the compositions and it tends to the ilr for a value alpha=0 of its parameter. The alpha-BC-transformation is here tested on simulated spatial compositional data in order to understand which value of alpha gives the best results in kriging. Several scenarios are studied and positive conclusions are drawn for the use of the alpha-BC-transformation in a geostatistical setting. Finally, a spatial compositional dataset is analysed through the same approach in order to remark the strengths and weaknesses of the proposed transformation.File | Dimensione | Formato | |
---|---|---|---|
2020_10_Clarotto.pdf
Open Access dal 12/09/2021
Descrizione: Testo della tesi
Dimensione
90.03 MB
Formato
Adobe PDF
|
90.03 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/167065