The modelling of species distribution plays an important role in both theoretical and applied ecology. Given a set of species occurrences, the aim is to infer its spatial distribution over a given territory. Joint Species Distribution models (JSDM) study joint species occurrences or abundances at different locations. In the Bayesian framework, this is often done by modelling a continuous latent variable in a hierarchical generalised mixed linear model framework. The regression term models the effect of the environmental conditions on the species, to account for their habitat, while the covariance structure of the residuals of the regression models the interactions between species.\par We have reviewed and compared different JSDMs on a simulated dataset, in order to understand their prediction ability as well as the use of these models to infer the interactions between species. In order to reduce the dimension of the parameters space of these models, we have proposed four models that combine latent factors and a Bayesian nonparametric prior to cluster and further reduce the effective number of rows of the matrix representing the random effect induced by the covariance matrix. Such models, that are extensions of a model that already exists in the literature, allow the underlying clustering process to be more flexible and to take into account an ecological prior knowledge on the number of clusters. In two of these extensions we used a Pitman--Yor (PY) process prior, that we have approximated using a new truncation method that could satisfy our need for a fast sampling scheme. We have implemented these models in R and we have tested them on both simulated and real datasets.

La modellizzazione delle specie gioca un ruolo importante sia nell'ecologia teoretica che in quella sperimentale. Dato un insieme di osservazioni di una specie, l'obiettivo è quello di fare inferenza sulla distribuzione spaziale della specie in un certo territorio. I Joint Species Distribution models (JSDM) studiano la distribuzione di più specie contemporaneamente. In un contesto Bayesiano, tale compito viene svolto modellizando una variabile latente continua all'interno di un modello gerarchico lineare misto generalizzato. Il termine di regressione modellizza l'effetto delle condizioni ambientali delle specie, per tenere conto del loro habitat, uno dei principali fattori per la presenza di una specie. Un altro fattore importante, le interazioni tra le specie, sono modellizzate dalla struttura di covarianza dei residui della regressione. Abbiamo recensito e paragonato alcuni JSDMs su un dataset simulato, per capire la capacità predittiva di tali modelli e la loro abilità nel ricostruire le interazioni tra le specie. Per ridurre la dimensione dello spazio dei parametri di tali modelli, abbiamo proposto quattro modelli che combinano i modelli a fattori latenti con un prior Bayesiano non parametrico per raggruppare e ridurre il numero di righe della matrice che rappresenta gli effetti aleatori indotti dalla matrice di covarianza. Tali modelli, che sono estensioni di un modello già esistente in letteratura, permettono di incorporare una conoscenza ecologica a priori sul numero di gruppi. In due di queste estensioni abbiamo usato come prior un processo di Pitman--Yor (PY), e abbiamo introdotto un nuovo metodo di troncamento per consentire una simulazione efficace della posterior. Abbiamo implementato tali modelli in R a li abbiamo testati su dataset sia simulati che reali.

Joint species distribution models : review and methodological development

POGGIATO, GIOVANNI
2018/2019

Abstract

The modelling of species distribution plays an important role in both theoretical and applied ecology. Given a set of species occurrences, the aim is to infer its spatial distribution over a given territory. Joint Species Distribution models (JSDM) study joint species occurrences or abundances at different locations. In the Bayesian framework, this is often done by modelling a continuous latent variable in a hierarchical generalised mixed linear model framework. The regression term models the effect of the environmental conditions on the species, to account for their habitat, while the covariance structure of the residuals of the regression models the interactions between species.\par We have reviewed and compared different JSDMs on a simulated dataset, in order to understand their prediction ability as well as the use of these models to infer the interactions between species. In order to reduce the dimension of the parameters space of these models, we have proposed four models that combine latent factors and a Bayesian nonparametric prior to cluster and further reduce the effective number of rows of the matrix representing the random effect induced by the covariance matrix. Such models, that are extensions of a model that already exists in the literature, allow the underlying clustering process to be more flexible and to take into account an ecological prior knowledge on the number of clusters. In two of these extensions we used a Pitman--Yor (PY) process prior, that we have approximated using a new truncation method that could satisfy our need for a fast sampling scheme. We have implemented these models in R and we have tested them on both simulated and real datasets.
ARBEL, JULYAN
THUILLER, WILFRIED
ING - Scuola di Ingegneria Industriale e dell'Informazione
3-ott-2019
2018/2019
La modellizzazione delle specie gioca un ruolo importante sia nell'ecologia teoretica che in quella sperimentale. Dato un insieme di osservazioni di una specie, l'obiettivo è quello di fare inferenza sulla distribuzione spaziale della specie in un certo territorio. I Joint Species Distribution models (JSDM) studiano la distribuzione di più specie contemporaneamente. In un contesto Bayesiano, tale compito viene svolto modellizando una variabile latente continua all'interno di un modello gerarchico lineare misto generalizzato. Il termine di regressione modellizza l'effetto delle condizioni ambientali delle specie, per tenere conto del loro habitat, uno dei principali fattori per la presenza di una specie. Un altro fattore importante, le interazioni tra le specie, sono modellizzate dalla struttura di covarianza dei residui della regressione. Abbiamo recensito e paragonato alcuni JSDMs su un dataset simulato, per capire la capacità predittiva di tali modelli e la loro abilità nel ricostruire le interazioni tra le specie. Per ridurre la dimensione dello spazio dei parametri di tali modelli, abbiamo proposto quattro modelli che combinano i modelli a fattori latenti con un prior Bayesiano non parametrico per raggruppare e ridurre il numero di righe della matrice che rappresenta gli effetti aleatori indotti dalla matrice di covarianza. Tali modelli, che sono estensioni di un modello già esistente in letteratura, permettono di incorporare una conoscenza ecologica a priori sul numero di gruppi. In due di queste estensioni abbiamo usato come prior un processo di Pitman--Yor (PY), e abbiamo introdotto un nuovo metodo di troncamento per consentire una simulazione efficace della posterior. Abbiamo implementato tali modelli in R a li abbiamo testati su dataset sia simulati che reali.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Tesi_Giovanni_Poggiato _final.pdf

accessibile in internet per tutti

Dimensione 4.08 MB
Formato Adobe PDF
4.08 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/150038