The aim of this work is to compare three software for Bayesian computation: JAGS, Stan and NIMBLE. These software, starting from the specification of the model, are able to automatically build a Markov chain Monte Carlo algorithm to sample from the posterior distributions of the parameters. To make the comparison, we fit different models, such as conjugate models, linear and mixed-effects models, generalized linear models, accelerated failure time models and mixture models on simulated data sets. In generating the data, we vary the sample sizes, the dimension of the parameter space and, when needed, the number of groups for grouped data. Many models were analyzed under different choices of priors. For every choice of model and data set, we monitor the efficiency of the sampling of the different software and hence their performance. We also compare the ability to parallelize execution and memory requirement of each software.

In questa tesi, ho confrontato tre software, JAGS, Stan e NIMBLE per la simulazione da distribuzioni a posteriori di un modello bayesiano, tramite algoritmi di tipo MCMC. Il confronto è stato effettuato tramite l'analisi di diversi modelli quali modelli coniugati, modelli lineari e lineari a effetti misti, modelli lineari generalizzati, modelli "accelerated failure time" e modelli mistura, sempre utilizzando dati simulati. I dati sono stati simulati dalla verosimigliaza del modello stesso. Il confronto è stato effettuato con diversa numerosità del campione, diversa dimensionalità dello spazio dei parametetri e, ove necessario, diverso numero di gruppi nel caso di dati raggruppati. Molti modelli sono stati analizzati fissando diverse distribuzioni a priori dei parametri. Per ogni simulazione effettuata, abbiamo monitorato l'efficienza del campionamento e quindi le performance dei software. Inoltre, abbiamo analizzato la capacità di eseguire il campionamento di catene multiple in parallelo, confrontando anche la quantità di memoria richiesta dai software.

A thorough review of MCMC software : comparison between JAGS, Stan and NIMBLE

Falco, Daniele
2019/2020

Abstract

The aim of this work is to compare three software for Bayesian computation: JAGS, Stan and NIMBLE. These software, starting from the specification of the model, are able to automatically build a Markov chain Monte Carlo algorithm to sample from the posterior distributions of the parameters. To make the comparison, we fit different models, such as conjugate models, linear and mixed-effects models, generalized linear models, accelerated failure time models and mixture models on simulated data sets. In generating the data, we vary the sample sizes, the dimension of the parameter space and, when needed, the number of groups for grouped data. Many models were analyzed under different choices of priors. For every choice of model and data set, we monitor the efficiency of the sampling of the different software and hence their performance. We also compare the ability to parallelize execution and memory requirement of each software.
ING - Scuola di Ingegneria Industriale e dell'Informazione
28-apr-2021
2019/2020
In questa tesi, ho confrontato tre software, JAGS, Stan e NIMBLE per la simulazione da distribuzioni a posteriori di un modello bayesiano, tramite algoritmi di tipo MCMC. Il confronto è stato effettuato tramite l'analisi di diversi modelli quali modelli coniugati, modelli lineari e lineari a effetti misti, modelli lineari generalizzati, modelli "accelerated failure time" e modelli mistura, sempre utilizzando dati simulati. I dati sono stati simulati dalla verosimigliaza del modello stesso. Il confronto è stato effettuato con diversa numerosità del campione, diversa dimensionalità dello spazio dei parametetri e, ove necessario, diverso numero di gruppi nel caso di dati raggruppati. Molti modelli sono stati analizzati fissando diverse distribuzioni a priori dei parametri. Per ogni simulazione effettuata, abbiamo monitorato l'efficienza del campionamento e quindi le performance dei software. Inoltre, abbiamo analizzato la capacità di eseguire il campionamento di catene multiple in parallelo, confrontando anche la quantità di memoria richiesta dai software.
File allegati
File Dimensione Formato  
Daniele_Falco_tesi.pdf

accessibile in internet solo dagli utenti autorizzati

Dimensione 3.74 MB
Formato Adobe PDF
3.74 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/175565