A thorough review of MCMC software : comparison between JAGS, Stan and NIMBLE

Biblioteche e Archivi
POLITesi - Archivio digitale delle tesi di laurea e di dottorato

The aim of this work is to compare three software for Bayesian computation: JAGS, Stan and NIMBLE. These software, starting from the specification of the model, are able to automatically build a Markov chain Monte Carlo algorithm to sample from the posterior distributions of the parameters. To make the comparison, we fit different models, such as conjugate models, linear and mixed-effects models, generalized linear models, accelerated failure time models and mixture models on simulated data sets. In generating the data, we vary the sample sizes, the dimension of the parameter space and, when needed, the number of groups for grouped data. Many models were analyzed under different choices of priors. For every choice of model and data set, we monitor the efficiency of the sampling of the different software and hence their performance. We also compare the ability to parallelize execution and memory requirement of each software.

In questa tesi, ho confrontato tre software, JAGS, Stan e NIMBLE per la simulazione da distribuzioni a posteriori di un modello bayesiano, tramite algoritmi di tipo MCMC. Il confronto è stato effettuato tramite l'analisi di diversi modelli quali modelli coniugati, modelli lineari e lineari a effetti misti, modelli lineari generalizzati, modelli "accelerated failure time" e modelli mistura, sempre utilizzando dati simulati. I dati sono stati simulati dalla verosimigliaza del modello stesso. Il confronto è stato effettuato con diversa numerosità del campione, diversa dimensionalità dello spazio dei parametetri e, ove necessario, diverso numero di gruppi nel caso di dati raggruppati. Molti modelli sono stati analizzati fissando diverse distribuzioni a priori dei parametri. Per ogni simulazione effettuata, abbiamo monitorato l'efficienza del campionamento e quindi le performance dei software. Inoltre, abbiamo analizzato la capacità di eseguire il campionamento di catene multiple in parallelo, confrontando anche la quantità di memoria richiesta dai software.

A thorough review of MCMC software : comparison between JAGS, Stan and NIMBLE

Falco, Daniele

2019/2020

Abstract

The aim of this work is to compare three software for Bayesian computation: JAGS, Stan and NIMBLE. These software, starting from the specification of the model, are able to automatically build a Markov chain Monte Carlo algorithm to sample from the posterior distributions of the parameters. To make the comparison, we fit different models, such as conjugate models, linear and mixed-effects models, generalized linear models, accelerated failure time models and mixture models on simulated data sets. In generating the data, we vary the sample sizes, the dimension of the parameter space and, when needed, the number of groups for grouped data. Many models were analyzed under different choices of priors. For every choice of model and data set, we monitor the efficiency of the sampling of the different software and hence their performance. We also compare the ability to parallelize execution and memory requirement of each software.

Scheda breve

Scheda completa

	Relatore
	
				GUGLIELMI, ALESSANDRA
			
	Scuola / Dip.
	
				ING  - Scuola di Ingegneria Industriale e dell'Informazione
			
	Data
	
				28-apr-2021
			
	Anno accademico
	
				2019/2020
			
	Abstract in italiano
	
				In questa tesi, ho confrontato tre software, JAGS, Stan e NIMBLE per la simulazione da distribuzioni a posteriori di un modello bayesiano, tramite algoritmi di tipo MCMC. Il confronto è stato effettuato tramite l'analisi di diversi modelli quali modelli coniugati, modelli lineari e lineari a effetti misti, modelli lineari generalizzati, modelli "accelerated failure time" e modelli mistura, sempre utilizzando dati simulati. I dati sono stati simulati dalla verosimigliaza del modello stesso. Il confronto è stato effettuato con diversa numerosità del campione, diversa dimensionalità dello spazio dei parametetri e, ove necessario, diverso numero di gruppi nel caso di dati raggruppati. Molti modelli sono stati analizzati fissando diverse distribuzioni a priori dei parametri. Per ogni simulazione effettuata, abbiamo monitorato l'efficienza del campionamento e quindi le performance dei software. Inoltre, abbiamo analizzato la capacità di eseguire il campionamento di catene multiple in parallelo, confrontando anche la quantità di memoria richiesta dai software.
			
	Appare nelle tipologie:
	
				Tesi di laurea Magistrale

File allegati

File	Dimensione	Formato
Daniele_Falco_tesi.pdf accessibile in internet solo dagli utenti autorizzati Dimensione 3.74 MB Formato Adobe PDF Visualizza/Apri	3.74 MB	Adobe PDF	Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/175565