In questa tesi studieremo la dinamica di popolazione urbana in Massachusetts. In particolare questo studio ha come obiettivo quello di osservare l'evoluzione nel tempo dell'importanza della distanza spaziale dalla città di Boston che è il Central Business District (CBD). Il campione analizzato include osservazioni per le 351 più grandi città del Massachusetts ripartite nelle 14 contee dello stato. I dati sono stati ottenuti dal United States Census Bureau e derivano dagli ultimi 9 censimenti del 1930, 1940,...,2010. Il punto di partenza sono stati i seguenti due lavori: Epifani e Nicolini (2013, 2014). Nella letteratura econometrica, la densità della popolazione urbana in una regione è spiegata in termini di distanza di ciascuna città da un CBD, mediante un modello di regressione lineare o lineare generalizzato. La densità di popolazione è calcolata come numero di abitanti per superficie spazio residenza in km^2. Alla distanza dal CBD vengono poi affiancate altre covariate (per esempio composizione della popolazione per età, livello di istruzione, reddito, composizione etnica) per meglio capire le scelte di locazione dei cittadini. In Epifani e Nicolini (2013) la densità di popolazione urbana in Massachusetts è modellata mediante un modello econometrico bayesiano con frailties spaziali gamma; Boston è il CBD e la distanza fisica da Boston insieme alla composizione per etnie, per età e istruzione dello stato e la disponibilità di risorse nel territorio sono i predittori del modello. I coefficienti di regressione sono assunti a priori normali indipendenti. Inoltre, nel modello sono introdotti alcuni effetti aleatori spaziali gamma, uno per ogni contea, per catturare sia il grado di similarità delle preferenze dei cittadini che vivono in città appartenenti a una stessa contea, sia il grado di eterogeneità fra contee. L'effetto aleatorio di ciascuna contea riassume tutti i predittori della densità di popolazione: non osservabili e osservabili, ma non esplicitamente trattati. Epifani e Nicolini (2013) discutono il problema usando i dati di un solo anno (2000). D'altro canto, i dati sulla densità di popolazione urbana in Massachusetts rilevati con censimenti dal 1930 al 2010 indicano che ci sono stati rilevanti cambiamenti nel tempo, specialmente relativamente al peso della distanza fisica da Boston nelle preferenze di locazione della popolazione. I. Epifani e R. Nicolini hanno contribuito a esaminare l'evoluzione del “ fascino” di Boston nel tempo, adottando un approccio bayesiano per il caso di una distribuzione di popolazione monocentrica. Le autrici stimano un modello bayesiano con frailties spaziali gamma anno per anno e riescono a valutare come evolve nel tempo l'importanza relativa di ciascuna covariata. In particolare, si concentrano su due fattori chiave determinanti, cioè la distanza fisica da Boston e la composizione etnica dello stato. In Epifani, Nicolini (2014) le densità di popolazione sono modellizzate come variabili aleatorie indipendenti nel tempo. Una leggera relazione temporale fra loro è prodotta bayesianamente mediante una distribuzione a priori “ storica” sui parametri che lavora nel seguente modo: tutti i parametri sono indipendenti ma i corrispondenti iperparametri per ogni decennio dal 1930 al 2010 sono presi in accordo con le stime a posteriori di medie e varianze, dato il decennio precedente. In questa tesi, per spiegare meglio l'evoluzione della popolazione nel tempo e nello spazio, è stata fatta una proposta per modelizzare in modo semplice e flessibile la dipendenza fra le densità di popolazione lungo il tempo e nello spazio. In particolare un modello bayesiano dinamico lineare generalizzato con effetti aleatori ha reso ciò possibile. Il modello dinamico bayesiano gamma proposto, specifica: • Una equazione di osservazione gamma per le densità di popolazione che descrive la relazione fra i predittori e le densità di popolazione in modo tale che ad ogni tempo la densità di popolazione ha legge gamma con parametri tempo-varianti; • una equazione di stato (o di sistema) markoviana e normale che definisce la relazione fra i parametri di regressione β_t nei diversi tempi (in particolare questi parametri evolvono come delle passeggiate aleatorie gaussiane. A grandi linee succede che β _t= β _{t-1} + Ɛ_t con {Ɛ _t} sono indipendenti e con distribuzione gaussiana). La passeggiata aleatoria che fornisce l'equazione di stato dei coefficienti di regressione esprime una opinione iniziale di parametri che variano lentamente nel tempo; cioè a priori si crede che gli effetti dei predittori sulla variabile risposta siano localmente costanti e la loro variazione sia controllata da un modello normale. In questo modo, questa prior autoregressiva traduce bayesianamente il modo canonico di trattare con l'idea economica classica di aspettative adattive. • Una equazione di stato markoviana e gamma per gli effetti aleatori spaziali, dovuti alle contee tale che: a priori le serie storiche degli effetti aleatori di contea (che sono degli oggetti non osservabili) assumono la forma di modelli lineari autoregressivi del primo ordine ma con distribuzioni marginali gamma. Questi processi gamma, indicati in letteratura con l'acronimo BGAR(1) sono stati introdotti in P.A.W. Lewis et alii. Da un punto di vista della statistica matematica, questo modello ha rilevato alcune buone proprietà. Primo, esso può essere stimato in modo bayesiano in modo veramente semplice. Secondo, alcune semplici formule sono state derivate per la media, varianza e correlazione delle densità di popolazione. Per esempio, l'intensità della relazione fra le densità di popolazione di differenti città --i) che sono all'interno della stessa contea o che appartengono a contee diverse e ii) allo stesso tempo o a diversi lag temporali-- dipende in modo semplice dai parametri del modello e può essere così stimata facilmente. Per la implementazione dell'algoritmo Gibbs Sampling, ci siamo avvalsi del software JAGS (Just Another Gibbs Sampler), un pacchetto software di Plummer del 2010 che si interfaccia con R. Infine, il modello dinamico bayesiano gamma proposto in questa tesi, può essere applicato in contesti completamente diversi, quando l'ipotesi di un modello gamma risulta verosimile. Ad esempio, nella teoria dell'affidabilità, in idrologia e in meteorologia. Infatti i tempi di servizio o gli intertempi in una coda sono modellizzati con distribuzioni gamma, come anche le misurazioni sulla velocità del vento o del flusso dei fiumi.

Modelli bayesiani dinamici e processi gamma applicati all'analisi dell'evoluzione temporale di densità di popolazione

VEZZOSI, CLAUDIA
2013/2014

Abstract

In questa tesi studieremo la dinamica di popolazione urbana in Massachusetts. In particolare questo studio ha come obiettivo quello di osservare l'evoluzione nel tempo dell'importanza della distanza spaziale dalla città di Boston che è il Central Business District (CBD). Il campione analizzato include osservazioni per le 351 più grandi città del Massachusetts ripartite nelle 14 contee dello stato. I dati sono stati ottenuti dal United States Census Bureau e derivano dagli ultimi 9 censimenti del 1930, 1940,...,2010. Il punto di partenza sono stati i seguenti due lavori: Epifani e Nicolini (2013, 2014). Nella letteratura econometrica, la densità della popolazione urbana in una regione è spiegata in termini di distanza di ciascuna città da un CBD, mediante un modello di regressione lineare o lineare generalizzato. La densità di popolazione è calcolata come numero di abitanti per superficie spazio residenza in km^2. Alla distanza dal CBD vengono poi affiancate altre covariate (per esempio composizione della popolazione per età, livello di istruzione, reddito, composizione etnica) per meglio capire le scelte di locazione dei cittadini. In Epifani e Nicolini (2013) la densità di popolazione urbana in Massachusetts è modellata mediante un modello econometrico bayesiano con frailties spaziali gamma; Boston è il CBD e la distanza fisica da Boston insieme alla composizione per etnie, per età e istruzione dello stato e la disponibilità di risorse nel territorio sono i predittori del modello. I coefficienti di regressione sono assunti a priori normali indipendenti. Inoltre, nel modello sono introdotti alcuni effetti aleatori spaziali gamma, uno per ogni contea, per catturare sia il grado di similarità delle preferenze dei cittadini che vivono in città appartenenti a una stessa contea, sia il grado di eterogeneità fra contee. L'effetto aleatorio di ciascuna contea riassume tutti i predittori della densità di popolazione: non osservabili e osservabili, ma non esplicitamente trattati. Epifani e Nicolini (2013) discutono il problema usando i dati di un solo anno (2000). D'altro canto, i dati sulla densità di popolazione urbana in Massachusetts rilevati con censimenti dal 1930 al 2010 indicano che ci sono stati rilevanti cambiamenti nel tempo, specialmente relativamente al peso della distanza fisica da Boston nelle preferenze di locazione della popolazione. I. Epifani e R. Nicolini hanno contribuito a esaminare l'evoluzione del “ fascino” di Boston nel tempo, adottando un approccio bayesiano per il caso di una distribuzione di popolazione monocentrica. Le autrici stimano un modello bayesiano con frailties spaziali gamma anno per anno e riescono a valutare come evolve nel tempo l'importanza relativa di ciascuna covariata. In particolare, si concentrano su due fattori chiave determinanti, cioè la distanza fisica da Boston e la composizione etnica dello stato. In Epifani, Nicolini (2014) le densità di popolazione sono modellizzate come variabili aleatorie indipendenti nel tempo. Una leggera relazione temporale fra loro è prodotta bayesianamente mediante una distribuzione a priori “ storica” sui parametri che lavora nel seguente modo: tutti i parametri sono indipendenti ma i corrispondenti iperparametri per ogni decennio dal 1930 al 2010 sono presi in accordo con le stime a posteriori di medie e varianze, dato il decennio precedente. In questa tesi, per spiegare meglio l'evoluzione della popolazione nel tempo e nello spazio, è stata fatta una proposta per modelizzare in modo semplice e flessibile la dipendenza fra le densità di popolazione lungo il tempo e nello spazio. In particolare un modello bayesiano dinamico lineare generalizzato con effetti aleatori ha reso ciò possibile. Il modello dinamico bayesiano gamma proposto, specifica: • Una equazione di osservazione gamma per le densità di popolazione che descrive la relazione fra i predittori e le densità di popolazione in modo tale che ad ogni tempo la densità di popolazione ha legge gamma con parametri tempo-varianti; • una equazione di stato (o di sistema) markoviana e normale che definisce la relazione fra i parametri di regressione β_t nei diversi tempi (in particolare questi parametri evolvono come delle passeggiate aleatorie gaussiane. A grandi linee succede che β _t= β _{t-1} + Ɛ_t con {Ɛ _t} sono indipendenti e con distribuzione gaussiana). La passeggiata aleatoria che fornisce l'equazione di stato dei coefficienti di regressione esprime una opinione iniziale di parametri che variano lentamente nel tempo; cioè a priori si crede che gli effetti dei predittori sulla variabile risposta siano localmente costanti e la loro variazione sia controllata da un modello normale. In questo modo, questa prior autoregressiva traduce bayesianamente il modo canonico di trattare con l'idea economica classica di aspettative adattive. • Una equazione di stato markoviana e gamma per gli effetti aleatori spaziali, dovuti alle contee tale che: a priori le serie storiche degli effetti aleatori di contea (che sono degli oggetti non osservabili) assumono la forma di modelli lineari autoregressivi del primo ordine ma con distribuzioni marginali gamma. Questi processi gamma, indicati in letteratura con l'acronimo BGAR(1) sono stati introdotti in P.A.W. Lewis et alii. Da un punto di vista della statistica matematica, questo modello ha rilevato alcune buone proprietà. Primo, esso può essere stimato in modo bayesiano in modo veramente semplice. Secondo, alcune semplici formule sono state derivate per la media, varianza e correlazione delle densità di popolazione. Per esempio, l'intensità della relazione fra le densità di popolazione di differenti città --i) che sono all'interno della stessa contea o che appartengono a contee diverse e ii) allo stesso tempo o a diversi lag temporali-- dipende in modo semplice dai parametri del modello e può essere così stimata facilmente. Per la implementazione dell'algoritmo Gibbs Sampling, ci siamo avvalsi del software JAGS (Just Another Gibbs Sampler), un pacchetto software di Plummer del 2010 che si interfaccia con R. Infine, il modello dinamico bayesiano gamma proposto in questa tesi, può essere applicato in contesti completamente diversi, quando l'ipotesi di un modello gamma risulta verosimile. Ad esempio, nella teoria dell'affidabilità, in idrologia e in meteorologia. Infatti i tempi di servizio o gli intertempi in una coda sono modellizzati con distribuzioni gamma, come anche le misurazioni sulla velocità del vento o del flusso dei fiumi.
ING - Scuola di Ingegneria Industriale e dell'Informazione
18-dic-2014
2013/2014
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2014_12_Vezzosi.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 2.33 MB
Formato Adobe PDF
2.33 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/102621