In questa tesi viene proposto un nuovo modello bayesiano non parametrico per i tempi di attesa per eventi ricorrenti. La letteratura al riguardo è inesistente, quindi il modello proposto nell'elaborato sembra essere originale. Componenti fondamentali per l'elaborazione di tale modello sono quindi da una parte la teoria relativa agli eventi ricorrenti, dall'altra gli strumenti forniti dalla statistica bayesiana non parametrica. Gli eventi ricorrenti sono dei processi nei quali gli eventi si ripetono più volte nel corso del tempo; per descrivere questi eventi possono essere utilizzati metodi statistici basati sul conteggio di eventi oppure metodi statistici basati sui tempi di attesa. In questo lavoro ci si è basati su questi ultimi metodi ed in particolare sono stati molto utili i processi di rinnovo. In questo elaborato è stato utilizzato l'approccio bayesiano non parametrico, in particolare è stato utilizzato il processo di Dirichlet come prior non parametrica. Dopo aver descritto il modello che è stato utilizzato in tutta la tesi, questo è stato in primo luogo testato su 3 differenti dataset simulati per verificarne l'applicabilità, cioè per vedere se le stime bayesiane trovate dal modello e dai codici fossero simili ai valori veri dei parametri fissati per generare i dati simultati. Successivamente sono state svolte le analisi sul dataset "readmission" presente in un package di R(fraitypack) ed infine il modello è stato applicato a dati reali, che sono intertempi di pazienti affetti da infezione ricorrente. Per ognuno dei dataset a cui tale modello è stato applicato sono state riportate diverse inferenze: la distribuzione predittiva per le variabili latenti del processo di Dirichlet e la distribuzione a posteriori del numero di cluster, ossia del numero di gruppi che creano le variabili latenti. Le inferenze numeriche sono state calcolate utilizzando il linguaggio di programmazione JAGS che è in grado di costruire un algoritmo MCMC la cui distribuzione invariante è la posterior dei parametri, date le osservazioni.
Un modello bayesiano non parametrico per tempi di attesa di eventi ricorrenti
TALLARITA, MARTA
2014/2015
Abstract
In questa tesi viene proposto un nuovo modello bayesiano non parametrico per i tempi di attesa per eventi ricorrenti. La letteratura al riguardo è inesistente, quindi il modello proposto nell'elaborato sembra essere originale. Componenti fondamentali per l'elaborazione di tale modello sono quindi da una parte la teoria relativa agli eventi ricorrenti, dall'altra gli strumenti forniti dalla statistica bayesiana non parametrica. Gli eventi ricorrenti sono dei processi nei quali gli eventi si ripetono più volte nel corso del tempo; per descrivere questi eventi possono essere utilizzati metodi statistici basati sul conteggio di eventi oppure metodi statistici basati sui tempi di attesa. In questo lavoro ci si è basati su questi ultimi metodi ed in particolare sono stati molto utili i processi di rinnovo. In questo elaborato è stato utilizzato l'approccio bayesiano non parametrico, in particolare è stato utilizzato il processo di Dirichlet come prior non parametrica. Dopo aver descritto il modello che è stato utilizzato in tutta la tesi, questo è stato in primo luogo testato su 3 differenti dataset simulati per verificarne l'applicabilità, cioè per vedere se le stime bayesiane trovate dal modello e dai codici fossero simili ai valori veri dei parametri fissati per generare i dati simultati. Successivamente sono state svolte le analisi sul dataset "readmission" presente in un package di R(fraitypack) ed infine il modello è stato applicato a dati reali, che sono intertempi di pazienti affetti da infezione ricorrente. Per ognuno dei dataset a cui tale modello è stato applicato sono state riportate diverse inferenze: la distribuzione predittiva per le variabili latenti del processo di Dirichlet e la distribuzione a posteriori del numero di cluster, ossia del numero di gruppi che creano le variabili latenti. Le inferenze numeriche sono state calcolate utilizzando il linguaggio di programmazione JAGS che è in grado di costruire un algoritmo MCMC la cui distribuzione invariante è la posterior dei parametri, date le osservazioni.File | Dimensione | Formato | |
---|---|---|---|
2015_12_Tallarita.pdf
accessibile in internet per tutti
Descrizione: Testo della tesi
Dimensione
2.19 MB
Formato
Adobe PDF
|
2.19 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/115621