In this work a nonparametric Bayesian model is fitted to study data related to patients admitted to hospitals in Lombardy with ST-elevation myocardial infarction diagnosis and treated with angioplasty. Data are collected in the STEMI dataset, an observational clinical study planned within the Strategic Program of Regione Lombardia 2010, which collect clinical informations on patients with myocardial infarction diagnosis and treated in a hospital situated in Lombardy. The aim of the registry is to evaluate, with statistical analysis of this data, times and effectiveness of treatment. The introduced model is multivariate where the response is a vector of three components, which are three variables considered important to evaluate the efficiency of the hospitals and the effectiveness of the treatment: Door-to-Balloon time, that is the time between the admission to the hospital and angioplasty (continuous response), in-hospital survival and survival after 60 days from admission, both binary responses. The aim of this work has been to construct an MCMC algorithm for the computation of posterior inferences. In particular we have computed the final distribution of the parameters of the model, including the random partition $\rho$ of the patients using a PPMx prior on $\rho$. Consequently, we have estimated the same parameters with the summary statistics of the final distribution. Also, since one of the objectives was to identify groups of patients (somehow characterized by similar features) we have provided an estimate of the random partition, which is the clustering of patients. Finally, we have also calculated the predictive distribution of patients with given covariates.

In questo lavoro verrà presentato un modello bayesiano non parametrico per l'analisi di dati di sopravvivenza di pazienti colpiti da infarto miocardico acuto con sopraslivellamento del tratto ST e sottoposti ad angioplastica in ospedali della regione Lombardia. I dati sono stati resi disponibili tramite l'Archivio STEMI, un registro di osservazione clinica creato all'interno del Programma Strategico della Regione Lombardia nel 2010, che raccoglie le informazioni cliniche riguardanti i pazienti colpiti da infarto e curati negli ospedali lombardi. Il registro è stato istituito per poter valutare i tempi e l'efficacia delle cure e successivamente selezionare strategie ottimali per la terapia dell'infarto miocardico acuto. Il modello presentato è multivariato, in quanto la risposta è un vettore a tre componenti, corrispondenti alle tre variabili considerate di interesse in termini di efficienza degli ospedali e di efficacia del percorso di cura: il tempo DB, cioè il tempo intercordo tra l'ingresso in ospedale e l'angioplastica (risposta continua), la sopravvivenza alla dimissione e la sopravvivenza dopo 60 giorni dall'ingresso in ospedale, entrambe risposte binarie. Lo scopo di questa tesi è stata la costruzione di un algoritmo di tipo MCMC per il calcolo delle inferenze a posteriori. In particolare abbiamo calcolato la distribuzione finale dei parametri del modello, compresa la partizione aleatoria $\rho$ dei pazienti utilizzando una prior PPMx su $\rho$. Di conseguenza abbiamo stimato i parametri stessi con le statistiche riassuntive della distribuzione finale. Inoltre, visto che uno degli obiettivi era quello di identificare gruppi di pazienti (in qualche modo accomunati da caratteristiche simili) abbiamo fornito una stima della partizione aleatoria, che costituisce il raggruppamento dei pazienti. Infine, abbiamo anche calcolato la distribuzione predittiva di pazienti con determinate covariate.

Bayesian nonparametric multi-response models for clustering of patients in presence of unbalanced in-hospital survival

VALVO, VALERIO
2012/2013

Abstract

In this work a nonparametric Bayesian model is fitted to study data related to patients admitted to hospitals in Lombardy with ST-elevation myocardial infarction diagnosis and treated with angioplasty. Data are collected in the STEMI dataset, an observational clinical study planned within the Strategic Program of Regione Lombardia 2010, which collect clinical informations on patients with myocardial infarction diagnosis and treated in a hospital situated in Lombardy. The aim of the registry is to evaluate, with statistical analysis of this data, times and effectiveness of treatment. The introduced model is multivariate where the response is a vector of three components, which are three variables considered important to evaluate the efficiency of the hospitals and the effectiveness of the treatment: Door-to-Balloon time, that is the time between the admission to the hospital and angioplasty (continuous response), in-hospital survival and survival after 60 days from admission, both binary responses. The aim of this work has been to construct an MCMC algorithm for the computation of posterior inferences. In particular we have computed the final distribution of the parameters of the model, including the random partition $\rho$ of the patients using a PPMx prior on $\rho$. Consequently, we have estimated the same parameters with the summary statistics of the final distribution. Also, since one of the objectives was to identify groups of patients (somehow characterized by similar features) we have provided an estimate of the random partition, which is the clustering of patients. Finally, we have also calculated the predictive distribution of patients with given covariates.
QUINTANA, FERNANDO A.
ING - Scuola di Ingegneria Industriale e dell'Informazione
18-dic-2013
2012/2013
In questo lavoro verrà presentato un modello bayesiano non parametrico per l'analisi di dati di sopravvivenza di pazienti colpiti da infarto miocardico acuto con sopraslivellamento del tratto ST e sottoposti ad angioplastica in ospedali della regione Lombardia. I dati sono stati resi disponibili tramite l'Archivio STEMI, un registro di osservazione clinica creato all'interno del Programma Strategico della Regione Lombardia nel 2010, che raccoglie le informazioni cliniche riguardanti i pazienti colpiti da infarto e curati negli ospedali lombardi. Il registro è stato istituito per poter valutare i tempi e l'efficacia delle cure e successivamente selezionare strategie ottimali per la terapia dell'infarto miocardico acuto. Il modello presentato è multivariato, in quanto la risposta è un vettore a tre componenti, corrispondenti alle tre variabili considerate di interesse in termini di efficienza degli ospedali e di efficacia del percorso di cura: il tempo DB, cioè il tempo intercordo tra l'ingresso in ospedale e l'angioplastica (risposta continua), la sopravvivenza alla dimissione e la sopravvivenza dopo 60 giorni dall'ingresso in ospedale, entrambe risposte binarie. Lo scopo di questa tesi è stata la costruzione di un algoritmo di tipo MCMC per il calcolo delle inferenze a posteriori. In particolare abbiamo calcolato la distribuzione finale dei parametri del modello, compresa la partizione aleatoria $\rho$ dei pazienti utilizzando una prior PPMx su $\rho$. Di conseguenza abbiamo stimato i parametri stessi con le statistiche riassuntive della distribuzione finale. Inoltre, visto che uno degli obiettivi era quello di identificare gruppi di pazienti (in qualche modo accomunati da caratteristiche simili) abbiamo fornito una stima della partizione aleatoria, che costituisce il raggruppamento dei pazienti. Infine, abbiamo anche calcolato la distribuzione predittiva di pazienti con determinate covariate.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Tesi.pdf

accessibile in internet per tutti

Dimensione 5.29 MB
Formato Adobe PDF
5.29 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/88426