In this work a class of Bayesian models will be introduced to analyze non-decreasing longitudinal data. In this thesis we will analyze data related to the growth of children affected by acute lymphoblastic leukemia (ALL). The data set collects information about measurements on height for every patient, taken at diagnosis approximately every 6 months. Besides the height, for each patient is reported the type of treatment to which it was subjected, dividing the data in three categories. Previous studies on the effects of cranial radiation on height suggested that radiation (used in groups 2 and 3) contributed to decreased expected height. One of the goals of this work is to verify this hypothesis with proper statistical analyses. We are representing the growth curves, for each patient, with a vector $(Y_t, \ t \in \{t_1,...,t_n \})$. We assume that $Y_t$, the height of each patient at time $t$, is equal to a scale factor $J$, time independent, times the integral of a piecewise constant stochastic process; time is not linear, but is reparametrized with a \emph{time-scaling} function. We will assume that this functions is known, or linearly parametrized, and in this case the parameters of which is composed will be estimated by statistical analyses. The conditional likelihood depends on various parameters, some of them are latent variables, such as the number or frequency of jumps of the birth-death process; on the other hand we have parameters of interest (on which we are interested to make inference), like the scale factor $J$ and the \emph{time-scaling} function. Both models will be extended to the case of grouped data, to treat the specific medical problem. Following the Bayesian approach we will assign a prior distribution to the vector of parameters. We will compute the Bayesian inferences for this class of models, using two different kinds of algorithms to evaluate the final distribution: a standard Gibbs sampler and an ABC (Approximate Bayesian Computation) algorithm. In particular, we will focus attention on comparing parameters between groups (each of them represents a different therapy used on patients) and we will verify the hypothesis of different growth trends for the three groups.

In questo lavoro verrà presentata una classe di modelli bayesiani per l'analisi di dati longitudinali non decrescenti. In particolare, in questo elaborato verranno analizzati dati relativi alla crescita di bambini affetti da leucemia linfoblastica acuta (LLA). Il data set raccoglie dati relativi all'altezza di ogni paziente misurata dal pediatra in istanti di tempo con cadenza media attorno ai 6 mesi. Oltre all'altezza, per ogni paziente è segnalato il tipo di trattamento a cui è stato sottoposto, dividendo i pazienti in tre categorie. Studi medici hanno ipotizzato un rallentamento del processo di crescita per i pazienti sottoposti a sedute di radioterapia (gruppi 2 e 3); uno degli obiettivi di questo lavoro è la verifica di tale ipotesi tramite opportune analisi statistiche. Si tratta di rappresentare le curve di crescita, per ogni paziente, con un vettore $(Y_t, \ t \in \{t_1,...,t_n \})$. Si assume che $Y_t$, l'altezza di ogni paziente all'istante $t$, sia pari ad un fattore di scala $J$, costante nel tempo, moltiplicato per l'integrale, rispetto al tempo, di un processo stocastico costante a tratti; il tempo non è lineare, ma è riparametrizzato con una funzione di \emph{time-scaling}.Assumeremo che la funzione di \emph{time-scaling} sia nota, oppure sia parametrizzata linearmente, e in questo caso i parametri che la rappresentano verrano stimati. I parametri da cui dipende la verosimiglianza dei dati sono vari: alcuni sono intesi come variabili latenti, come il numero o la frequenza dei salti del processo di nascita e morte; altri invece sono parametri di interesse (sui quali faremo inferenza), come il fattore di scala $J$ e la funzione di \emph{time-scaling}. Entrambi i modelli verranno poi estesi al caso di dati raggruppati, per trattare il problema medico preso in esame. Seguendo l'approccio bayesiano verrà assegnata una distribuzione a priori per il vettore di parametri. Valuteremo le inferenze bayesiane per tale classe di modelli, utilizzando due diversi tipi di algoritmi per il calcolo della distribuzione finale: un algoritmo \emph{Gibbs sampler} e uno di tipo ABC (Approximate Bayesian Computation). In particolare, porremo attenzione al confronto dei parametri per gruppo (cioè la diversa terapia per i pazienti), verificando che tale differenza viene confermata dalle nostre stime.

A Bayesian analysis of non decreasing longitudinal data using birth death processes

BASSI, ANDREA
2012/2013

Abstract

In this work a class of Bayesian models will be introduced to analyze non-decreasing longitudinal data. In this thesis we will analyze data related to the growth of children affected by acute lymphoblastic leukemia (ALL). The data set collects information about measurements on height for every patient, taken at diagnosis approximately every 6 months. Besides the height, for each patient is reported the type of treatment to which it was subjected, dividing the data in three categories. Previous studies on the effects of cranial radiation on height suggested that radiation (used in groups 2 and 3) contributed to decreased expected height. One of the goals of this work is to verify this hypothesis with proper statistical analyses. We are representing the growth curves, for each patient, with a vector $(Y_t, \ t \in \{t_1,...,t_n \})$. We assume that $Y_t$, the height of each patient at time $t$, is equal to a scale factor $J$, time independent, times the integral of a piecewise constant stochastic process; time is not linear, but is reparametrized with a \emph{time-scaling} function. We will assume that this functions is known, or linearly parametrized, and in this case the parameters of which is composed will be estimated by statistical analyses. The conditional likelihood depends on various parameters, some of them are latent variables, such as the number or frequency of jumps of the birth-death process; on the other hand we have parameters of interest (on which we are interested to make inference), like the scale factor $J$ and the \emph{time-scaling} function. Both models will be extended to the case of grouped data, to treat the specific medical problem. Following the Bayesian approach we will assign a prior distribution to the vector of parameters. We will compute the Bayesian inferences for this class of models, using two different kinds of algorithms to evaluate the final distribution: a standard Gibbs sampler and an ABC (Approximate Bayesian Computation) algorithm. In particular, we will focus attention on comparing parameters between groups (each of them represents a different therapy used on patients) and we will verify the hypothesis of different growth trends for the three groups.
WIPER, MICHAEL PETER
ING - Scuola di Ingegneria Industriale e dell'Informazione
29-apr-2014
2012/2013
In questo lavoro verrà presentata una classe di modelli bayesiani per l'analisi di dati longitudinali non decrescenti. In particolare, in questo elaborato verranno analizzati dati relativi alla crescita di bambini affetti da leucemia linfoblastica acuta (LLA). Il data set raccoglie dati relativi all'altezza di ogni paziente misurata dal pediatra in istanti di tempo con cadenza media attorno ai 6 mesi. Oltre all'altezza, per ogni paziente è segnalato il tipo di trattamento a cui è stato sottoposto, dividendo i pazienti in tre categorie. Studi medici hanno ipotizzato un rallentamento del processo di crescita per i pazienti sottoposti a sedute di radioterapia (gruppi 2 e 3); uno degli obiettivi di questo lavoro è la verifica di tale ipotesi tramite opportune analisi statistiche. Si tratta di rappresentare le curve di crescita, per ogni paziente, con un vettore $(Y_t, \ t \in \{t_1,...,t_n \})$. Si assume che $Y_t$, l'altezza di ogni paziente all'istante $t$, sia pari ad un fattore di scala $J$, costante nel tempo, moltiplicato per l'integrale, rispetto al tempo, di un processo stocastico costante a tratti; il tempo non è lineare, ma è riparametrizzato con una funzione di \emph{time-scaling}.Assumeremo che la funzione di \emph{time-scaling} sia nota, oppure sia parametrizzata linearmente, e in questo caso i parametri che la rappresentano verrano stimati. I parametri da cui dipende la verosimiglianza dei dati sono vari: alcuni sono intesi come variabili latenti, come il numero o la frequenza dei salti del processo di nascita e morte; altri invece sono parametri di interesse (sui quali faremo inferenza), come il fattore di scala $J$ e la funzione di \emph{time-scaling}. Entrambi i modelli verranno poi estesi al caso di dati raggruppati, per trattare il problema medico preso in esame. Seguendo l'approccio bayesiano verrà assegnata una distribuzione a priori per il vettore di parametri. Valuteremo le inferenze bayesiane per tale classe di modelli, utilizzando due diversi tipi di algoritmi per il calcolo della distribuzione finale: un algoritmo \emph{Gibbs sampler} e uno di tipo ABC (Approximate Bayesian Computation). In particolare, porremo attenzione al confronto dei parametri per gruppo (cioè la diversa terapia per i pazienti), verificando che tale differenza viene confermata dalle nostre stime.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2014_04_Bassi.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 2.04 MB
Formato Adobe PDF
2.04 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/92408