Blood is a limited resource and it quickly degrades, so the planning of campaigns for the acquisition of new donors is fundamental to guarantee the functioning of the health system. This led us to study Bayesian models for clustering in the presence of covariates with the aim of identifying groups of donors with particular physical and behavioral characteristics. In particular, the thesis focuses on the study of the prior for the random partition: starting from a model already used in the literature, the Product Partition model, we introduce in the prior a similarity factor that influences the clustering exploiting the available information that can be both regression covariates and other measures related to observations. In this way the model is able to capture a priori the dependence of the data from the covariates chosen for the calculation of similarity. By calibrating the influence of covariates and choosing the right similarity function, we have shown through simulated examples, that the model is more effective in finding the optimal partition than the Product Partition model, despite the computational complexity increases. It also improves accuracy in predicting a new observation. Applied to the context of donations, the proposed model provided us with results that are easier to interpret and that suggest types of donors on which AVIS can work to invest in targeted recruitment campaigns.

Il sangue è una risorsa limitata e che si degrada velocemente quindi la pianificazione di campagne per l'aquisizione di nuovi donatori è fondamentale per garantire il funzionamento del sistema sanitaro. Questo ci ha spinto a studiare modelli bayesiani per il clustering in presenza di covariate con il fine di identificare gruppi di donatori con particolari caratteristiche fisiche e comportamentali. In particolare la tesi si concentra sullo studio della prior per la partizione aleatoria: partendo da un modello già utilizzato in letteratura, il Product Partition model, introduciamo nella prior un fattore di similarità che influenza il clustering sfruttando le informazioni disponibili che possono essere sia le covariate di regressione che altre misure legate alle osservazioni. In questo modo il modello è in grado di catturare a priori la dipendenza dei dati dalla covariate scelte per il calcolo della similarità. Calibrando l'influenza delle covariate e scegliendo la giusta funzione di similarità, abbiamo mostrato attraverso esempi simulati, che il modello è più efficace nel trovare la partizione ottima rispetto al Product Partition model, nonostante la complessità computazionale aumenti. Inoltre migliora anche la precisione nel prevedere una nuova osservazione. Applicato al contesto delle donazioni, il modello proposto ci ha fornito dei risultati più facili da interpretare e che ci suggeriscono dei profili di donatori su si potrà lavorare per investire in modo mirato le risorse per le campagne di reclutamento.

Modelli bayesiani per il clustering in presenza di covariate

DI BLASI, ALESSIA
2018/2019

Abstract

Blood is a limited resource and it quickly degrades, so the planning of campaigns for the acquisition of new donors is fundamental to guarantee the functioning of the health system. This led us to study Bayesian models for clustering in the presence of covariates with the aim of identifying groups of donors with particular physical and behavioral characteristics. In particular, the thesis focuses on the study of the prior for the random partition: starting from a model already used in the literature, the Product Partition model, we introduce in the prior a similarity factor that influences the clustering exploiting the available information that can be both regression covariates and other measures related to observations. In this way the model is able to capture a priori the dependence of the data from the covariates chosen for the calculation of similarity. By calibrating the influence of covariates and choosing the right similarity function, we have shown through simulated examples, that the model is more effective in finding the optimal partition than the Product Partition model, despite the computational complexity increases. It also improves accuracy in predicting a new observation. Applied to the context of donations, the proposed model provided us with results that are easier to interpret and that suggest types of donors on which AVIS can work to invest in targeted recruitment campaigns.
ARGIENTO, RAFFAELE
ING - Scuola di Ingegneria Industriale e dell'Informazione
25-lug-2019
2018/2019
Il sangue è una risorsa limitata e che si degrada velocemente quindi la pianificazione di campagne per l'aquisizione di nuovi donatori è fondamentale per garantire il funzionamento del sistema sanitaro. Questo ci ha spinto a studiare modelli bayesiani per il clustering in presenza di covariate con il fine di identificare gruppi di donatori con particolari caratteristiche fisiche e comportamentali. In particolare la tesi si concentra sullo studio della prior per la partizione aleatoria: partendo da un modello già utilizzato in letteratura, il Product Partition model, introduciamo nella prior un fattore di similarità che influenza il clustering sfruttando le informazioni disponibili che possono essere sia le covariate di regressione che altre misure legate alle osservazioni. In questo modo il modello è in grado di catturare a priori la dipendenza dei dati dalla covariate scelte per il calcolo della similarità. Calibrando l'influenza delle covariate e scegliendo la giusta funzione di similarità, abbiamo mostrato attraverso esempi simulati, che il modello è più efficace nel trovare la partizione ottima rispetto al Product Partition model, nonostante la complessità computazionale aumenti. Inoltre migliora anche la precisione nel prevedere una nuova osservazione. Applicato al contesto delle donazioni, il modello proposto ci ha fornito dei risultati più facili da interpretare e che ci suggeriscono dei profili di donatori su si potrà lavorare per investire in modo mirato le risorse per le campagne di reclutamento.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2019_07_DiBlasi.pdf

non accessibile

Descrizione: Testo della tesi
Dimensione 3.3 MB
Formato Adobe PDF
3.3 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/148898