Healthcare administrative databases are becoming more and more important and reliable sources of clinical and epidemiological information. The present work marks the first Italian attempt which focuses on the acquisition, management and study of several data sources in the form of administrative databases regarding the Heart Failure pathology. All the data used in this thesis have been extracted from the administrative data warehouse of Lombardy Region, a region located in the northern part of Italy whose capital is Milan. One of the main goal of the present work is to identify, extrapolate and build a unique and consistent data structure to be used for statistical and research purposes. The administrative databases are conceived as repositories which are able to store many information but typically for managerial aims. This work is a step forward in moving the focus from a descriptive stand point of view to an inferential one. To achieve this goal, a great effort has been dedicated to the development of efficient algorithms, some of them have been finalized into a R package called msmtools. Moreover, this work studies the hospital admission-readmission process in order to explore the Heart Failure patient's epidemiology and to profile the health service utilization over time. We also investigate variations in patient care according to geographic area, socio-demographic characteristics as well as other administrative and clinical variables. The heterogeneity of the different data sources is fundamental to better characterize the disease progression and to possibly identify what are the main determinants of a hospital admission, readmission and death in patients with Heart Failure.

I database amministrativi sanitari stanno diventando fonti di informazioni cliniche ed epidemiologiche sempre più importanti e affidabili. Questo lavoro segna il primo tentativo italiano che si concentra sulla acquisizione, la gestione e lo studio di diverse fonti di dati amministrativi con focus su pazienti affetti da scompenso cardiaco. Tutti i dati utilizzati in questa tesi sono stati estratti dalla banca dati di Regione Lombardia. Uno dei principali obiettivi di questo lavoro è quello di identificare, estrapolare e costruire una struttura di dati unica e coerente che possa essere utilizzata a fini statistici e di ricerca. I database amministrativi sono concepiti come repository in grado di memorizzare molte informazioni, tuttavia per scopi tipicamente gestionali. Questo lavoro si propone di spostare l'attenzione da il classico approccio descrittivo ad uno inferenziale. A tal fine, un notevole sforzo è stato dedicato allo sviluppo di algoritmi efficienti, alcuni dei quali hanno portato allo sviluppo di un pacchetto R chiamato msmtools. Inoltre, questo lavoro si è concentrato sullo studio del processo di ammissione-riammissione ospedaliera al fine di esplorare l'epidemiologia della patologia e di profilare l'utilizzo dei servizi sanitari nel corso del tempo, ma anche di studiare variazioni nella cura del paziente in base alla zona geografica, alle caratteristiche socio-demografiche, nonché ad altre variabili cliniche. L'eterogeneità delle diverse fonti di dati risulta fondamentale per caratterizzare al meglio la progressione della malattia e possibilmente identificare quali sono i principali determinanti di un ricovero ospedaliero, di riammissione e di morte nei pazienti con insufficienza cardiaca.

Mining large administrative databases: efficient and scalable algorithms for statistical modeling

GROSSETTI, FRANCESCO

Abstract

Healthcare administrative databases are becoming more and more important and reliable sources of clinical and epidemiological information. The present work marks the first Italian attempt which focuses on the acquisition, management and study of several data sources in the form of administrative databases regarding the Heart Failure pathology. All the data used in this thesis have been extracted from the administrative data warehouse of Lombardy Region, a region located in the northern part of Italy whose capital is Milan. One of the main goal of the present work is to identify, extrapolate and build a unique and consistent data structure to be used for statistical and research purposes. The administrative databases are conceived as repositories which are able to store many information but typically for managerial aims. This work is a step forward in moving the focus from a descriptive stand point of view to an inferential one. To achieve this goal, a great effort has been dedicated to the development of efficient algorithms, some of them have been finalized into a R package called msmtools. Moreover, this work studies the hospital admission-readmission process in order to explore the Heart Failure patient's epidemiology and to profile the health service utilization over time. We also investigate variations in patient care according to geographic area, socio-demographic characteristics as well as other administrative and clinical variables. The heterogeneity of the different data sources is fundamental to better characterize the disease progression and to possibly identify what are the main determinants of a hospital admission, readmission and death in patients with Heart Failure.
SABADINI, IRENE MARIA
LUCCHETTI, ROBERTO
1-feb-2017
I database amministrativi sanitari stanno diventando fonti di informazioni cliniche ed epidemiologiche sempre più importanti e affidabili. Questo lavoro segna il primo tentativo italiano che si concentra sulla acquisizione, la gestione e lo studio di diverse fonti di dati amministrativi con focus su pazienti affetti da scompenso cardiaco. Tutti i dati utilizzati in questa tesi sono stati estratti dalla banca dati di Regione Lombardia. Uno dei principali obiettivi di questo lavoro è quello di identificare, estrapolare e costruire una struttura di dati unica e coerente che possa essere utilizzata a fini statistici e di ricerca. I database amministrativi sono concepiti come repository in grado di memorizzare molte informazioni, tuttavia per scopi tipicamente gestionali. Questo lavoro si propone di spostare l'attenzione da il classico approccio descrittivo ad uno inferenziale. A tal fine, un notevole sforzo è stato dedicato allo sviluppo di algoritmi efficienti, alcuni dei quali hanno portato allo sviluppo di un pacchetto R chiamato msmtools. Inoltre, questo lavoro si è concentrato sullo studio del processo di ammissione-riammissione ospedaliera al fine di esplorare l'epidemiologia della patologia e di profilare l'utilizzo dei servizi sanitari nel corso del tempo, ma anche di studiare variazioni nella cura del paziente in base alla zona geografica, alle caratteristiche socio-demografiche, nonché ad altre variabili cliniche. L'eterogeneità delle diverse fonti di dati risulta fondamentale per caratterizzare al meglio la progressione della malattia e possibilmente identificare quali sono i principali determinanti di un ricovero ospedaliero, di riammissione e di morte nei pazienti con insufficienza cardiaca.
Tesi di dottorato
File allegati
File Dimensione Formato  
Grossetti_PhD.pdf

accessibile in internet per tutti

Descrizione: PhD Thesis
Dimensione 3.54 MB
Formato Adobe PDF
3.54 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/131404