Among the technological sectors that are enjoying considerable success in recent years is undoubtedly the Machine Learning, which is the area of greatest impact of Artificial Intelligence, for the ability of the algorithms to discern model and rules, which goes beyond the human cognitive one. Some case studies were started within the "Big Data Analytics" project of the Vimercate Hospital with the partnership of a specialized society, with the aim of enhancing and extracting knowledge from the information content of the amount of digitized data generated daily by the hospital activity. In this paper, a series of predictive models for diabetes induced complications have been implemented, including Decision Tree, Random Forest, SVC and Linear Regression, based on the data contained in the hospital database dedicated to patients suffering from that pathology. Data processing has been applied, after the data analysis and the selection of the most interesting ones, to manage the imbalance between the classes and the missing data. The construction of a Neural Network was based on the results obtained from learning methods previously mentioned, to classify the onset of nephropathy, retinopathy, heart disease and complications of peripheral and cerebral blood vessels. Considered variables are gender, time from diagnosis, body mass index (BMI), glycated haemoglobin (HbA1c), hypertension, triglycerides, fasting glycemia, creatinine, cholesterol, insulin and hyperglycaemic pharmacotherapy, complications already present and familiarity with the diabetic pathology. Performance are evaluated through the Receiver Operating Characteristic (ROC) and the Loss Function of the Neural Network, providing accuracy up to 0.91.

Tra i settori tecnologici che stanno riscuotendo un ragguardevole successo negli ultimi anni si colloca senz’altro l’apprendimento automatico, meglio noto come Machine Learning, che rappresenta l’area di maggior impatto dell’Intelligenza Artificiale, per la capacità degli algoritmi di scorgere pattern e regole, che supera quella cognitiva umana. Nell’ambito del progetto “Big Data Analytics” avviato dall’ASST di Vimercate con la partnership di una società specializzata nel settore, sono stati avviati dei casi di studio, con l’obbiettivo di valorizzare ed estrarre conoscenza dal contenuto informativo della mole di dati digitali, generati quotidianamente dall’attività dell’ospedale. In questo lavoro sono stati implementati una serie di modelli predittivi, tra cui Decision Tree, Random Forest, SVC e Linear Regression, nell’ambito delle complicanze legate al diabete, sulla base dei dati contenuti nel database dell’ospedale dedicato ai pazienti affetti dalla patologia. Dopo aver analizzato i dati e selezionato quelli ritenuti più interessanti, sono state applicate strategie per gestire lo squilibrio tra le classi ed i dati mancanti. Sulla base dei risultati ottenuti dai modelli sopraelencati si è poi implementato un modello di Deep Learning, attraverso la costruzione di una Neural Network per classificare l’insorgenza di nefropatie, retinopatie, cardiopatie e complicazioni dei vasi sanguigni periferici e cerebrali. Le variabili considerate sono sesso, età, tempo dalla diagnosi, indice di massa corporea (BMI), emoglobina glicata (HbA1c), ipertensione, trigliceridi, glicemia a digiuno, creatinina, colesterolo, farmacoterapia insulinica e iperglicemizzante, complicanze già presenti e familiarità alla patologia diabetologica. Dei modelli finali, adattati ad ogni caso di complicanza, sono state analizzate le performance sulla base della Receiver Operating Characteristic (ROC) e della Loss Function della rete neurale, fornendo una precisione fino a 0.91.

Definizione ed implementazione di algoritmi di machine learning per la predizione delle complicanze indotte dal diabete

BOVIO, ALICE
2017/2018

Abstract

Among the technological sectors that are enjoying considerable success in recent years is undoubtedly the Machine Learning, which is the area of greatest impact of Artificial Intelligence, for the ability of the algorithms to discern model and rules, which goes beyond the human cognitive one. Some case studies were started within the "Big Data Analytics" project of the Vimercate Hospital with the partnership of a specialized society, with the aim of enhancing and extracting knowledge from the information content of the amount of digitized data generated daily by the hospital activity. In this paper, a series of predictive models for diabetes induced complications have been implemented, including Decision Tree, Random Forest, SVC and Linear Regression, based on the data contained in the hospital database dedicated to patients suffering from that pathology. Data processing has been applied, after the data analysis and the selection of the most interesting ones, to manage the imbalance between the classes and the missing data. The construction of a Neural Network was based on the results obtained from learning methods previously mentioned, to classify the onset of nephropathy, retinopathy, heart disease and complications of peripheral and cerebral blood vessels. Considered variables are gender, time from diagnosis, body mass index (BMI), glycated haemoglobin (HbA1c), hypertension, triglycerides, fasting glycemia, creatinine, cholesterol, insulin and hyperglycaemic pharmacotherapy, complications already present and familiarity with the diabetic pathology. Performance are evaluated through the Receiver Operating Characteristic (ROC) and the Loss Function of the Neural Network, providing accuracy up to 0.91.
DELGROSSI, GIOVANNI
ING - Scuola di Ingegneria Industriale e dell'Informazione
16-apr-2019
2017/2018
Tra i settori tecnologici che stanno riscuotendo un ragguardevole successo negli ultimi anni si colloca senz’altro l’apprendimento automatico, meglio noto come Machine Learning, che rappresenta l’area di maggior impatto dell’Intelligenza Artificiale, per la capacità degli algoritmi di scorgere pattern e regole, che supera quella cognitiva umana. Nell’ambito del progetto “Big Data Analytics” avviato dall’ASST di Vimercate con la partnership di una società specializzata nel settore, sono stati avviati dei casi di studio, con l’obbiettivo di valorizzare ed estrarre conoscenza dal contenuto informativo della mole di dati digitali, generati quotidianamente dall’attività dell’ospedale. In questo lavoro sono stati implementati una serie di modelli predittivi, tra cui Decision Tree, Random Forest, SVC e Linear Regression, nell’ambito delle complicanze legate al diabete, sulla base dei dati contenuti nel database dell’ospedale dedicato ai pazienti affetti dalla patologia. Dopo aver analizzato i dati e selezionato quelli ritenuti più interessanti, sono state applicate strategie per gestire lo squilibrio tra le classi ed i dati mancanti. Sulla base dei risultati ottenuti dai modelli sopraelencati si è poi implementato un modello di Deep Learning, attraverso la costruzione di una Neural Network per classificare l’insorgenza di nefropatie, retinopatie, cardiopatie e complicazioni dei vasi sanguigni periferici e cerebrali. Le variabili considerate sono sesso, età, tempo dalla diagnosi, indice di massa corporea (BMI), emoglobina glicata (HbA1c), ipertensione, trigliceridi, glicemia a digiuno, creatinina, colesterolo, farmacoterapia insulinica e iperglicemizzante, complicanze già presenti e familiarità alla patologia diabetologica. Dei modelli finali, adattati ad ogni caso di complicanza, sono state analizzate le performance sulla base della Receiver Operating Characteristic (ROC) e della Loss Function della rete neurale, fornendo una precisione fino a 0.91.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
TESI_Bovio_Alice.pdf

non accessibile

Descrizione: Testo della tesi
Dimensione 7.69 MB
Formato Adobe PDF
7.69 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/146149