This thesis presents an online deep-learning-based system for preserving the quality of the deployed model, by continuously providing high-quality machine learning-enabled services. The proposed approach starts with an initial model based on an artificial neural network, continuously updated using new data, and then retrospectively evaluated in an online fashion. This approach can be instantiated using Machine Learning Operations (MLOps), automating ongoing validation, and handling concept drifts for the deployed models. The thesis analyzes the state of the art in MLOps, identifies the leading tools, and proposes instantiations to deal with them. The thesis analyzes common drift remediation types, and proposes algorithm adaptations in these cases. The thesis tests the approach on a dataset of 8642 hospitalized patients gathered over six months, looking for a current infection with SARS-CoV- 2, the virus that causes CoViD-19. An initial model is created using data from a one-month-long observation; afterwards, the model is assessed online utilizing data over five-month-long observations. The method reached an AUC of 0.794 in forecasting RT-PCR test outcomes, 6% better than offline binary classification techniques and 5% more accurate than standard online- learning techniques.

La tesi presenta un sistema basato sull’apprendimento online per preservare la qualità del modello di intelligenza artificiale in produzione per fornire continuamente servizi abilitati per l’apprendimento automatico di alta qualità. L’approccio proposto inizia con un modello iniziale basato su una rete neurale artificiale, continuamente aggiornato utilizzando nuovi dati, e quindi valutato retrospettivamente in modo online. Questa soluzione può essere istanziata utilizzando operazioni per l’apprendimento automatico (MLOps), automatizzando la continua convalida e la gestione delle derive concettuali per i modelli distribuiti. La tesi analizza lo stato dell’arte di MLOps, identifica gli strumenti principali e propone istanze per affrontare una corretta modellizzazione. La tesi analizza i tipi comuni di correzione della deriva e propone adattamenti dell’algoritmo in questi casi. La tesi testa l’approccio su un set di dati di 8642 pazienti ospedalizzati raccolti in sei mesi, alla ricerca di un’infezione in corso con SARS-CoV-2, il virus che causa CoViD-19. Viene definito un modello iniziale utilizzando un periodo di un mese di dati; successivamente, il modello è stato valutato online utilizzando i dati provenienti da un periodo di cinque mesi. Il metodo ha raggiunto un AUC di 0.794 nella previsione dei risultati del test RT-PCR, 6% migliore rispetto alle tecniche di classificazione binaria offline e 5% più accurato rispetto alle tecniche comuni di apprendimento online.

A switching adaption mode for model validity preservation via online deep learning

Avci, Oguzhan
2021/2022

Abstract

This thesis presents an online deep-learning-based system for preserving the quality of the deployed model, by continuously providing high-quality machine learning-enabled services. The proposed approach starts with an initial model based on an artificial neural network, continuously updated using new data, and then retrospectively evaluated in an online fashion. This approach can be instantiated using Machine Learning Operations (MLOps), automating ongoing validation, and handling concept drifts for the deployed models. The thesis analyzes the state of the art in MLOps, identifies the leading tools, and proposes instantiations to deal with them. The thesis analyzes common drift remediation types, and proposes algorithm adaptations in these cases. The thesis tests the approach on a dataset of 8642 hospitalized patients gathered over six months, looking for a current infection with SARS-CoV- 2, the virus that causes CoViD-19. An initial model is created using data from a one-month-long observation; afterwards, the model is assessed online utilizing data over five-month-long observations. The method reached an AUC of 0.794 in forecasting RT-PCR test outcomes, 6% better than offline binary classification techniques and 5% more accurate than standard online- learning techniques.
FACCA, FEDERICO MICHELE
ING - Scuola di Ingegneria Industriale e dell'Informazione
20-dic-2022
2021/2022
La tesi presenta un sistema basato sull’apprendimento online per preservare la qualità del modello di intelligenza artificiale in produzione per fornire continuamente servizi abilitati per l’apprendimento automatico di alta qualità. L’approccio proposto inizia con un modello iniziale basato su una rete neurale artificiale, continuamente aggiornato utilizzando nuovi dati, e quindi valutato retrospettivamente in modo online. Questa soluzione può essere istanziata utilizzando operazioni per l’apprendimento automatico (MLOps), automatizzando la continua convalida e la gestione delle derive concettuali per i modelli distribuiti. La tesi analizza lo stato dell’arte di MLOps, identifica gli strumenti principali e propone istanze per affrontare una corretta modellizzazione. La tesi analizza i tipi comuni di correzione della deriva e propone adattamenti dell’algoritmo in questi casi. La tesi testa l’approccio su un set di dati di 8642 pazienti ospedalizzati raccolti in sei mesi, alla ricerca di un’infezione in corso con SARS-CoV-2, il virus che causa CoViD-19. Viene definito un modello iniziale utilizzando un periodo di un mese di dati; successivamente, il modello è stato valutato online utilizzando i dati provenienti da un periodo di cinque mesi. Il metodo ha raggiunto un AUC di 0.794 nella previsione dei risultati del test RT-PCR, 6% migliore rispetto alle tecniche di classificazione binaria offline e 5% più accurato rispetto alle tecniche comuni di apprendimento online.
File allegati
File Dimensione Formato  
2022_12_Avci.pdf

solo utenti autorizzati dal 24/11/2023

Dimensione 1.2 MB
Formato Adobe PDF
1.2 MB Adobe PDF   Visualizza/Apri
2022_12_Avci_Executive_Summary.pdf

solo utenti autorizzati dal 24/11/2023

Dimensione 661.73 kB
Formato Adobe PDF
661.73 kB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/197253