This research describes the algorithms that analyze evolving data streams with the ultimate aim of learning from them in real-time using the MOA framework, one of the most popular open-source frameworks designed for the implementation of the latter. The objective of the thesis is to test the concept drift detector algorithms implemented in the framework by analyzing human Activities Daily Livings (ADL) to predict and control diseases, especially mental ones, that are caused by the advancement of individuals by age. In literature, about this topic, many authors focus their attention on the importance of monitoring the behavior of an individual concerning his wellbeing, while giving less importance to the behavioral changes identified by the study of data produced by technological devices such as sensors. This study begins with the analysis of the performance of concept detectors drift in MOA on data generated by the latter through specific options implemented in the framework. The same, then, were tested on a dataset that simulates the behavior of individuals in different daily activities (ADL) artificially containing different types of drift. Later, several experiments were made with different configurations to detect the best detection learner based on the different types of drift. The results of the experiments reveal that Abrupt drifts can be easily detected through the DDM method or more in general with an algorithm that is statistically based. Through the EDDM it is possible instead to find in a very detailed way Gradual drift. Finally, as far as the incremental drift is concerned, we can use ADWIN able to identify all the various behavioral drift over time but, in the presence of rumours, periodicity and glitches, this method is not recommended. In these cases, in fact, could better use a SEED Change detector algorithm that exploits its statistic component even being a window based method.

Questa ricerca descrive gli algoritmi che analizzano stream di dati in evoluzione con lo scopo ultimo di apprendere da essi in tempo reale avvalendosi dell’utilizzo del framework MOA, uno tra i pi`u popolari open source framework progettato per l’implementazione di quest’ultimi. L’obiettivo della tesi `e quello di testare gli algoritmi di concept drift detector implementati nel framework andando ad analizzare le Activities Daily Livings (ADL) umane per prevedere e controllare le malattie, soprattutto mentali, che sono causate dall’avanzamento d’et`a degli individui. In letteratura, in riferimento a questo argomento, molti autori pongono la loro attenzione allimportanza di monitorare il comportamento di un individuo in relazione al suo benessere dando per`o meno importanza ai cambiamenti comportamentali individuati dallo studio dei dati prodotti da dispositivi tecnologici quali possono essere i sensori. Questo studio inizia con l’analisi delle prestazioni dei rilevatori di concept drift in MOA su dati generati da quest’ultimo tramite specifiche opzioni implementate nel framework. Gli stessi, poi, sono stati testati su un dataset che simula il comportamento degli individui in diverse attivit`a quotidiane (ADL) contenti in maniera artificiale diversi tipi di drift. In seguito, sono stati fatti diversi esperimenti con diverse configurazioni per rilevare i miglior detection learner in base alle diverse tipologie di drift. I risultati degli esperimenti rivelano che i drift di tipo Abrupt possono essere facilmente rilevati attraverso il metodo DDM o pi`u in generale con un algoritmo basato sulla statistica. Tramite l’EDDM `e invece possibile trovare in modo molto dettagliato la i drift di tipo Gradual. Infine, per quanto riguarda gli Incremental drift, possiamo usare il metodo ADWIN che `e in grado di identificare le varie derive comportamentali riguardo andamenti incrementali nel tempo ma, in presenza di rumori, periodicit`a e anomalie, questo metodo non `e raccomandato. In questi casi, infatti, potrebbe essere megli utilizzare l’algoritmo SEED Change Detector che sfrutta la sua componente di statistica pure essendo un metodo basato sulle finestre.

Comparison of concept drift detectors in a health-care facility dataset to detect behavioral drifts

MASCIOPINTO, FABIO
2018/2019

Abstract

This research describes the algorithms that analyze evolving data streams with the ultimate aim of learning from them in real-time using the MOA framework, one of the most popular open-source frameworks designed for the implementation of the latter. The objective of the thesis is to test the concept drift detector algorithms implemented in the framework by analyzing human Activities Daily Livings (ADL) to predict and control diseases, especially mental ones, that are caused by the advancement of individuals by age. In literature, about this topic, many authors focus their attention on the importance of monitoring the behavior of an individual concerning his wellbeing, while giving less importance to the behavioral changes identified by the study of data produced by technological devices such as sensors. This study begins with the analysis of the performance of concept detectors drift in MOA on data generated by the latter through specific options implemented in the framework. The same, then, were tested on a dataset that simulates the behavior of individuals in different daily activities (ADL) artificially containing different types of drift. Later, several experiments were made with different configurations to detect the best detection learner based on the different types of drift. The results of the experiments reveal that Abrupt drifts can be easily detected through the DDM method or more in general with an algorithm that is statistically based. Through the EDDM it is possible instead to find in a very detailed way Gradual drift. Finally, as far as the incremental drift is concerned, we can use ADWIN able to identify all the various behavioral drift over time but, in the presence of rumours, periodicity and glitches, this method is not recommended. In these cases, in fact, could better use a SEED Change detector algorithm that exploits its statistic component even being a window based method.
MASCIADRI, ANDREA
ING - Scuola di Ingegneria Industriale e dell'Informazione
4-ott-2019
2018/2019
Questa ricerca descrive gli algoritmi che analizzano stream di dati in evoluzione con lo scopo ultimo di apprendere da essi in tempo reale avvalendosi dell’utilizzo del framework MOA, uno tra i pi`u popolari open source framework progettato per l’implementazione di quest’ultimi. L’obiettivo della tesi `e quello di testare gli algoritmi di concept drift detector implementati nel framework andando ad analizzare le Activities Daily Livings (ADL) umane per prevedere e controllare le malattie, soprattutto mentali, che sono causate dall’avanzamento d’et`a degli individui. In letteratura, in riferimento a questo argomento, molti autori pongono la loro attenzione allimportanza di monitorare il comportamento di un individuo in relazione al suo benessere dando per`o meno importanza ai cambiamenti comportamentali individuati dallo studio dei dati prodotti da dispositivi tecnologici quali possono essere i sensori. Questo studio inizia con l’analisi delle prestazioni dei rilevatori di concept drift in MOA su dati generati da quest’ultimo tramite specifiche opzioni implementate nel framework. Gli stessi, poi, sono stati testati su un dataset che simula il comportamento degli individui in diverse attivit`a quotidiane (ADL) contenti in maniera artificiale diversi tipi di drift. In seguito, sono stati fatti diversi esperimenti con diverse configurazioni per rilevare i miglior detection learner in base alle diverse tipologie di drift. I risultati degli esperimenti rivelano che i drift di tipo Abrupt possono essere facilmente rilevati attraverso il metodo DDM o pi`u in generale con un algoritmo basato sulla statistica. Tramite l’EDDM `e invece possibile trovare in modo molto dettagliato la i drift di tipo Gradual. Infine, per quanto riguarda gli Incremental drift, possiamo usare il metodo ADWIN che `e in grado di identificare le varie derive comportamentali riguardo andamenti incrementali nel tempo ma, in presenza di rumori, periodicit`a e anomalie, questo metodo non `e raccomandato. In questi casi, infatti, potrebbe essere megli utilizzare l’algoritmo SEED Change Detector che sfrutta la sua componente di statistica pure essendo un metodo basato sulle finestre.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
MasciopintoTesi.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 7.6 MB
Formato Adobe PDF
7.6 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/150543