The identification of anomalous instances inside big datasets is a prolific field of study in the Data Mining community. Different techniques have been developed to tackle the problem, especially in the context of unsupervised learning. In the latest years the attention moved into the field of semi-supervised learning, in particular, different researches have stemmed into the Active Learning research field, that was born with the purpose of improving the classification performance through user feedback. In this thesis we propose a survey of the State of the Art of Active Learning outlier detection techniques, grouping them through the different characteristics they present, after that we highlight the strengths and weakness of the various described techniques.

L’identificazione di valori anomali all’interno di grossi dataset è un campo di ricerca molto attivo nel data mining. Diverse tecniche sono state sviluppate per risolvere il problema, soprattutto nel campo dell’apprendimento non supervisionato. Negli ultimi anni questo paradigma si è spostato verso l’appicazione di tecniche semi-supervisionate e in particolare, diverse proposte sono nate nel campo dell’ Active learning, che nasce con l’intento di migliore le performance di classificazione attraverso il feedback dell’utente. In questa tesi proproniamo uno studio dello stato dell’arte delle tecniche di identificazione delle anomalie attraverso l’active learning, raggruppandole in base alle varie caratteristiche che esse presentano, dopodicchè presentiamo i punti di forza e di debolezza di ciascuna tecnica descritta.

Active learning approaches for outlier detection : a survey

DEL GAUDIO, ANTONIO
2018/2019

Abstract

The identification of anomalous instances inside big datasets is a prolific field of study in the Data Mining community. Different techniques have been developed to tackle the problem, especially in the context of unsupervised learning. In the latest years the attention moved into the field of semi-supervised learning, in particular, different researches have stemmed into the Active Learning research field, that was born with the purpose of improving the classification performance through user feedback. In this thesis we propose a survey of the State of the Art of Active Learning outlier detection techniques, grouping them through the different characteristics they present, after that we highlight the strengths and weakness of the various described techniques.
LUI, ANDREA
ING - Scuola di Ingegneria Industriale e dell'Informazione
29-apr-2020
2018/2019
L’identificazione di valori anomali all’interno di grossi dataset è un campo di ricerca molto attivo nel data mining. Diverse tecniche sono state sviluppate per risolvere il problema, soprattutto nel campo dell’apprendimento non supervisionato. Negli ultimi anni questo paradigma si è spostato verso l’appicazione di tecniche semi-supervisionate e in particolare, diverse proposte sono nate nel campo dell’ Active learning, che nasce con l’intento di migliore le performance di classificazione attraverso il feedback dell’utente. In questa tesi proproniamo uno studio dello stato dell’arte delle tecniche di identificazione delle anomalie attraverso l’active learning, raggruppandole in base alle varie caratteristiche che esse presentano, dopodicchè presentiamo i punti di forza e di debolezza di ciascuna tecnica descritta.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Tesi.pdf

non accessibile

Descrizione: Testo della tesi
Dimensione 1.93 MB
Formato Adobe PDF
1.93 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/153243