Anomaly Detection is a subset of Pattern Recognition and Machine Learning. This work presents an approach to ANomaly DEtection as a Service (ANDES) in the field of predictive maintenance on time series data. ANDES performs two tasks or requests by a user, Training or Inference. The system can train multiple One-Class SVM models (that are unsupervised) and selects the best ones evaluating their performance against synthetically generated outliers. Inference is performed using the previously trained models to infer the classification of new data either as nominal or anomalous. The framework manages the requests by the users and runs them in parallel on a Kubernetes cluster while communication and storage is performed on a Redpanda cluster. It leverages the performance and characteristics of these clusters to provide a reliable and failure resistant system. Testing was performed on the infrastructure and on the anomaly detection logic, using a dataset of vibration data recorded on vibrating mechanical machinery, encoded as time-series. ANDES is a working research example of ANomaly DEtection as a Service, that in light of the lack of research in the field provides a starting point for a broader and more featureful system, with the capability to help users in many different fields.
La Rilevazione di Anomalie è un sottoinseme della ricerca di schemi e apprendimento automatico. Questo lavoro presenta una approccio ad un Servizio di Rilevazione di Anomalie (ANDES) nell’ambito della manutenzione predittiva su serie temporali. ANDES può completare due tipologie di richieste poste dall’ utente, Allenamento e Inferenza. Il sistema può allenare più modelli di tipo One-Class SVM (che usano apprendimento non supervisonato) ed è in grado di scegliere i migliori ripetto al numero di anomalie generate sinteticamente che sono rilevate correttamente. L’Inferenza viene svolta utilizzando i modelli precedentemente allenati al fine di classificare nuovi dati come nominali oppure anomali. L’infrastruttura gestisce in parallelo le richeste fatte dagli utenti utilizzando un Kubernetes cluster, mentre la comunicazione e l’archiviazione avvengono attraverso un Redpanda cluster. Essa riesce a sfruttare le performance e caratteristiche di questi cluster per fornire un servizio affidabile e resistente ai fallimenti. Il sistema, comprendende di infrastruttura che logica di rilevazione delle anomalie, è stato testato usando un dataset di dati di vibrazioni sottoforma di serie temporali, raccolti durante il funzionamento di macchinari meccanici. ANDES è solo un esempio funzionante a livello di ricerca che, data la mancanza in letteratura di altri esempi in questo settore, fornisce un primo passo per arrivare in futuro ad un sistema più elaborato, generalizzato e completo, capace di servire utenti in diversi ambiti di applicazione.
ANDES : an approach to ANomaly DEtection as a Service
Manzella, Davide
2022/2023
Abstract
Anomaly Detection is a subset of Pattern Recognition and Machine Learning. This work presents an approach to ANomaly DEtection as a Service (ANDES) in the field of predictive maintenance on time series data. ANDES performs two tasks or requests by a user, Training or Inference. The system can train multiple One-Class SVM models (that are unsupervised) and selects the best ones evaluating their performance against synthetically generated outliers. Inference is performed using the previously trained models to infer the classification of new data either as nominal or anomalous. The framework manages the requests by the users and runs them in parallel on a Kubernetes cluster while communication and storage is performed on a Redpanda cluster. It leverages the performance and characteristics of these clusters to provide a reliable and failure resistant system. Testing was performed on the infrastructure and on the anomaly detection logic, using a dataset of vibration data recorded on vibrating mechanical machinery, encoded as time-series. ANDES is a working research example of ANomaly DEtection as a Service, that in light of the lack of research in the field provides a starting point for a broader and more featureful system, with the capability to help users in many different fields.File | Dimensione | Formato | |
---|---|---|---|
Tesi (17).pdf
accessibile in internet solo dagli utenti autorizzati
Dimensione
2.44 MB
Formato
Adobe PDF
|
2.44 MB | Adobe PDF | Visualizza/Apri |
Tesi Finale.pdf
accessibile in internet solo dagli utenti autorizzati
Dimensione
2.52 MB
Formato
Adobe PDF
|
2.52 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/211649