Computer vision is one of the hot topics nowadays when talking about artificial intelligence, covering a wide range of problems under its domain, from document verification to object detection. One of these problems consists in detecting spoofing attacks, masquerading as a registered user in a face-recognition system, gaining illegitimate access and advantages, used in face-recognition payments, phone unlocking, workers checking –in… When training models focused on solving this kind of problems, one of the main concerns is the data we have to deal with due to its small variety, leading to generalization problems. Some of the main approaches that try to tackle these overfitting issues include dropout techniques, model variations or adding some kind of regularization. While in general the way of adding regularization is by introducing a regularization parameter in the objective function, in this thesis we will be presenting another equivalent regularization algorithm: pre-train the model using autoencoders in order to obtain better initialization weights. We will analyze if the algorithm provides any advantage over other regularization methods and if it allows us to obtain significant results by itself or if it should be seen as a first step in the process of obtaining the final model.

La computer vision è uno dei temi caldi al giorno d’oggi quando si parla di intelligenza artificiale e copre una vasta gamma di problemi, dalla verifica dell’identità al riconoscimento di oggetti. Una delle difficoltà consiste nel rilevare attacchi di spoofing, quando un soggetto cerca di ingannare un sistema di riconoscimento facciale tramite utilizzo di immagini del volto della persona riconosciuta, per assicurarsi l’accesso e vantaggi illegittimi, come nel caso di pagamenti autorizzati con riconoscimento facciale, sblocco del telefono, check-in dei lavoratori. Quando i modelli di training si concentrano sulla risoluzione di questo tipo di problemi, una delle preoccupazioni principali è legata alla ridotta varietà dei dati a disposizione, che porta a problemi di generalizzazione. Alcuni degli approcci che cercano di risolvere simili problemi di overfitting includono tecniche di dropout, modifiche alla struttura del modello o l’aggiunta di qualche tipo di regolarizzazione. Mentre in generale si tende a introdurre un parametro di regolarizzazione nella funzione obiettivo, in questa tesi presenteremo un algoritmo di regolarizzazione equivalente con cui pre-addestriamo il modello usando gli autoencoder per ottenere valori iniziali migliori per i pesi. Analizzeremo i vantaggi che questo algoritmo offre rispetto ad altri metodi di regolarizzazione e discuteremo se da solo ci consenta di ottenere risultati significativi o se, invece, debba essere considerato come un primo passo nella costruzione del modello finale.

Use of autoencoders as a generalization method for anti-spoofing classification

WATMAN OUTON, TOMÁS ERNESTO
2019/2020

Abstract

Computer vision is one of the hot topics nowadays when talking about artificial intelligence, covering a wide range of problems under its domain, from document verification to object detection. One of these problems consists in detecting spoofing attacks, masquerading as a registered user in a face-recognition system, gaining illegitimate access and advantages, used in face-recognition payments, phone unlocking, workers checking –in… When training models focused on solving this kind of problems, one of the main concerns is the data we have to deal with due to its small variety, leading to generalization problems. Some of the main approaches that try to tackle these overfitting issues include dropout techniques, model variations or adding some kind of regularization. While in general the way of adding regularization is by introducing a regularization parameter in the objective function, in this thesis we will be presenting another equivalent regularization algorithm: pre-train the model using autoencoders in order to obtain better initialization weights. We will analyze if the algorithm provides any advantage over other regularization methods and if it allows us to obtain significant results by itself or if it should be seen as a first step in the process of obtaining the final model.
ING - Scuola di Ingegneria Industriale e dell'Informazione
24-lug-2020
2019/2020
La computer vision è uno dei temi caldi al giorno d’oggi quando si parla di intelligenza artificiale e copre una vasta gamma di problemi, dalla verifica dell’identità al riconoscimento di oggetti. Una delle difficoltà consiste nel rilevare attacchi di spoofing, quando un soggetto cerca di ingannare un sistema di riconoscimento facciale tramite utilizzo di immagini del volto della persona riconosciuta, per assicurarsi l’accesso e vantaggi illegittimi, come nel caso di pagamenti autorizzati con riconoscimento facciale, sblocco del telefono, check-in dei lavoratori. Quando i modelli di training si concentrano sulla risoluzione di questo tipo di problemi, una delle preoccupazioni principali è legata alla ridotta varietà dei dati a disposizione, che porta a problemi di generalizzazione. Alcuni degli approcci che cercano di risolvere simili problemi di overfitting includono tecniche di dropout, modifiche alla struttura del modello o l’aggiunta di qualche tipo di regolarizzazione. Mentre in generale si tende a introdurre un parametro di regolarizzazione nella funzione obiettivo, in questa tesi presenteremo un algoritmo di regolarizzazione equivalente con cui pre-addestriamo il modello usando gli autoencoder per ottenere valori iniziali migliori per i pesi. Analizzeremo i vantaggi che questo algoritmo offre rispetto ad altri metodi di regolarizzazione e discuteremo se da solo ci consenta di ottenere risultati significativi o se, invece, debba essere considerato come un primo passo nella costruzione del modello finale.
File allegati
File Dimensione Formato  
DS _Master_Thesis_WatmanTomas.pdf

accessibile in internet solo dagli utenti autorizzati

Dimensione 2.09 MB
Formato Adobe PDF
2.09 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/164650