Face recognition represents an open challenge in the field of Computer Vision. The purpose of this project is to find a method that does not rely on a large number of training samples for classification. Indeed, under specific conditions, obtaining many data may be too expensive or not possible. Some examples of situations in which large-scale data may be difficult to retrieve are Signatures Verification, Industrial Defects Detection or Face Recognition. Due to its availability to the main public through mobile devices or laptops, Face Recognition in particular has been the focus of the development of many techniques whose aim is to improve security and efficiency, while trying to reduce the amount of data needed to have a robust model. A valid approach consists in learning an embedding of a face features such that a picture containing the same face is as close as possible to the previously found embedding. In this way, the model can verify the identity of a person by computing the distance between different features embeddings. This work shows how methods like Few-shot Learning can obtain good results in these settings, without the need of a large dataset, and how such approach can be also applied in a different environment, like Industrial Defects Detection, where a large amount of data is not always available.

Il riconoscimento facciale rappresenta una sfida aperta nel campo della Computer Vision. Lo scopo di questo progetto è trovare un metodo che non faccia affidamento su un vasto numero di campioni per il training di un classificatore. Infatti, in situazioni specifiche, raccogliere molti dati potrebbe essere troppo costoso o impossibile. Alcuni esempi sono la verifica di una firma, l’identificazione di difetti di fabbrica o il riconoscimento facciale. Data la sua disponibilità al pubblico tramite smartphone e laptop, il riconoscimento facciale in particolare è stato il focus dello sviluppo di molte tecniche che hanno il compito di migliorarne la sicurezza e l’efficienza, cercando al tempo stesso di ridurre il quantitativo di dati necessari per avere un modello robusto. Un approccio valido consiste nel trovare un embedding delle caratteristiche di un volto tale per cui un’immagine contenente la medesima persona sia il più vicino possibile agli embedding trovati in precedenza. Questo lavoro intende mostrare che metodi come il Few-shot Learning possono ottenere dei buoni risultati in queste condizioni, senza il bisogno di un ampio dataset, e che quest’approccio può anche essere applicato in altri ambienti, come l’identificazione di difetti di fabbrica, in cui un grande quantitativo di dati non è sempre disponibile.

A few-shot learning approach for face recognition

RIZZO, ALESSANDRO
2018/2019

Abstract

Face recognition represents an open challenge in the field of Computer Vision. The purpose of this project is to find a method that does not rely on a large number of training samples for classification. Indeed, under specific conditions, obtaining many data may be too expensive or not possible. Some examples of situations in which large-scale data may be difficult to retrieve are Signatures Verification, Industrial Defects Detection or Face Recognition. Due to its availability to the main public through mobile devices or laptops, Face Recognition in particular has been the focus of the development of many techniques whose aim is to improve security and efficiency, while trying to reduce the amount of data needed to have a robust model. A valid approach consists in learning an embedding of a face features such that a picture containing the same face is as close as possible to the previously found embedding. In this way, the model can verify the identity of a person by computing the distance between different features embeddings. This work shows how methods like Few-shot Learning can obtain good results in these settings, without the need of a large dataset, and how such approach can be also applied in a different environment, like Industrial Defects Detection, where a large amount of data is not always available.
CRIVELLARO, ALBERTO
ING - Scuola di Ingegneria Industriale e dell'Informazione
29-apr-2020
2018/2019
Il riconoscimento facciale rappresenta una sfida aperta nel campo della Computer Vision. Lo scopo di questo progetto è trovare un metodo che non faccia affidamento su un vasto numero di campioni per il training di un classificatore. Infatti, in situazioni specifiche, raccogliere molti dati potrebbe essere troppo costoso o impossibile. Alcuni esempi sono la verifica di una firma, l’identificazione di difetti di fabbrica o il riconoscimento facciale. Data la sua disponibilità al pubblico tramite smartphone e laptop, il riconoscimento facciale in particolare è stato il focus dello sviluppo di molte tecniche che hanno il compito di migliorarne la sicurezza e l’efficienza, cercando al tempo stesso di ridurre il quantitativo di dati necessari per avere un modello robusto. Un approccio valido consiste nel trovare un embedding delle caratteristiche di un volto tale per cui un’immagine contenente la medesima persona sia il più vicino possibile agli embedding trovati in precedenza. Questo lavoro intende mostrare che metodi come il Few-shot Learning possono ottenere dei buoni risultati in queste condizioni, senza il bisogno di un ampio dataset, e che quest’approccio può anche essere applicato in altri ambienti, come l’identificazione di difetti di fabbrica, in cui un grande quantitativo di dati non è sempre disponibile.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2020_04_Rizzo.pdf

non accessibile

Descrizione: Testo della tesi
Dimensione 2.73 MB
Formato Adobe PDF
2.73 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/153031