Pedestrian analysis is employed in a variety of fields, from security applications to pedestrian traffic analysis or other commercial purposes. To perform this operation, it is first necessary to perform pedestrian detection and then extract useful information. This work presents PAGE (Pedestrian Age and Gender Estimation), which combines detection and age and gender estimation in one lightweight pipeline. It exploits the YOLOX detector and different models to classify body and head images with low resolution. The experiments carried out show how the model can be considered a promising first step towards future developments in pedestrian analysis. The other contribution of this work is a series of tests aimed at improving the accuracy of an age estimation model that needs to classify an image into eight different age ranges. As the baseline model, MobileNet has been chosen due to its good tradeoff between accuracy and model size. Using a regressor or a classifier where each class is an age value has been proven to be significantly better than employing a classifier where each class is an age range, both in terms of performance and flexibility. Other tests showed how the input image resolution and the model size are essential factors when estimating the age of an individual.

L'analisi dei pedoni è utilizzata in ambiti molto diversi, da applicazioni di sicurezza all'analisi del traffico pedonale o per altri scopi commerciali. Per effettuare questa operazione è necessario in primo luogo rilevare i pedoni per poi estrarne delle informazioni utili. In questo progetto è presentato PAGE (Pedestrian Age and Gender Estimation), un semplice metodo che combina la rilevazione dei pedoni e la stima di genere ed età. PAGE sfrutta le rilevazioni di YOLOX e diversi modelli per classificare immagini di teste e corpi a figura intera a bassa risoluzione. Gli esperimenti effettuati hanno mostrato come questo metodo può essere considerato un promettente primo passo rispetto a futuri sviluppi sull'analisi dei pedoni. L'altro apporto di questo lavoro è rappresentato da degli esprimenti mirati a migliorare la precisione di un modello per la stima dell'età che deve classificare l'immagine secondo otto scaglioni di età. Come modello di base è stata scelta MobileNet, visto il suo buon compromesso fra dimensioni e precisione. Usare un regressore o un classificatore in cui ogni classe è un'età si è dimostrato meglio di utilizzare un classificatore dove ogni classe è uno scaglione di età, sia in termini di precisione che di flessibilità. Altri test hanno verificato come la risoluzione delle immagini e le dimensioni del modelli giochino un ruolo essenziale per ottenere delle stime più accurate dell'età di un individuo.

PAGE: advances in integrating pedestrian detection, age, and gender estimation

Foini, Davide
2022/2023

Abstract

Pedestrian analysis is employed in a variety of fields, from security applications to pedestrian traffic analysis or other commercial purposes. To perform this operation, it is first necessary to perform pedestrian detection and then extract useful information. This work presents PAGE (Pedestrian Age and Gender Estimation), which combines detection and age and gender estimation in one lightweight pipeline. It exploits the YOLOX detector and different models to classify body and head images with low resolution. The experiments carried out show how the model can be considered a promising first step towards future developments in pedestrian analysis. The other contribution of this work is a series of tests aimed at improving the accuracy of an age estimation model that needs to classify an image into eight different age ranges. As the baseline model, MobileNet has been chosen due to its good tradeoff between accuracy and model size. Using a regressor or a classifier where each class is an age value has been proven to be significantly better than employing a classifier where each class is an age range, both in terms of performance and flexibility. Other tests showed how the input image resolution and the model size are essential factors when estimating the age of an individual.
MENTASTI, SIMONE
ING - Scuola di Ingegneria Industriale e dell'Informazione
19-dic-2023
2022/2023
L'analisi dei pedoni è utilizzata in ambiti molto diversi, da applicazioni di sicurezza all'analisi del traffico pedonale o per altri scopi commerciali. Per effettuare questa operazione è necessario in primo luogo rilevare i pedoni per poi estrarne delle informazioni utili. In questo progetto è presentato PAGE (Pedestrian Age and Gender Estimation), un semplice metodo che combina la rilevazione dei pedoni e la stima di genere ed età. PAGE sfrutta le rilevazioni di YOLOX e diversi modelli per classificare immagini di teste e corpi a figura intera a bassa risoluzione. Gli esperimenti effettuati hanno mostrato come questo metodo può essere considerato un promettente primo passo rispetto a futuri sviluppi sull'analisi dei pedoni. L'altro apporto di questo lavoro è rappresentato da degli esprimenti mirati a migliorare la precisione di un modello per la stima dell'età che deve classificare l'immagine secondo otto scaglioni di età. Come modello di base è stata scelta MobileNet, visto il suo buon compromesso fra dimensioni e precisione. Usare un regressore o un classificatore in cui ogni classe è un'età si è dimostrato meglio di utilizzare un classificatore dove ogni classe è uno scaglione di età, sia in termini di precisione che di flessibilità. Altri test hanno verificato come la risoluzione delle immagini e le dimensioni del modelli giochino un ruolo essenziale per ottenere delle stime più accurate dell'età di un individuo.
File allegati
File Dimensione Formato  
2023_12_Foini_Tesi_01.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 20.34 MB
Formato Adobe PDF
20.34 MB Adobe PDF Visualizza/Apri
2023_12_Foini_Executive Summary_02.pdf

accessibile in internet per tutti

Descrizione: Testo dell'executive summary
Dimensione 1.07 MB
Formato Adobe PDF
1.07 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/214264