With the advent of smart cars and even driverless cars, the importance of intelligent driving system has been rapidly growing. Accordingly, driver’s vision has become one of the most popular issues and especially detecting some obstacles including pedestrians and other vehicles on the road are at the center of the vision problem in order to prevent accidents. However, persons and pedestrians are not rigid and their appearance changes greatly depending on the body articulation or pose. The variety of textures and colors in clothing and accessories adds further difficulties. Therefore, defining a robust feature set is a fundamental task to distinguish pedestrian from other objects inside an image. In this thesis we use Histogram of Oriented Gradient (HOG) features, one of the most powerful methods for image descriptor that has been cited many times. Moreover, in the detection part of the system, we use the popular technique known as sliding window approach. In this task, images are scanned using learned templates. These templates that represents a single HOG filter of the pedestrian are evaluated at all location of an image using fast convolution algorithm. This type of search is powerful but makes it challenging to learn the filters. This is due to the fact that learning algorithms require high number of examples that makes training with all the available data impractical. To address this problem the major goal of this thesis is not only to understand how different training algorithms can work on the detection problem but also to propose a learning algorithm that works well even when only positive samples are used and thus reduce the memory and training time significantly.

Con l’introduzione di auto intelligenti e con guida automatica, l’importanza di sistemi di guida intelligenti è cresciuta rapidamente. Allo stesso modo, il campo di vista del guidatore è diventato uno dei maggiori problemi e in particolare la detezione di alcuni ostacoli come pedoni e altri veicoli sulla strada è di particolare importanza per la prevenzione di incidenti. Persone e pedoni tuttavia non sono oggetti rigidi e il loro aspetto cambia drammaticamente in base alla struttura del corpo e alla posa. La varietá di colori e pattern nei vestiti e negli accessori aggiunge ulteriori difficoltá. Definire quindi un insieme di feature robusto è un passo fondamentale nella distinzione di pedoni da altri oggetti in un’immagine. In questa tesi usiamo gli Histogram of Oriented Gradients (HOG), uno dei metodi piú efficaci per l’estrazione di descrittori da un’immagine e frequentemente citato in letteratura. Nella parte di detezione del sistema inoltre usiamo il metodo, comunemente usato, delle sliding window. In questo metodo le immagini sono analizzate usando template appresi. Questi template rappresentano un singolo filtro HOG del pedone e sono valutati in tutte le posizioni possibili dell’immagine usando algoritmi efficienti per il calcolo della convoluzione. Questo tipo di ricerca è molto efficace ma rende difficile apprendere i filtri, poiché l’algoritmo di apprendimento richiede un gran numero di esempi che rende l’apprendimento usando tutti gli esempi disponibili impraticabile. Per affrontare questo problema il principale obiettivo di questa tesi è non solo quello di capire come differenti algoritmi di apprendimento possono funzionare nel problema di detezione, ma anche di proporre un algoritmo di apprendimento che puo’ funzionare anche quando solo gli esempi positivi sono usati, riducendo quindi significativamente la memoria e il tempo di apprendimento.

Implementation and analysis of a novel object recognition system based only on positive samples training

KARIMI, PEGAH
2013/2014

Abstract

With the advent of smart cars and even driverless cars, the importance of intelligent driving system has been rapidly growing. Accordingly, driver’s vision has become one of the most popular issues and especially detecting some obstacles including pedestrians and other vehicles on the road are at the center of the vision problem in order to prevent accidents. However, persons and pedestrians are not rigid and their appearance changes greatly depending on the body articulation or pose. The variety of textures and colors in clothing and accessories adds further difficulties. Therefore, defining a robust feature set is a fundamental task to distinguish pedestrian from other objects inside an image. In this thesis we use Histogram of Oriented Gradient (HOG) features, one of the most powerful methods for image descriptor that has been cited many times. Moreover, in the detection part of the system, we use the popular technique known as sliding window approach. In this task, images are scanned using learned templates. These templates that represents a single HOG filter of the pedestrian are evaluated at all location of an image using fast convolution algorithm. This type of search is powerful but makes it challenging to learn the filters. This is due to the fact that learning algorithms require high number of examples that makes training with all the available data impractical. To address this problem the major goal of this thesis is not only to understand how different training algorithms can work on the detection problem but also to propose a learning algorithm that works well even when only positive samples are used and thus reduce the memory and training time significantly.
PLEBANI, EMANUELE
ING - Scuola di Ingegneria Industriale e dell'Informazione
29-apr-2015
2013/2014
Con l’introduzione di auto intelligenti e con guida automatica, l’importanza di sistemi di guida intelligenti è cresciuta rapidamente. Allo stesso modo, il campo di vista del guidatore è diventato uno dei maggiori problemi e in particolare la detezione di alcuni ostacoli come pedoni e altri veicoli sulla strada è di particolare importanza per la prevenzione di incidenti. Persone e pedoni tuttavia non sono oggetti rigidi e il loro aspetto cambia drammaticamente in base alla struttura del corpo e alla posa. La varietá di colori e pattern nei vestiti e negli accessori aggiunge ulteriori difficoltá. Definire quindi un insieme di feature robusto è un passo fondamentale nella distinzione di pedoni da altri oggetti in un’immagine. In questa tesi usiamo gli Histogram of Oriented Gradients (HOG), uno dei metodi piú efficaci per l’estrazione di descrittori da un’immagine e frequentemente citato in letteratura. Nella parte di detezione del sistema inoltre usiamo il metodo, comunemente usato, delle sliding window. In questo metodo le immagini sono analizzate usando template appresi. Questi template rappresentano un singolo filtro HOG del pedone e sono valutati in tutte le posizioni possibili dell’immagine usando algoritmi efficienti per il calcolo della convoluzione. Questo tipo di ricerca è molto efficace ma rende difficile apprendere i filtri, poiché l’algoritmo di apprendimento richiede un gran numero di esempi che rende l’apprendimento usando tutti gli esempi disponibili impraticabile. Per affrontare questo problema il principale obiettivo di questa tesi è non solo quello di capire come differenti algoritmi di apprendimento possono funzionare nel problema di detezione, ma anche di proporre un algoritmo di apprendimento che puo’ funzionare anche quando solo gli esempi positivi sono usati, riducendo quindi significativamente la memoria e il tempo di apprendimento.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Master-Thesis.pdf

accessibile in internet per tutti

Descrizione: Thesis text
Dimensione 16.84 MB
Formato Adobe PDF
16.84 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/106621