Finding correspondences between different images is very important in the field of artificial vision, especially in applications such as virtual reality, 3D reconstruction, localization and tracking. The most effective approach when images are obtained from very different points of view is to seek independently in each picture some salient regions (also called keypoints), and then build significant descriptors for these regions, such that we can compare and recognize corresponding regions between considered images. This goal can be achieved in many ways. In this thesis we have designed a new descriptor that tries to mimic human visual system and its properties, and in particular foveation. When we gaze a scene, our visual acuity is maximum at the fixation point (imaged by the fovea, in the center of the human retina) and decreases rapidly towards the periphery of the visual field. This phenomenon is called foveation, and we can introduce it in the field of artificial vision through the construction of appropriate blur kernels that reproduce its characteristics, simply by increasing the standard deviation when the distance from the fixation point increases. Characteristics of the human visual system like foveation are somehow already integrated in artificial vision in the field of descriptors, however, only in a superficial way. The purpose of this thesis is to introduce the characteristics of human vision in the field of artificial vision. We discuss the introduction of foveation properties, in particular the radial orientation preference, through the use of specific feoveation kernel, in the construction of a specific family of descriptors, called binary descriptors because of their particular structure (a string of bits). We will discuss different ways to introduce these properties. We will present the characteristics of descriptors and how the use of foveation can be integrated in creation process of these descriptors, in addition to preforming a comparison with modern techonologies used in their construction.
Trovare corrispondenze tra diverse immagini è di massima importanza nel campo della visione artificiale, specialmente in applicazioni come la realtà virtuale, la ricostruzione 3D, la localizzazione e il tracking. Il miglior modo per operare quando le immagini sono ottenute da punti di vista molto diversi tra loro consiste nel cercare indipendentemente in ciascuna immagine delle regioni salienti (note anche come punti chiave) e poi costruire per esse dei descrittori significativi che permettano il confronto e il riconoscimento di regioni corrispondenti tra le immagini considerate. Tale obiettivo può essere ottenuto in svariati modi e nelle ricerche degli ultimi anni si è cercato di focalizzarsi sull’imitazione del sistema visivo umano e delle sue proprietà come ad esempio la foveazione. Quando osserviamo una scena, la nostra acutezza visiva è massima nel punto di fissazione (localizzato nella fovea della retina umana) e diminuisce rapidamente verso la periferia del nostro campo visivo. Questo comportamento è chiamato foveazione ed è possibile introdurlo nel campo della visione artificiale tramite la costruzione di appositi kernel di sfocatura che ne imitano le caratteristiche semplicemente aumentando la deviazione standard all’aumentare della distanza dal punto di fissazione. Le caratteristiche del sistema visivo umano come la foveazione vengono quindi integrate nella visione artificiale nel campo dei descrittori, anche se solo superficialmente. Lo scopo della nostra tesi è quello di introdurre queste caratteristiche della visione umana nel campo della visione artificiale. Discuteremo l’introduzione delle proprietà della foveazione, in particolare la preferenza radiale, tramite appositi kernel di sfocatura, nella costruzione di una particolare famiglia di descrittori detti binari a causa della loro particolare struttura (una stringa di bit). Saranno discusse diverse modalità per introdurre queste proprietà. Presenteremo le diverse caratteristiche dei descrittori e come l’uso della foveazione può essere integrato nel processo di creazione di questi, oltre ad eseguire un confronto con le moderne tecniche utilizzate nella loro costruzione.
Introduzione della preferenza radiale nei descrittori binari
FUMAGALLI, LORENZO;GUZLA, LUCA
2018/2019
Abstract
Finding correspondences between different images is very important in the field of artificial vision, especially in applications such as virtual reality, 3D reconstruction, localization and tracking. The most effective approach when images are obtained from very different points of view is to seek independently in each picture some salient regions (also called keypoints), and then build significant descriptors for these regions, such that we can compare and recognize corresponding regions between considered images. This goal can be achieved in many ways. In this thesis we have designed a new descriptor that tries to mimic human visual system and its properties, and in particular foveation. When we gaze a scene, our visual acuity is maximum at the fixation point (imaged by the fovea, in the center of the human retina) and decreases rapidly towards the periphery of the visual field. This phenomenon is called foveation, and we can introduce it in the field of artificial vision through the construction of appropriate blur kernels that reproduce its characteristics, simply by increasing the standard deviation when the distance from the fixation point increases. Characteristics of the human visual system like foveation are somehow already integrated in artificial vision in the field of descriptors, however, only in a superficial way. The purpose of this thesis is to introduce the characteristics of human vision in the field of artificial vision. We discuss the introduction of foveation properties, in particular the radial orientation preference, through the use of specific feoveation kernel, in the construction of a specific family of descriptors, called binary descriptors because of their particular structure (a string of bits). We will discuss different ways to introduce these properties. We will present the characteristics of descriptors and how the use of foveation can be integrated in creation process of these descriptors, in addition to preforming a comparison with modern techonologies used in their construction.File | Dimensione | Formato | |
---|---|---|---|
2020_04_Fumagalli_Guzla.pdf
accessibile in internet per tutti
Descrizione: Thesis text
Dimensione
1.98 MB
Formato
Adobe PDF
|
1.98 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/153150