Extraction of robust geometric descriptors from images is a problem that has taken much interest in the last thirty years, untill the advent of digital photography and consequently the birth and development of \textit{Computer Vision}. This thesis proposes a new method to find robust stereo-matching between images acquired with wide baseline, when the depth map associated to the 2D image is provided. In fact, using the depth map, you can adjust the image of the interest plane representing it in to a frontal view. This correction means that projective or affine distortions are reduced to similarity transforms making the image's parameters variable only for translation, rotation and scale. The proposed descriptor uses a hybrid system that applies the Mellin transform located at keypoints within the pre-adjusted image in order to build a characterization of the interest point that is invariant to similar transformations. Results show that this method is competitive with the state of the art, and even manages to give good results when the methods described in the literature fail.
L'estrazione di descrittori geometrici robusti dalle immagini è una problematica che ha avuto molto interesse negli ultimi trent'anni, dall'avvento della fotografia digitale e conseguentemente dalla nascita e lo sviluppo della \textit{Computer Vision}. La tesi propone un nuovo metodo per trovare robuste stereocorrispondenze fra immagini acquisite anche con ampia \textit{baseline} quando è disponibile la mappa di profondità associata all'immagine 2D. Utilizzando infatti la mappa di profondità è possibile rettificare l'immagine stessa in modo da porsi in visione frontale rispetto a un piano di interesse rappresentato in essa. Questa rettificazione fa si che siano abbattuti i gradi di libertà di una trasformazione prospettica, rendendo l'immagine variabile solo per parametri di traslazione, rotazione e scala. Il descrittore proposto usa un sistema ibrido che applica la trasformata di Mellin in punti chiave localizzati all'interno dell'immagine pre-rettificata allo scopo di costruire una caratterizzazione del punto di interesse che sia invariante a trasformazioni similari. I risultati mostrano come questo metodo sia competitivo con ciò che rappresenta lo stato dell'arte e addirittura riesca a dare buoni risultati laddove i metodi descritti in letteratura falliscono.
Sviluppo di descrittori geometrici robusti tramite l'impiego di mappe di profondità
ERRIGO, DARIO
2010/2011
Abstract
Extraction of robust geometric descriptors from images is a problem that has taken much interest in the last thirty years, untill the advent of digital photography and consequently the birth and development of \textit{Computer Vision}. This thesis proposes a new method to find robust stereo-matching between images acquired with wide baseline, when the depth map associated to the 2D image is provided. In fact, using the depth map, you can adjust the image of the interest plane representing it in to a frontal view. This correction means that projective or affine distortions are reduced to similarity transforms making the image's parameters variable only for translation, rotation and scale. The proposed descriptor uses a hybrid system that applies the Mellin transform located at keypoints within the pre-adjusted image in order to build a characterization of the interest point that is invariant to similar transformations. Results show that this method is competitive with the state of the art, and even manages to give good results when the methods described in the literature fail.File | Dimensione | Formato | |
---|---|---|---|
2011_10_Errigo.pdf
accessibile in internet per tutti
Descrizione: Testo della tesi
Dimensione
16.1 MB
Formato
Adobe PDF
|
16.1 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/24641