Sviluppo di descrittori geometrici robusti tramite l'impiego di mappe di profondità

Biblioteche e Archivi
POLITesi - Archivio digitale delle tesi di laurea e di dottorato

Extraction of robust geometric descriptors from images is a problem that has taken much interest in the last thirty years, untill the advent of digital photography and consequently the birth and development of \textit{Computer Vision}. This thesis proposes a new method to find robust stereo-matching between images acquired with wide baseline, when the depth map associated to the 2D image is provided. In fact, using the depth map, you can adjust the image of the interest plane representing it in to a frontal view. This correction means that projective or affine distortions are reduced to similarity transforms making the image's parameters variable only for translation, rotation and scale. The proposed descriptor uses a hybrid system that applies the Mellin transform located at keypoints within the pre-adjusted image in order to build a characterization of the interest point that is invariant to similar transformations. Results show that this method is competitive with the state of the art, and even manages to give good results when the methods described in the literature fail.

L'estrazione di descrittori geometrici robusti dalle immagini è una problematica che ha avuto molto interesse negli ultimi trent'anni, dall'avvento della fotografia digitale e conseguentemente dalla nascita e lo sviluppo della \textit{Computer Vision}. La tesi propone un nuovo metodo per trovare robuste stereocorrispondenze fra immagini acquisite anche con ampia \textit{baseline} quando è disponibile la mappa di profondità associata all'immagine 2D. Utilizzando infatti la mappa di profondità è possibile rettificare l'immagine stessa in modo da porsi in visione frontale rispetto a un piano di interesse rappresentato in essa. Questa rettificazione fa si che siano abbattuti i gradi di libertà di una trasformazione prospettica, rendendo l'immagine variabile solo per parametri di traslazione, rotazione e scala. Il descrittore proposto usa un sistema ibrido che applica la trasformata di Mellin in punti chiave localizzati all'interno dell'immagine pre-rettificata allo scopo di costruire una caratterizzazione del punto di interesse che sia invariante a trasformazioni similari. I risultati mostrano come questo metodo sia competitivo con ciò che rappresenta lo stato dell'arte e addirittura riesca a dare buoni risultati laddove i metodi descritti in letteratura falliscono.

Sviluppo di descrittori geometrici robusti tramite l'impiego di mappe di profondità

ERRIGO, DARIO

2010/2011

Abstract

Extraction of robust geometric descriptors from images is a problem that has taken much interest in the last thirty years, untill the advent of digital photography and consequently the birth and development of \textit{Computer Vision}. This thesis proposes a new method to find robust stereo-matching between images acquired with wide baseline, when the depth map associated to the 2D image is provided. In fact, using the depth map, you can adjust the image of the interest plane representing it in to a frontal view. This correction means that projective or affine distortions are reduced to similarity transforms making the image's parameters variable only for translation, rotation and scale. The proposed descriptor uses a hybrid system that applies the Mellin transform located at keypoints within the pre-adjusted image in order to build a characterization of the interest point that is invariant to similar transformations. Results show that this method is competitive with the state of the art, and even manages to give good results when the methods described in the literature fail.

Scheda breve

Scheda completa

	Relatore
	
				MARCON, MARCO
			
	Correlatore/i
	
				FRIGERIO, ELIANA
			
	Scuola / Dip.
	
				ING V - Scuola di Ingegneria dell'Informazione
			
	Data
	
				4-ott-2011
			
	Anno accademico
	
				2010/2011
			
	Abstract in italiano
	
				L'estrazione di descrittori geometrici robusti dalle immagini è una problematica che ha avuto molto interesse negli ultimi trent'anni, dall'avvento della fotografia digitale e conseguentemente dalla nascita e lo sviluppo della \textit{Computer Vision}. La tesi propone un nuovo metodo per trovare robuste stereocorrispondenze fra immagini acquisite anche con ampia \textit{baseline} quando è disponibile la mappa di profondità associata all'immagine 2D. Utilizzando infatti la mappa di profondità è possibile rettificare l'immagine stessa in modo da porsi in visione frontale rispetto a un piano di interesse rappresentato in essa. Questa rettificazione fa si che siano abbattuti i gradi di libertà di una trasformazione prospettica, rendendo l'immagine variabile solo per parametri di traslazione, rotazione e scala. Il descrittore proposto usa un sistema ibrido che applica la trasformata di Mellin in punti chiave localizzati all'interno dell'immagine pre-rettificata allo scopo di costruire una caratterizzazione del punto di interesse che sia invariante a trasformazioni similari.

I risultati mostrano come questo metodo sia competitivo con ciò che rappresenta lo stato dell'arte e addirittura riesca a dare buoni risultati laddove i metodi descritti in letteratura falliscono.
			
	Tipo di documento
	
				Tesi di laurea Magistrale
			
	Appare nelle tipologie:
	
				Tesi di laurea Magistrale

File allegati

File	Dimensione	Formato
2011_10_Errigo.pdf accessibile in internet per tutti Descrizione: Testo della tesi Dimensione 16.1 MB Formato Adobe PDF Visualizza/Apri	16.1 MB	Adobe PDF	Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/24641