Thanks to the availability of inexpensive sensors such as Microsoft Kinect and Asus Xtion, there has been a surge in the number of robotic applications using them. Of particular interest is their ability to calculate distances - using stereo geometry, these devices are able to make a depth map, thereby vastly simplifying the Computer Vision problem of triangulation and distance estimation from a pair of uncalibrated images. The range images obtained using the structured light cameras are often noisy and their range measurement techniques using stereo geometry present some limitations and inaccuracies. But given their low cost and ability to measure distances, they could also be used as a cheap but adequate laser scanner substitute. This thesis explores the scanning of an object with 360 degree views. In particular, we deal with the difficulty of aligning smooth (featureless) object without making any assumptions about the underlying nature of the object, such as its shape etc. The data acquisition is carried out swiftly, by means of two methods - rotating the scanner around the object and keeping the scanner fixed and rotating the object. We found the latter method much more convenient to segment the object of interest from the complete pointcloud by using spatial filtering method, but provided the minimum distance between the scanner and the object is maintained, our implementation can be used with either stream of data. Then the frames are analysed, the background noise is removed and the pointcloud is down-sampled and smoothed. For every overlapping consecutive pair in the dataset, an alignment is obtained. We mainly make use of Iterative Closest Point algorithm when necessary optimise it to obtain an accurate alignment. With each transformation, the global transformation is computed and finally a complete pointcloud is built successfully.

Grazie alla diffusione di sensori economici come il Microsoft Kinect e l'Asus Xtion, c'è stato un aumento del loro utilizzo in applicazioni di robotica. Particolarmente interessante è la loro capacità di calcolare le distanze: usando la geometria stereo, questi dispositivi possono creare una mappa di profondità. In questo modo viene enormemente semplificato il problema proprio della Computer Vision della triangolazione e della stima delle distanze partendo da una coppia di immagini non calibrate. Le immagini "range" ottenute utilizzando telecamere a luce strutturata sono spesso affette da rumore e le loro tecniche di misurazione del "range" utilizzando la geometria stereo presentano alcune limitazioni e inaccuratezze. Ma, considerato il loro basso costo e la loro capacità di misurare le distanze, potrebbero anche essere usate come un sostituto economico, ma adeguato, degli scanner laser. Questa tesi esplora la scansione di un oggetto con visione a 360 gradi. Nello specifico, approcciamo la difficoltà di allineamento di oggetti smooth (senza feature) senza fare alcuna assunzione sulla natura dell'oggetto in esame, come la sua forma, etc. L'acquisizione dei dati viene svolta rapidamente per mezzo di due metodi: la rotazione dello scanner attorno all'oggetto e la rotazione dell'oggetto lasciando lo scanner fisso. Quest'ultimo è stato valutato molto più conveniente per segmentare l'oggetto interessato a partire dal cloud di punti utilizzando un metodo di filtraggio spaziale, ma, se la distanza minima tra l'oggetto e lo scanner viene mantenuta, la nostra implementazione può essere usata con qualunque flusso di dati. In seguito i frame sono analizzati, il rumore di fondo viene rimosso e la cloud di punti viene decimata e sottoposta a operazini di smoothing. Si ottiene un allineamento per ogni coppia consecutiva sovrapposta nel dataset. Utilizziamo principalmente l'algoritmo di Iterative Closest Point quando è necessario ottimizzarlo per ottenere un allineamento accurato. Viene calcolata la trasformazione globale partendo da ogni singola trasformazione e infine un cloud di punti completo è ricostruito correttamente.

3D reconstruction of objects using a depth camera

BALASUBRAMANIAN, SARANYA
2012/2013

Abstract

Thanks to the availability of inexpensive sensors such as Microsoft Kinect and Asus Xtion, there has been a surge in the number of robotic applications using them. Of particular interest is their ability to calculate distances - using stereo geometry, these devices are able to make a depth map, thereby vastly simplifying the Computer Vision problem of triangulation and distance estimation from a pair of uncalibrated images. The range images obtained using the structured light cameras are often noisy and their range measurement techniques using stereo geometry present some limitations and inaccuracies. But given their low cost and ability to measure distances, they could also be used as a cheap but adequate laser scanner substitute. This thesis explores the scanning of an object with 360 degree views. In particular, we deal with the difficulty of aligning smooth (featureless) object without making any assumptions about the underlying nature of the object, such as its shape etc. The data acquisition is carried out swiftly, by means of two methods - rotating the scanner around the object and keeping the scanner fixed and rotating the object. We found the latter method much more convenient to segment the object of interest from the complete pointcloud by using spatial filtering method, but provided the minimum distance between the scanner and the object is maintained, our implementation can be used with either stream of data. Then the frames are analysed, the background noise is removed and the pointcloud is down-sampled and smoothed. For every overlapping consecutive pair in the dataset, an alignment is obtained. We mainly make use of Iterative Closest Point algorithm when necessary optimise it to obtain an accurate alignment. With each transformation, the global transformation is computed and finally a complete pointcloud is built successfully.
MATTEUCCI, MATTEO
ING - Scuola di Ingegneria Industriale e dell'Informazione
2-ott-2013
2012/2013
Grazie alla diffusione di sensori economici come il Microsoft Kinect e l'Asus Xtion, c'è stato un aumento del loro utilizzo in applicazioni di robotica. Particolarmente interessante è la loro capacità di calcolare le distanze: usando la geometria stereo, questi dispositivi possono creare una mappa di profondità. In questo modo viene enormemente semplificato il problema proprio della Computer Vision della triangolazione e della stima delle distanze partendo da una coppia di immagini non calibrate. Le immagini "range" ottenute utilizzando telecamere a luce strutturata sono spesso affette da rumore e le loro tecniche di misurazione del "range" utilizzando la geometria stereo presentano alcune limitazioni e inaccuratezze. Ma, considerato il loro basso costo e la loro capacità di misurare le distanze, potrebbero anche essere usate come un sostituto economico, ma adeguato, degli scanner laser. Questa tesi esplora la scansione di un oggetto con visione a 360 gradi. Nello specifico, approcciamo la difficoltà di allineamento di oggetti smooth (senza feature) senza fare alcuna assunzione sulla natura dell'oggetto in esame, come la sua forma, etc. L'acquisizione dei dati viene svolta rapidamente per mezzo di due metodi: la rotazione dello scanner attorno all'oggetto e la rotazione dell'oggetto lasciando lo scanner fisso. Quest'ultimo è stato valutato molto più conveniente per segmentare l'oggetto interessato a partire dal cloud di punti utilizzando un metodo di filtraggio spaziale, ma, se la distanza minima tra l'oggetto e lo scanner viene mantenuta, la nostra implementazione può essere usata con qualunque flusso di dati. In seguito i frame sono analizzati, il rumore di fondo viene rimosso e la cloud di punti viene decimata e sottoposta a operazini di smoothing. Si ottiene un allineamento per ogni coppia consecutiva sovrapposta nel dataset. Utilizziamo principalmente l'algoritmo di Iterative Closest Point quando è necessario ottimizzarlo per ottenere un allineamento accurato. Viene calcolata la trasformazione globale partendo da ogni singola trasformazione e infine un cloud di punti completo è ricostruito correttamente.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Tesi_SaranyaBalasubramanian.pdf

solo utenti autorizzati dal 19/09/2016

Descrizione: Thesis Text
Dimensione 1.81 MB
Formato Adobe PDF
1.81 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/82282