The rapid development of robotics and automation in industrial applications has increased the demand for robotic systems capable of functioning effectively in unstructured and dynamic environments. This thesis addresses the need for efficient 3D reconstruction in such environments by presenting an optimized Next-Best-View (NBV) framework, designed for use in industrial packaging and manipulation tasks where objects of varying geometry, size, and material must be quickly identified and handled. Traditional NBV methods often struggle in these contexts due to high computational costs and limited adaptability to complex object shapes and constrained workspaces. The proposed framework combines probabilistic spatial mapping with dynamic region of interest (ROI) selection, thereby enabling the system to prioritise regions of high information value, reduce redundant data acquisition and enhance computational efficiency. The implementation of the ROI is achieved through the use of OctoMap and DBSCAN clustering. In order to explore the space in an effective manner, the framework employs the Rapidly-Exploring Random Tree (RRT) algorithm, which enables a systematic exploration of the environment and ensures comprehensive coverage of the ROI. Furthermore, a low-resolution Time-of-Flight (ToF) sensor was selected in order to balance depth capture accuracy with real-time processing capabilities, thus making the framework suitable for high-speed industrial applications. Experimental evaluations were conducted using a UR5e robotic arm and VL53L8CX ToF sensor, simulating real-world industrial scenarios with various objects, including simple geometric shapes and complex, irregular items. Key performance metrics—such as surface reconstruction accuracy, computational time, bounding box dimensions, and redundant pose elimination—demonstrate the robustness and efficiency of the framework. The proposed NBV system achieves rapid, stable coverage while closely approximating object dimensions and reducing unnecessary exploration, making it suitable for practical deployment in industrial environments. This research contributes a flexible, computationally efficient solution for robotic perception, demonstrating adaptability across a range of object types and unstructured settings.

Il rapido sviluppo della robotica e dell'automazione nelle applicazioni industriali ha aumentato la domanda di sistemi robotici in grado di operare efficacemente in ambienti non strutturati e dinamici. Questa tesi risponde alla necessità di una ricostruzione 3D efficiente in tali contesti presentando un framework Next-Best-View (NBV) ottimizzato, progettato per applicazioni di packaging e manipolazione industriali, dove oggetti di geometrie, dimensioni e materiali variabili devono essere rapidamente identificati e gestiti. I metodi NBV tradizionali spesso incontrano difficoltà in questi contesti a causa degli alti costi computazionali e della limitata adattabilità a forme complesse e spazi di lavoro ristretti. Il framework proposto combina la mappatura spaziale probabilistica con la selezione dinamica della regione di interesse (ROI), consentendo al sistema di dare priorità alle aree di elevato valore informativo, ridurre l'acquisizione di dati ridondanti e migliorare l'efficienza computazionale. L'implementazione della ROI viene realizzata attraverso l'utilizzo di OctoMap e il clustering DBSCAN. Per esplorare lo spazio in modo efficace, il framework impiega l'algoritmo Rapidly-Exploring Random Tree (RRT), che permette un'esplorazione sistematica dell'ambiente e garantisce una copertura completa della ROI. Inoltre, è stato selezionato un sensore Time-of-Flight (ToF) a bassa risoluzione per bilanciare l'accuratezza della cattura della profondità con le capacità di elaborazione in tempo reale, rendendo così il framework adatto ad applicazioni industriali ad alta velocità. Le valutazioni sperimentali sono state condotte utilizzando un braccio robotico UR5e e il sensore ToF VL53L8CX, simulando scenari industriali reali con oggetti di diversa complessità, incluse forme geometriche semplici e oggetti complessi e irregolari. I principali parametri di performance—come l'accuratezza della ricostruzione della superficie, il tempo computazionale, le dimensioni della bounding box e l'eliminazione di pose ridondanti—dimostrano la robustezza e l'efficienza del framework. Il sistema NBV proposto raggiunge una copertura rapida e stabile, approssimando accuratamente le dimensioni degli oggetti e riducendo l'esplorazione non necessaria, rendendolo adatto per l’implementazione in ambienti industriali. Questa ricerca contribuisce a una soluzione flessibile ed efficiente per la percezione robotica, dimostrando adattabilità a una vasta gamma di oggetti e ambienti non strutturati.

A next-best-view framework for efficient 3D object reconstruction using low-resolution sensing

Castellano, Chiara
2023/2024

Abstract

The rapid development of robotics and automation in industrial applications has increased the demand for robotic systems capable of functioning effectively in unstructured and dynamic environments. This thesis addresses the need for efficient 3D reconstruction in such environments by presenting an optimized Next-Best-View (NBV) framework, designed for use in industrial packaging and manipulation tasks where objects of varying geometry, size, and material must be quickly identified and handled. Traditional NBV methods often struggle in these contexts due to high computational costs and limited adaptability to complex object shapes and constrained workspaces. The proposed framework combines probabilistic spatial mapping with dynamic region of interest (ROI) selection, thereby enabling the system to prioritise regions of high information value, reduce redundant data acquisition and enhance computational efficiency. The implementation of the ROI is achieved through the use of OctoMap and DBSCAN clustering. In order to explore the space in an effective manner, the framework employs the Rapidly-Exploring Random Tree (RRT) algorithm, which enables a systematic exploration of the environment and ensures comprehensive coverage of the ROI. Furthermore, a low-resolution Time-of-Flight (ToF) sensor was selected in order to balance depth capture accuracy with real-time processing capabilities, thus making the framework suitable for high-speed industrial applications. Experimental evaluations were conducted using a UR5e robotic arm and VL53L8CX ToF sensor, simulating real-world industrial scenarios with various objects, including simple geometric shapes and complex, irregular items. Key performance metrics—such as surface reconstruction accuracy, computational time, bounding box dimensions, and redundant pose elimination—demonstrate the robustness and efficiency of the framework. The proposed NBV system achieves rapid, stable coverage while closely approximating object dimensions and reducing unnecessary exploration, making it suitable for practical deployment in industrial environments. This research contributes a flexible, computationally efficient solution for robotic perception, demonstrating adaptability across a range of object types and unstructured settings.
PREZIOSA, GIUSEPPE FABIO
ZANCHETTIN, ANDREA MARIA
ING - Scuola di Ingegneria Industriale e dell'Informazione
11-dic-2024
2023/2024
Il rapido sviluppo della robotica e dell'automazione nelle applicazioni industriali ha aumentato la domanda di sistemi robotici in grado di operare efficacemente in ambienti non strutturati e dinamici. Questa tesi risponde alla necessità di una ricostruzione 3D efficiente in tali contesti presentando un framework Next-Best-View (NBV) ottimizzato, progettato per applicazioni di packaging e manipolazione industriali, dove oggetti di geometrie, dimensioni e materiali variabili devono essere rapidamente identificati e gestiti. I metodi NBV tradizionali spesso incontrano difficoltà in questi contesti a causa degli alti costi computazionali e della limitata adattabilità a forme complesse e spazi di lavoro ristretti. Il framework proposto combina la mappatura spaziale probabilistica con la selezione dinamica della regione di interesse (ROI), consentendo al sistema di dare priorità alle aree di elevato valore informativo, ridurre l'acquisizione di dati ridondanti e migliorare l'efficienza computazionale. L'implementazione della ROI viene realizzata attraverso l'utilizzo di OctoMap e il clustering DBSCAN. Per esplorare lo spazio in modo efficace, il framework impiega l'algoritmo Rapidly-Exploring Random Tree (RRT), che permette un'esplorazione sistematica dell'ambiente e garantisce una copertura completa della ROI. Inoltre, è stato selezionato un sensore Time-of-Flight (ToF) a bassa risoluzione per bilanciare l'accuratezza della cattura della profondità con le capacità di elaborazione in tempo reale, rendendo così il framework adatto ad applicazioni industriali ad alta velocità. Le valutazioni sperimentali sono state condotte utilizzando un braccio robotico UR5e e il sensore ToF VL53L8CX, simulando scenari industriali reali con oggetti di diversa complessità, incluse forme geometriche semplici e oggetti complessi e irregolari. I principali parametri di performance—come l'accuratezza della ricostruzione della superficie, il tempo computazionale, le dimensioni della bounding box e l'eliminazione di pose ridondanti—dimostrano la robustezza e l'efficienza del framework. Il sistema NBV proposto raggiunge una copertura rapida e stabile, approssimando accuratamente le dimensioni degli oggetti e riducendo l'esplorazione non necessaria, rendendolo adatto per l’implementazione in ambienti industriali. Questa ricerca contribuisce a una soluzione flessibile ed efficiente per la percezione robotica, dimostrando adattabilità a una vasta gamma di oggetti e ambienti non strutturati.
File allegati
File Dimensione Formato  
2024_12_Castellano_Tesi_01.pdf

non accessibile

Descrizione: Testo della tesi
Dimensione 14 MB
Formato Adobe PDF
14 MB Adobe PDF   Visualizza/Apri
2024_12_Castellano_Executive_Summary_02.pdf

non accessibile

Descrizione: Executive Summary
Dimensione 1.61 MB
Formato Adobe PDF
1.61 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/231193