This thesis investigates the optimization of robotic pouring tasks, focusing on achieving precise liquid levels while accounting for uncertainty of the model. The manipulation of liquids is essential in both industrial and domestic settings, yet presents challenges due to the unpredictable nature of fluid dynamics. Robots must not only perceive liquid levels but also predict how liquids will behave during complex operations like pouring, which is especially difficult due to the dynamics of the liquid. The work is divided into three main steps. First, we develop a perception system using computer vision techniques to accurately estimate liquid levels. The RGB images are processed using OpenCV, enabling the robot to detect and monitor the current level of the liquid. Second, a learning-based model using a Gaussian Process (GP) predicts the relationship between pouring actions (anglular rotation and durtion) and the resulting liquid level. Finally, the Gaussian Process model is integrated into a Monte Carlo Tree Search (MCTS) optimization algorithm, which is adapted to account for the epistemic uncertainty in the GP predictions when determining the optimal pouring strategy, minimizing the number of actions required. Three MCTS variants are evaluated: two that are uncertainty-aware and another that is uncertainty-unaware. Results demonstrate that the uncertainty-aware approaches significantly improve the robot's ability to reach the target liquid level with fewer movements, while maintaining a high success rate, even with very small training datasets (up to 5 points). The proposed methodology highlights the importance of combining learning-based approaches with uncertainty estimation and optimization strategies for enhancing the performance of robots in real-world liquid handling tasks.

Questa tesi tratta l'ottimizzazione di un operazione di versamento tramite un braccio robotico, concentrandosi sul raggiungimento di precisi livelli di liquido tenendo conto dell'incertezza del modello. La manipolazione dei liquidi è essenziale sia in ambito industriale che domestico, ma presenta molte sfide a causa della natura imprevedibile della dinamica dei fluidi. I robot non solo devono percepire i livelli di liquido, ma anche prevedere come il liquido si comporterà durante operazioni complesse come il versamento. Il lavoro è suddiviso in tre fasi principali. In primo luogo, è stato sviluppato un sistema di percezione utilizzando tecniche di computer vision per stimare accuratamente i livelli di liquido. Le immagini RGB vengono elaborate tramite OpenCV, consentendo al robot di rilevare e monitorare il livello attuale del liquido. In secondo luogo, un modello learn-based basato su Gaussian Process (GP) viene addestrato per ottenere la relazione tra i parametri di versamento (rotazione angolare e durata) e il livello di liquido risultante. Infine, il modello ottenuto dal GP viene integrato in un algoritmo di ottimizzazione basato su Monte Carlo Tree Search (MCTS), quest'ultimo modificato per tenere in considerazione dell'incertezza epistemica nelle previsioni del GP così da determinare la strategia ottimale di versamento, la quale mira a minimizzare il numero di azioni. Vengono valutate tre varianti di MCTS: due che tengono conto dell'incertezza e una che la ignora. I risultati dimostrano che gli approcci che tengono conto dell'incertezza migliorano significativamente la capacità del robot di raggiungere il livello di liquido voluto con meno movimenti, mantenendo un alto tasso di successo, anche con dataset di dimensioni ridotte (fino a 5 punti). La metodologia proposta evidenzia l'importanza di combinare approcci basati sull'apprendimento con strategie di ottimizzazione e tecniche per la stima dell'incertezza, cosi da migliorare le prestazioni dei robot in compiti reali di manipolazione dei liquidi.

Handling liquids with robots: uncertainty-aware planning algorithms for robust pouring operations

Odesco, Carlo
2023/2024

Abstract

This thesis investigates the optimization of robotic pouring tasks, focusing on achieving precise liquid levels while accounting for uncertainty of the model. The manipulation of liquids is essential in both industrial and domestic settings, yet presents challenges due to the unpredictable nature of fluid dynamics. Robots must not only perceive liquid levels but also predict how liquids will behave during complex operations like pouring, which is especially difficult due to the dynamics of the liquid. The work is divided into three main steps. First, we develop a perception system using computer vision techniques to accurately estimate liquid levels. The RGB images are processed using OpenCV, enabling the robot to detect and monitor the current level of the liquid. Second, a learning-based model using a Gaussian Process (GP) predicts the relationship between pouring actions (anglular rotation and durtion) and the resulting liquid level. Finally, the Gaussian Process model is integrated into a Monte Carlo Tree Search (MCTS) optimization algorithm, which is adapted to account for the epistemic uncertainty in the GP predictions when determining the optimal pouring strategy, minimizing the number of actions required. Three MCTS variants are evaluated: two that are uncertainty-aware and another that is uncertainty-unaware. Results demonstrate that the uncertainty-aware approaches significantly improve the robot's ability to reach the target liquid level with fewer movements, while maintaining a high success rate, even with very small training datasets (up to 5 points). The proposed methodology highlights the importance of combining learning-based approaches with uncertainty estimation and optimization strategies for enhancing the performance of robots in real-world liquid handling tasks.
ROCCO, PAOLO
ING - Scuola di Ingegneria Industriale e dell'Informazione
10-ott-2024
2023/2024
Questa tesi tratta l'ottimizzazione di un operazione di versamento tramite un braccio robotico, concentrandosi sul raggiungimento di precisi livelli di liquido tenendo conto dell'incertezza del modello. La manipolazione dei liquidi è essenziale sia in ambito industriale che domestico, ma presenta molte sfide a causa della natura imprevedibile della dinamica dei fluidi. I robot non solo devono percepire i livelli di liquido, ma anche prevedere come il liquido si comporterà durante operazioni complesse come il versamento. Il lavoro è suddiviso in tre fasi principali. In primo luogo, è stato sviluppato un sistema di percezione utilizzando tecniche di computer vision per stimare accuratamente i livelli di liquido. Le immagini RGB vengono elaborate tramite OpenCV, consentendo al robot di rilevare e monitorare il livello attuale del liquido. In secondo luogo, un modello learn-based basato su Gaussian Process (GP) viene addestrato per ottenere la relazione tra i parametri di versamento (rotazione angolare e durata) e il livello di liquido risultante. Infine, il modello ottenuto dal GP viene integrato in un algoritmo di ottimizzazione basato su Monte Carlo Tree Search (MCTS), quest'ultimo modificato per tenere in considerazione dell'incertezza epistemica nelle previsioni del GP così da determinare la strategia ottimale di versamento, la quale mira a minimizzare il numero di azioni. Vengono valutate tre varianti di MCTS: due che tengono conto dell'incertezza e una che la ignora. I risultati dimostrano che gli approcci che tengono conto dell'incertezza migliorano significativamente la capacità del robot di raggiungere il livello di liquido voluto con meno movimenti, mantenendo un alto tasso di successo, anche con dataset di dimensioni ridotte (fino a 5 punti). La metodologia proposta evidenzia l'importanza di combinare approcci basati sull'apprendimento con strategie di ottimizzazione e tecniche per la stima dell'incertezza, cosi da migliorare le prestazioni dei robot in compiti reali di manipolazione dei liquidi.
File allegati
File Dimensione Formato  
Thesis_Carlo_Odesco.pdf

accessibile in internet per tutti a partire dal 18/09/2025

Descrizione: Thesis
Dimensione 15.07 MB
Formato Adobe PDF
15.07 MB Adobe PDF   Visualizza/Apri
Executive_summary_Carlo_Odesco.pdf

accessibile in internet per tutti a partire dal 18/09/2025

Descrizione: Executive Summary
Dimensione 4.27 MB
Formato Adobe PDF
4.27 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/227587