In the pursuit of enhancing legged robot mobility, stair navigation emerges as a significant challenge within urban contexts. While prior research has demonstrated the potential of Reinforcement Learning (RL) in designing robust blind controllers for rough terrains, the specific focus on staircase environments has remained limited. This study introduces a RL framework tailored to concurrently train a blind quadrupedal controller to traverse and explicitly estimate the stair geometry. By harnessing the inherent structural features of staircases, the developed controller can predict the next step and reduce collisions with consecutive step edges, optimizing locomotion efficiency. Experimental results demonstrate significant advancements in stair ascent performance, efficiently traversing stairs with slopes of up to 32° and step heights of up to 18 cm, achieving an estimation accuracy of 88% and a collision probability of 10% after the second step. The controller's capabilities extend beyond stair ascent, as evidenced by successful performance in stair descent and random command tracking on stairs. Furthermore, its adaptability is showcased in diverse challenging terrains, including various rough terrains, although additional experimental tests in these environments were not conducted. This work contributes in enhancing the existing blind controller research by offering insights into stair-specific scenarios.

Nella ricerca per migliorare la mobilità dei legged robot, la navigazione delle scale emerge come una sfida significativa all'interno degli ambienti urbani. Sebbene ricerche precedenti abbiano dimostrato il potenziale del Reinforcement Learning (RL) nella progettazione di controller robusti per terreni accidentati, il focus specifico sugli ambienti con scale è rimasto finora limitato. Questo studio introduce un framework di RL progettato per addestrare simultaneamente un controller quadrupede "cieco" a attraversare le scale e stimare esplicitamente la geometria degli scalini. Sfruttando le caratteristiche strutturali intrinseche delle scale, il controller sviluppato è in grado di prevedere il prossimo ostacolo e ridurre le collisioni con i bordi consecutivi dei gradini, ottimizzando così l'efficienza del movimento. I risultati sperimentali mostrano progressi significativi nelle prestazioni di salita delle scale, con il robot che affronta con successo scale con pendenze fino a 32° e alzata fino a 18 cm. Il sistema raggiunge un'accuratezza di stima dell'88% e una probabilità media di collisione di circa il 10% dopo il secondo gradino. Le capacità del controller non si limitano alla sola salita delle scale, come dimostrato da prestazioni di successo anche nella discesa delle scale e nel tracciamento di comandi casuali lungo le scale. Inoltre, la sua capacità di adattarsi è evidenziata in diversi terreni impegnativi, compresi terreni accidentati di vario tipo. Tuttavia, è importante notare che la valutazione delle prestazioni su ambienti diversi dalle scale è stata condotta principalmente in simulazione. Per confermare e validare appieno tali risultati, sarebbero necessari ulteriori esperimenti nella realtà. Questo lavoro contribuisce a migliorare la ricerca esistente sui blind controller, offrendo approfondimenti specifici sugli ambienti con le scale.

Learning blind stair-climbing with explicit stair parameters estimation for quadrupeds

STAFFOLANI, STEFANIA
2022/2023

Abstract

In the pursuit of enhancing legged robot mobility, stair navigation emerges as a significant challenge within urban contexts. While prior research has demonstrated the potential of Reinforcement Learning (RL) in designing robust blind controllers for rough terrains, the specific focus on staircase environments has remained limited. This study introduces a RL framework tailored to concurrently train a blind quadrupedal controller to traverse and explicitly estimate the stair geometry. By harnessing the inherent structural features of staircases, the developed controller can predict the next step and reduce collisions with consecutive step edges, optimizing locomotion efficiency. Experimental results demonstrate significant advancements in stair ascent performance, efficiently traversing stairs with slopes of up to 32° and step heights of up to 18 cm, achieving an estimation accuracy of 88% and a collision probability of 10% after the second step. The controller's capabilities extend beyond stair ascent, as evidenced by successful performance in stair descent and random command tracking on stairs. Furthermore, its adaptability is showcased in diverse challenging terrains, including various rough terrains, although additional experimental tests in these environments were not conducted. This work contributes in enhancing the existing blind controller research by offering insights into stair-specific scenarios.
ING - Scuola di Ingegneria Industriale e dell'Informazione
9-apr-2024
2022/2023
Nella ricerca per migliorare la mobilità dei legged robot, la navigazione delle scale emerge come una sfida significativa all'interno degli ambienti urbani. Sebbene ricerche precedenti abbiano dimostrato il potenziale del Reinforcement Learning (RL) nella progettazione di controller robusti per terreni accidentati, il focus specifico sugli ambienti con scale è rimasto finora limitato. Questo studio introduce un framework di RL progettato per addestrare simultaneamente un controller quadrupede "cieco" a attraversare le scale e stimare esplicitamente la geometria degli scalini. Sfruttando le caratteristiche strutturali intrinseche delle scale, il controller sviluppato è in grado di prevedere il prossimo ostacolo e ridurre le collisioni con i bordi consecutivi dei gradini, ottimizzando così l'efficienza del movimento. I risultati sperimentali mostrano progressi significativi nelle prestazioni di salita delle scale, con il robot che affronta con successo scale con pendenze fino a 32° e alzata fino a 18 cm. Il sistema raggiunge un'accuratezza di stima dell'88% e una probabilità media di collisione di circa il 10% dopo il secondo gradino. Le capacità del controller non si limitano alla sola salita delle scale, come dimostrato da prestazioni di successo anche nella discesa delle scale e nel tracciamento di comandi casuali lungo le scale. Inoltre, la sua capacità di adattarsi è evidenziata in diversi terreni impegnativi, compresi terreni accidentati di vario tipo. Tuttavia, è importante notare che la valutazione delle prestazioni su ambienti diversi dalle scale è stata condotta principalmente in simulazione. Per confermare e validare appieno tali risultati, sarebbero necessari ulteriori esperimenti nella realtà. Questo lavoro contribuisce a migliorare la ricerca esistente sui blind controller, offrendo approfondimenti specifici sugli ambienti con le scale.
File allegati
File Dimensione Formato  
2024_04_Staffolani_executive summary.pdf

non accessibile

Descrizione: Executive summary
Dimensione 1.9 MB
Formato Adobe PDF
1.9 MB Adobe PDF   Visualizza/Apri
2024_04_Staffolani.pdf

non accessibile

Descrizione: Testo tesi
Dimensione 6.1 MB
Formato Adobe PDF
6.1 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/218788