Roboat is an autonomous surface vessel (ASV) for urban waterways, developed as a research project by the AMS Institute and the MIT. The platform can provide numerous functions to a city, such as dynamic infrastructure or autonomous garbage collection. The goal of this thesis project is to develop a learning-based controller for the Roboat platform with the goal of improving robustness and generalization. When subject to uncertainty in the model or external disturbances, the proposed controller should be able to track set trajectories with less tracking error than the current Nonlinear Model Predictive Controller (NMPC) used on the ASV. To achieve this, a simulation of the system dynamics was developed based on research done on the platform and previous literature. The simulation also includes the modelling of the necessary uncertainties and disturbances. In this simulation, a trajectory tracking agent was trained using the Proximal Policy Optimization algorithm which was then validated and compared to the current control strategy both in simulation and in the real world.

Roboat è un natante autonomo di superficie, o “Autonomous Surface Vessel” (ASV) per corsi d’acqua urbani, sviluppato come progetto di ricerca dall’istituto AMS e dal MIT. La piattaforma può fornire numerose funzioni a una città con corsi d’acqua, per esempio utilizzandolo come infrastruttura dinamica o per la raccolta dei rifiuti. Lo scopo di questa tesi è sviluppare un controllore di tipo learning-based per Roboat con l’obiettivo di migliorare la robustezza del sistema a fronte di incertezza di modello o di disturbi esterni. L’obiettivo del controllore è quello di seguire traiettorie date con un errore di inseguimento inferiore rispetto a quello garantito da un algoritmo di Nonlinear Model Predictive Controller (NMPC) già implementato sul sistema. Per raggiungere questo scopo, è stato sviluppato un simulatore dinamico basato sull’analisi del funzionamento di Roboat e facendo riferimento alla letteratura nel settore. Il simulatore realizzato include anche un modello dell’incertezza e dei principali disturbi che agiscono sul sistema. Successivamente, usando il simulatore, è stato creato un agente con l’algoritmo Proximal Policy Optimization. L’agente è stato quindi convalidato e confrontato con l’attuale strategia di controllo sia in simulazione che in esperimenti reali.

Learning trajectory tracking for an autonomous surface vehicle in urban waterways

Sikora, Toma
2021/2022

Abstract

Roboat is an autonomous surface vessel (ASV) for urban waterways, developed as a research project by the AMS Institute and the MIT. The platform can provide numerous functions to a city, such as dynamic infrastructure or autonomous garbage collection. The goal of this thesis project is to develop a learning-based controller for the Roboat platform with the goal of improving robustness and generalization. When subject to uncertainty in the model or external disturbances, the proposed controller should be able to track set trajectories with less tracking error than the current Nonlinear Model Predictive Controller (NMPC) used on the ASV. To achieve this, a simulation of the system dynamics was developed based on research done on the platform and previous literature. The simulation also includes the modelling of the necessary uncertainties and disturbances. In this simulation, a trajectory tracking agent was trained using the Proximal Policy Optimization algorithm which was then validated and compared to the current control strategy both in simulation and in the real world.
BONASSI, FABIO
ING - Scuola di Ingegneria Industriale e dell'Informazione
6-ott-2022
2021/2022
Roboat è un natante autonomo di superficie, o “Autonomous Surface Vessel” (ASV) per corsi d’acqua urbani, sviluppato come progetto di ricerca dall’istituto AMS e dal MIT. La piattaforma può fornire numerose funzioni a una città con corsi d’acqua, per esempio utilizzandolo come infrastruttura dinamica o per la raccolta dei rifiuti. Lo scopo di questa tesi è sviluppare un controllore di tipo learning-based per Roboat con l’obiettivo di migliorare la robustezza del sistema a fronte di incertezza di modello o di disturbi esterni. L’obiettivo del controllore è quello di seguire traiettorie date con un errore di inseguimento inferiore rispetto a quello garantito da un algoritmo di Nonlinear Model Predictive Controller (NMPC) già implementato sul sistema. Per raggiungere questo scopo, è stato sviluppato un simulatore dinamico basato sull’analisi del funzionamento di Roboat e facendo riferimento alla letteratura nel settore. Il simulatore realizzato include anche un modello dell’incertezza e dei principali disturbi che agiscono sul sistema. Successivamente, usando il simulatore, è stato creato un agente con l’algoritmo Proximal Policy Optimization. L’agente è stato quindi convalidato e confrontato con l’attuale strategia di controllo sia in simulazione che in esperimenti reali.
File allegati
File Dimensione Formato  
Scuola_di_Ingegneria_Industriale_e_dell_Informazione___Politecnico_di_Milano___Toma_Sikora_Thesis-16.pdf

accessibile in internet per tutti

Dimensione 4.56 MB
Formato Adobe PDF
4.56 MB Adobe PDF Visualizza/Apri
Executive_Summary___Scuola_di_Ingegneria_Industriale_e_dell_Informazione___Politecnico_di_Milano-3.pdf

accessibile in internet per tutti

Dimensione 971.62 kB
Formato Adobe PDF
971.62 kB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/192041