Roboat is an autonomous surface vessel (ASV) for urban waterways, developed as a research project by the AMS Institute and the MIT. The platform can provide numerous functions to a city, such as dynamic infrastructure or autonomous garbage collection. The goal of this thesis project is to develop a learning-based controller for the Roboat platform with the goal of improving robustness and generalization. When subject to uncertainty in the model or external disturbances, the proposed controller should be able to track set trajectories with less tracking error than the current Nonlinear Model Predictive Controller (NMPC) used on the ASV. To achieve this, a simulation of the system dynamics was developed based on research done on the platform and previous literature. The simulation also includes the modelling of the necessary uncertainties and disturbances. In this simulation, a trajectory tracking agent was trained using the Proximal Policy Optimization algorithm which was then validated and compared to the current control strategy both in simulation and in the real world.
Roboat è un natante autonomo di superficie, o “Autonomous Surface Vessel” (ASV) per corsi d’acqua urbani, sviluppato come progetto di ricerca dall’istituto AMS e dal MIT. La piattaforma può fornire numerose funzioni a una città con corsi d’acqua, per esempio utilizzandolo come infrastruttura dinamica o per la raccolta dei rifiuti. Lo scopo di questa tesi è sviluppare un controllore di tipo learning-based per Roboat con l’obiettivo di migliorare la robustezza del sistema a fronte di incertezza di modello o di disturbi esterni. L’obiettivo del controllore è quello di seguire traiettorie date con un errore di inseguimento inferiore rispetto a quello garantito da un algoritmo di Nonlinear Model Predictive Controller (NMPC) già implementato sul sistema. Per raggiungere questo scopo, è stato sviluppato un simulatore dinamico basato sull’analisi del funzionamento di Roboat e facendo riferimento alla letteratura nel settore. Il simulatore realizzato include anche un modello dell’incertezza e dei principali disturbi che agiscono sul sistema. Successivamente, usando il simulatore, è stato creato un agente con l’algoritmo Proximal Policy Optimization. L’agente è stato quindi convalidato e confrontato con l’attuale strategia di controllo sia in simulazione che in esperimenti reali.
Learning trajectory tracking for an autonomous surface vehicle in urban waterways
Sikora, Toma
2021/2022
Abstract
Roboat is an autonomous surface vessel (ASV) for urban waterways, developed as a research project by the AMS Institute and the MIT. The platform can provide numerous functions to a city, such as dynamic infrastructure or autonomous garbage collection. The goal of this thesis project is to develop a learning-based controller for the Roboat platform with the goal of improving robustness and generalization. When subject to uncertainty in the model or external disturbances, the proposed controller should be able to track set trajectories with less tracking error than the current Nonlinear Model Predictive Controller (NMPC) used on the ASV. To achieve this, a simulation of the system dynamics was developed based on research done on the platform and previous literature. The simulation also includes the modelling of the necessary uncertainties and disturbances. In this simulation, a trajectory tracking agent was trained using the Proximal Policy Optimization algorithm which was then validated and compared to the current control strategy both in simulation and in the real world.File | Dimensione | Formato | |
---|---|---|---|
Scuola_di_Ingegneria_Industriale_e_dell_Informazione___Politecnico_di_Milano___Toma_Sikora_Thesis-16.pdf
accessibile in internet per tutti
Dimensione
4.56 MB
Formato
Adobe PDF
|
4.56 MB | Adobe PDF | Visualizza/Apri |
Executive_Summary___Scuola_di_Ingegneria_Industriale_e_dell_Informazione___Politecnico_di_Milano-3.pdf
accessibile in internet per tutti
Dimensione
971.62 kB
Formato
Adobe PDF
|
971.62 kB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/192041