Learning trajectory tracking for an autonomous surface vehicle in urban waterways

Biblioteche e Archivi
POLITesi - Archivio digitale delle tesi di laurea e di dottorato

Roboat is an autonomous surface vessel (ASV) for urban waterways, developed as a research project by the AMS Institute and the MIT. The platform can provide numerous functions to a city, such as dynamic infrastructure or autonomous garbage collection. The goal of this thesis project is to develop a learning-based controller for the Roboat platform with the goal of improving robustness and generalization. When subject to uncertainty in the model or external disturbances, the proposed controller should be able to track set trajectories with less tracking error than the current Nonlinear Model Predictive Controller (NMPC) used on the ASV. To achieve this, a simulation of the system dynamics was developed based on research done on the platform and previous literature. The simulation also includes the modelling of the necessary uncertainties and disturbances. In this simulation, a trajectory tracking agent was trained using the Proximal Policy Optimization algorithm which was then validated and compared to the current control strategy both in simulation and in the real world.

Roboat è un natante autonomo di superficie, o “Autonomous Surface Vessel” (ASV) per corsi d’acqua urbani, sviluppato come progetto di ricerca dall’istituto AMS e dal MIT. La piattaforma può fornire numerose funzioni a una città con corsi d’acqua, per esempio utilizzandolo come infrastruttura dinamica o per la raccolta dei rifiuti. Lo scopo di questa tesi è sviluppare un controllore di tipo learning-based per Roboat con l’obiettivo di migliorare la robustezza del sistema a fronte di incertezza di modello o di disturbi esterni. L’obiettivo del controllore è quello di seguire traiettorie date con un errore di inseguimento inferiore rispetto a quello garantito da un algoritmo di Nonlinear Model Predictive Controller (NMPC) già implementato sul sistema. Per raggiungere questo scopo, è stato sviluppato un simulatore dinamico basato sull’analisi del funzionamento di Roboat e facendo riferimento alla letteratura nel settore. Il simulatore realizzato include anche un modello dell’incertezza e dei principali disturbi che agiscono sul sistema. Successivamente, usando il simulatore, è stato creato un agente con l’algoritmo Proximal Policy Optimization. L’agente è stato quindi convalidato e confrontato con l’attuale strategia di controllo sia in simulazione che in esperimenti reali.

Learning trajectory tracking for an autonomous surface vehicle in urban waterways

Sikora, Toma

2021/2022

Abstract

Roboat is an autonomous surface vessel (ASV) for urban waterways, developed as a research project by the AMS Institute and the MIT. The platform can provide numerous functions to a city, such as dynamic infrastructure or autonomous garbage collection. The goal of this thesis project is to develop a learning-based controller for the Roboat platform with the goal of improving robustness and generalization. When subject to uncertainty in the model or external disturbances, the proposed controller should be able to track set trajectories with less tracking error than the current Nonlinear Model Predictive Controller (NMPC) used on the ASV. To achieve this, a simulation of the system dynamics was developed based on research done on the platform and previous literature. The simulation also includes the modelling of the necessary uncertainties and disturbances. In this simulation, a trajectory tracking agent was trained using the Proximal Policy Optimization algorithm which was then validated and compared to the current control strategy both in simulation and in the real world.

Scheda breve

Scheda completa

	Relatore
	
			SCATTOLINI, RICCARDO
		
	Correlatore/i
	
			BONASSI, FABIO
		
	Scuola / Dip.
	
			ING  - Scuola di Ingegneria Industriale e dell'Informazione
		
	Data
	
			6-ott-2022
		
	Anno accademico
	
			2021/2022
		
	Abstract in italiano
	
			Roboat è un natante autonomo di superficie, o “Autonomous Surface Vessel” (ASV) per
corsi d’acqua urbani, sviluppato come progetto di ricerca dall’istituto AMS e dal MIT.
La piattaforma può fornire numerose funzioni a una città con corsi d’acqua, per esempio
utilizzandolo come infrastruttura dinamica o per la raccolta dei rifiuti.
Lo scopo di questa tesi è sviluppare un controllore di tipo learning-based per Roboat con
l’obiettivo di migliorare la robustezza del sistema a fronte di incertezza di modello o di
disturbi esterni. L’obiettivo del controllore è quello di seguire traiettorie date con un errore
di inseguimento inferiore rispetto a quello garantito da un algoritmo di Nonlinear Model
Predictive Controller (NMPC) già implementato sul sistema. Per raggiungere questo
scopo, è stato sviluppato un simulatore dinamico basato sull’analisi del funzionamento di
Roboat e facendo riferimento alla letteratura nel settore. Il simulatore realizzato include
anche un modello dell’incertezza e dei principali disturbi che agiscono sul sistema.
Successivamente, usando il simulatore, è stato creato un agente con l’algoritmo Proximal
Policy Optimization. L’agente è stato quindi convalidato e confrontato con l’attuale
strategia di controllo sia in simulazione che in esperimenti reali.
		
	Appare nelle tipologie:
	
			Tesi di laurea Magistrale

File allegati

File	Dimensione	Formato
Scuola_di_Ingegneria_Industriale_e_dell_Informazione___Politecnico_di_Milano___Toma_Sikora_Thesis-16.pdf accessibile in internet per tutti Dimensione 4.56 MB Formato Adobe PDF Visualizza/Apri	4.56 MB	Adobe PDF	Visualizza/Apri
Executive_Summary___Scuola_di_Ingegneria_Industriale_e_dell_Informazione___Politecnico_di_Milano-3.pdf accessibile in internet per tutti Dimensione 971.62 kB Formato Adobe PDF Visualizza/Apri	971.62 kB	Adobe PDF	Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/192041