Adaptive guidance via Meta-Reinforcement Learning : ARPOD for an under-actuated CubeSat

Biblioteche e Archivi
POLITesi - Archivio digitale delle tesi di laurea e di dottorato

The need for a solution of very complex space missions, aimed at providing global services on a large scale, has played a key role in the development of autonomous spacecrafts. Classical control techniques have been surpassed in terms of autonomy by artificial intelligence methods, such as machine learning. In particular, a promising technique known as Meta-Reinforcement learning is recently emerging as the strongest method to solve a multitude of problems. For space applications, it can be seen as a way through for solving complex control problems such as the guidance of a cluster of small satellites. This master thesis focuses on demonstrating the ability of Meta-Reinforcement learning algorithm to accomplish a safe planar Autonomous Rendezvous, Proximity Operation and Docking (ARPOD) manoeuvre with an under-actuated CubeSat from different starting points in a small region. Safety considerations and uncertainties on the dynamics rise the complexity of the problem under analysis. The promising future perspective of Meta-Reinforcement learning could enable even more complex missions, providing to mankind the possibility to explore space in an unprecedented way.

Negli ultimi anni, la necessità di risolvere missioni spaziali sempre più complesse, mirate a garantire servizi globali in larga scala nel settore delle telecomunicazioni, della navigazione satellitare o per scopi ingegneristici quali la rimozione di detriti spaziali, ha portato allo sviluppo di satelliti autonomi. L’utilizzo di metodi di Intelligenza Artificiale (AI) rappresenta una via alternativa e moderna alle tecniche di controllo classiche. Queste ultime, sebbene ben consolidate nel campo ingegneristico, soffrono di una minore autonomia decisionale e di una maggiore complessità nell’ implementazione rispetto a tecniche moderne come il machine learning. L'obiettivo di questo elaborato è di dimostrare come una tecnica di machine learning, nota come Meta-Reinforcement Learning, sia in grado di realizzare una manovra di Autonomous Rendezvous, Proximity Operation and Docking (ARPOD) con un CubeSat dotato di un basso numero di attuatori, prendendo in considerazione una serie di vincoli e di incertezze nella dinamica per garantire la sicurezza della missione e la robustezza della soluzione.

Adaptive guidance via Meta-Reinforcement Learning : ARPOD for an under-actuated CubeSat

CALABRÒ, GAETANO

2021/2022

Abstract

The need for a solution of very complex space missions, aimed at providing global services on a large scale, has played a key role in the development of autonomous spacecrafts. Classical control techniques have been surpassed in terms of autonomy by artificial intelligence methods, such as machine learning. In particular, a promising technique known as Meta-Reinforcement learning is recently emerging as the strongest method to solve a multitude of problems. For space applications, it can be seen as a way through for solving complex control problems such as the guidance of a cluster of small satellites. This master thesis focuses on demonstrating the ability of Meta-Reinforcement learning algorithm to accomplish a safe planar Autonomous Rendezvous, Proximity Operation and Docking (ARPOD) manoeuvre with an under-actuated CubeSat from different starting points in a small region. Safety considerations and uncertainties on the dynamics rise the complexity of the problem under analysis. The promising future perspective of Meta-Reinforcement learning could enable even more complex missions, providing to mankind the possibility to explore space in an unprecedented way.

Scheda breve

Scheda completa

	Relatore
	
				DI LIZIA, PIERLUIGI
			
	Correlatore/i
	
				MAESTRINI, MICHELE
			
	Scuola / Dip.
	
				ING  - Scuola di Ingegneria Industriale e dell'Informazione
			
	Data
	
				7-giu-2022
			
	Anno accademico
	
				2021/2022
			
	Abstract in italiano
	
				Negli ultimi anni, la necessità di risolvere missioni spaziali sempre più complesse, mirate a garantire servizi globali in larga scala nel settore delle telecomunicazioni, della navigazione satellitare o per scopi ingegneristici quali la rimozione di detriti spaziali, ha portato allo sviluppo di satelliti autonomi. L’utilizzo di metodi di Intelligenza Artificiale (AI) rappresenta una via alternativa e moderna alle tecniche di controllo classiche.  Queste ultime, sebbene ben consolidate nel campo ingegneristico, soffrono di una minore autonomia decisionale e di una maggiore complessità nell’ implementazione rispetto a tecniche moderne come il machine learning. 
L'obiettivo di questo elaborato è di dimostrare come una tecnica di machine learning, nota come Meta-Reinforcement Learning, sia in grado di realizzare una manovra di Autonomous Rendezvous, Proximity Operation and Docking (ARPOD) con un CubeSat dotato di un basso numero di attuatori, prendendo in considerazione una serie di vincoli e di incertezze nella dinamica per garantire la sicurezza della missione e la robustezza della soluzione.
			
	Appare nelle tipologie:
	
				Tesi di laurea Magistrale

File allegati

File	Dimensione	Formato
ARPOD_MetaRL_GaetanoCalabro.pdf accessibile in internet per tutti Descrizione: Master Thesis document Dimensione 20.08 MB Formato Adobe PDF Visualizza/Apri	20.08 MB	Adobe PDF	Visualizza/Apri
Executive_Summary_ARPOD_MetaRL_GC.pdf accessibile in internet per tutti Descrizione: Executive Summary document Dimensione 19.04 MB Formato Adobe PDF Visualizza/Apri	19.04 MB	Adobe PDF	Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/188963