A dagger approach for supervised imitation learning applied to autonomous lunar landing

Thanks to the exponential development of the computer technology and computational power during the recent years, more and more interest is dedicated to Machine Learning. This branch of Artificial Intelligence has proved to be extremely powerful and for this reason has found wide applications in countless fields like computer vision, robotics, search engines, finance, medicine, just to name a few. It is natural that also the space field is interested by Machine Learning, which is very promising in the perspective of performing difficult tasks autonomously and in real-time. The following work applies Machine Learning, in particular supervised imitation learning techniques, to implement a control feedback loop for autonomous optimal lunar landing. Supervised imitation learning for optimal landing has already been subject of a few studies, but none of them considered the fact that sequential prediction problems, where future observations depend on previous predictions, violate the independent-and-identically-distributed assumption commonly used in statistical learning, and this often leads to poor performances both in theory and practice. The solution proposed in this work to such problem is the systematic application of the DAgger approach, which is supposed to increase the performances of the Machine Learning model at prediction time. The landing problem is studied for energy optimal and fuel optimal landing, both in 1D and 3D cases. Two different Machine Learning models, which are Deep Neural Network and Extreme Learning Machine, are used and compared.

Grazie all’esponenziale sviluppo dei recenti anni della tecnologia informatica e della potenza computazionale, sempre pi´u interesse viene dedicato al Machine Learning. Questa branca dell’Intelligenza Artificiale ha dimostrato di essere uno strumento estremamente potente, e per questa ragione ha trovato larghe applicazioni in innumerevoli campi come la visione artificiale, robotica, motori di ricerca, finanza, medicina, solo per citarne alcuni. ´E naturale che anche il settore spaziale sia interessato dal Machine Learning, che ´e molto promettente nell’ottica di perfmettere l’esecuzione autonoma e in tempo reale di compiti complessi. Il seguente lavoro applica il Machine Learning, in particolare tecniche di supervised imitation learning, per implementare un sistema di controllo in feedback per un atterraggio autonomo ottimo lunare. Tecniche di supervised imitation learning per atterraggio ottimi sono gi´a state argomento di alcuni studi, ma nessno di questi ha considerato il fatto che problemi di predizione sequenziale, dove le osservazioni future dipendono dalle predizioni precedenti, violano l’assunzione di variabili indipendenti e identicamente distribuite che viene spesso presa nel Machine Learning, e questo spesso inficia le prestazioni sia in teoria che in pratica. La soluzione proposta in questo lavoro a tale problema ´e l’applicazione sistematica della tecnica del DAgger, il cui obiettivo ´e incrementare le prestazioni del modello di Machine Learning al momento della simulazione. Il problema di atterraggio ´e affrontato per il caso di energy optimal e fuel optimal, entrambi in casi 1D e 3D. Due differenti modelli di Machine Learning sono usati e confrontati, ovvero la Deep Neural Network e l’Extreme Learning Machine.