This Thesis investigates a Model Predictive Control (MPC) method applicable in scenarios where no prior knowledge of system dynamics equations is available. The use of Neural Networks allows for the reconstruction of the dynamical laws, specifically capturing the impact exerted by control inputs. Consequently, this provides the MPC with a predictive model, enabling the Iterative Linear Quadratic Regulator (ILQR) to determine the optimal control strategy. This method has been successfully applied in nonlinear environments featuring steep gradient functions, showcasing its adaptability across diverse contexts. The developed methodology not only demonstrates the capability to guide systems towards predefined targets but also to define controls necessary for replicating specific reference trajectories. Furthermore, within the scope of this study, exploration into online learning has been conducted. This allows the controller to actively acquire knowledge of the dynamical laws while determining controls based on the dynamics just learnt.

In questa Tesi è stato sviluppato un metodo di Model Predictive Control (MPC) per scenari in cui non si possiede alcuna conoscenza delle equazioni che regolano la dinamica del sistema. Attraverso l'utilizzo di reti neurali le leggi della dinamica vengono ricostruite, fornendo così a MPC il modello necessario tramite cui il controllore ILQR (Iterative Linear Quadratic Regulator), determina la strategia ottimale di controllo. Questo metodo è stato quindi applicato con successo in ambienti non lineari e con funzioni caratterizzate da pendenze ripide, dimostrando la sua adattabilità in contesti diversificati. La metodologia sviluppata presenta non solo la capacità di guidare sistemi verso target predefiniti entro un certo orizzonte temporale, ma anche di definire i controlli necessari per riprodurre specifiche traiettorie di riferimento. Inoltre, nell'ambito di questa tesi è stato esplorato il caso di apprendimento online, permettendo al regolatore di acquisire attivamente la conoscenza delle leggi della dinamica mentre determina i controlli basandosi sulla dinamica appresa.

Learning neural network models for the identification and control of non linear dynamical systems

Piazza, Simone
2022/2023

Abstract

This Thesis investigates a Model Predictive Control (MPC) method applicable in scenarios where no prior knowledge of system dynamics equations is available. The use of Neural Networks allows for the reconstruction of the dynamical laws, specifically capturing the impact exerted by control inputs. Consequently, this provides the MPC with a predictive model, enabling the Iterative Linear Quadratic Regulator (ILQR) to determine the optimal control strategy. This method has been successfully applied in nonlinear environments featuring steep gradient functions, showcasing its adaptability across diverse contexts. The developed methodology not only demonstrates the capability to guide systems towards predefined targets but also to define controls necessary for replicating specific reference trajectories. Furthermore, within the scope of this study, exploration into online learning has been conducted. This allows the controller to actively acquire knowledge of the dynamical laws while determining controls based on the dynamics just learnt.
ING - Scuola di Ingegneria Industriale e dell'Informazione
19-dic-2023
2022/2023
In questa Tesi è stato sviluppato un metodo di Model Predictive Control (MPC) per scenari in cui non si possiede alcuna conoscenza delle equazioni che regolano la dinamica del sistema. Attraverso l'utilizzo di reti neurali le leggi della dinamica vengono ricostruite, fornendo così a MPC il modello necessario tramite cui il controllore ILQR (Iterative Linear Quadratic Regulator), determina la strategia ottimale di controllo. Questo metodo è stato quindi applicato con successo in ambienti non lineari e con funzioni caratterizzate da pendenze ripide, dimostrando la sua adattabilità in contesti diversificati. La metodologia sviluppata presenta non solo la capacità di guidare sistemi verso target predefiniti entro un certo orizzonte temporale, ma anche di definire i controlli necessari per riprodurre specifiche traiettorie di riferimento. Inoltre, nell'ambito di questa tesi è stato esplorato il caso di apprendimento online, permettendo al regolatore di acquisire attivamente la conoscenza delle leggi della dinamica mentre determina i controlli basandosi sulla dinamica appresa.
File allegati
File Dimensione Formato  
Tesi_Piazza_Simone.pdf

accessibile in internet per tutti

Descrizione: Tesi_Piazza_Simone
Dimensione 3.1 MB
Formato Adobe PDF
3.1 MB Adobe PDF Visualizza/Apri
Executive_Summary_Piazza_Simone.pdf

accessibile in internet per tutti

Descrizione: Executive_Summary_Piazza_Simone
Dimensione 704.93 kB
Formato Adobe PDF
704.93 kB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/215523