Autonomous vehicle has became one of the most hot trend inAltificial Intelegencearea in current years thanks to the advanced calculation capability of computer.Combining withMachine Learningalgorithm, the autonomous vechile get closer tothe full automation level than ever.This thesis is aiming at presenting a complete precedures of autonomous vehiclecontrol throughMachine Learningtechniques such asInverse Reinforcement LearningandReinforcement Learning. More specifically, aNeuron Networkis employed to clas-sify and recognize the scenarios and twoReinforcement Learningalgorithms are im-plemented to train the vehicle afterwards. In order to compare the performance ofthe vehicle after training, the author selects two completely different types of algo-rithms which areREINFORCEandDDPGrespectively. Moreover, knowing that au-tonomous driving is a complex task, expert’s demonstrations are provided to let thevehicle observe first and thus the reward function of expert is recovered byGradientInverse Reinforcement Learningalgorithm before the training. The results show thatboth of the algorithms are able to converge to optimal policy and a brief comparisonof the performance between two algorithms is presented at the end.

il veicolo a guida autonoma è uno dei temi di ricerca più importati nellarea dell'intelligenza artificiale degli ultimi anni grazie al progressivo aumento della potenza di calcolo disponibile. Combinato il machine learning, il design di veicoli autonomi non è mai stato così vicino a conseguire il livello più elevato di automazione.Questa tesi ha lo scopo di presentare una procedura completa per il controllo di veicoli autonomi attraverso tecniche di machine learning quali Inverse reinforce learning e reinforcement learning. In particolare, una rete neurale è stata definita per classificare e riconoscere i differenti scenari di guida mentre due algoritmi di reicforcement learning sono stati utilizzati per eseguire il training della logica di guida.Per poter comparare le performance del controllo risultante, l'autore ha indagato due differenti tecniche numeriche note come reinforce e ddpg. Inoltre, sapendo che la guida autonoma è un task complesso, il training della logica è stato eseguito attraverso l'osservazione della guida di un pilota esperto dalla quale è stata determinata la funzione obiettivo attraverso la tecnica del Gradient inverse reinforcement learning.i risultati dimostrano che entrambi gli algoritmi sono in grado di convergere su policy ottime anche se con performance differenti.

Autonomous vehicle control via inverse reinforcement learning and deep reinforcement learning

HUANG, WENHUI
2017/2018

Abstract

Autonomous vehicle has became one of the most hot trend inAltificial Intelegencearea in current years thanks to the advanced calculation capability of computer.Combining withMachine Learningalgorithm, the autonomous vechile get closer tothe full automation level than ever.This thesis is aiming at presenting a complete precedures of autonomous vehiclecontrol throughMachine Learningtechniques such asInverse Reinforcement LearningandReinforcement Learning. More specifically, aNeuron Networkis employed to clas-sify and recognize the scenarios and twoReinforcement Learningalgorithms are im-plemented to train the vehicle afterwards. In order to compare the performance ofthe vehicle after training, the author selects two completely different types of algo-rithms which areREINFORCEandDDPGrespectively. Moreover, knowing that au-tonomous driving is a complex task, expert’s demonstrations are provided to let thevehicle observe first and thus the reward function of expert is recovered byGradientInverse Reinforcement Learningalgorithm before the training. The results show thatboth of the algorithms are able to converge to optimal policy and a brief comparisonof the performance between two algorithms is presented at the end.
ARRIGONI, STEFANO
ING - Scuola di Ingegneria Industriale e dell'Informazione
20-dic-2018
2017/2018
il veicolo a guida autonoma è uno dei temi di ricerca più importati nellarea dell'intelligenza artificiale degli ultimi anni grazie al progressivo aumento della potenza di calcolo disponibile. Combinato il machine learning, il design di veicoli autonomi non è mai stato così vicino a conseguire il livello più elevato di automazione.Questa tesi ha lo scopo di presentare una procedura completa per il controllo di veicoli autonomi attraverso tecniche di machine learning quali Inverse reinforce learning e reinforcement learning. In particolare, una rete neurale è stata definita per classificare e riconoscere i differenti scenari di guida mentre due algoritmi di reicforcement learning sono stati utilizzati per eseguire il training della logica di guida.Per poter comparare le performance del controllo risultante, l'autore ha indagato due differenti tecniche numeriche note come reinforce e ddpg. Inoltre, sapendo che la guida autonoma è un task complesso, il training della logica è stato eseguito attraverso l'osservazione della guida di un pilota esperto dalla quale è stata determinata la funzione obiettivo attraverso la tecnica del Gradient inverse reinforcement learning.i risultati dimostrano che entrambi gli algoritmi sono in grado di convergere su policy ottime anche se con performance differenti.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Autonomous vehicle via Inverse Reinforcement Learning and Reinforcement Learning_WenhuiHuang.pdf

non accessibile

Descrizione: Master Thesis- Wenhui Huang
Dimensione 4.19 MB
Formato Adobe PDF
4.19 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/144036