Autonomous vehicle control via inverse reinforcement learning and deep reinforcement learning

Biblioteche e Archivi
POLITesi - Archivio digitale delle tesi di laurea e di dottorato

Autonomous vehicle has became one of the most hot trend inAltificial Intelegencearea in current years thanks to the advanced calculation capability of computer.Combining withMachine Learningalgorithm, the autonomous vechile get closer tothe full automation level than ever.This thesis is aiming at presenting a complete precedures of autonomous vehiclecontrol throughMachine Learningtechniques such asInverse Reinforcement LearningandReinforcement Learning. More specifically, aNeuron Networkis employed to clas-sify and recognize the scenarios and twoReinforcement Learningalgorithms are im-plemented to train the vehicle afterwards. In order to compare the performance ofthe vehicle after training, the author selects two completely different types of algo-rithms which areREINFORCEandDDPGrespectively. Moreover, knowing that au-tonomous driving is a complex task, expert’s demonstrations are provided to let thevehicle observe first and thus the reward function of expert is recovered byGradientInverse Reinforcement Learningalgorithm before the training. The results show thatboth of the algorithms are able to converge to optimal policy and a brief comparisonof the performance between two algorithms is presented at the end.

il veicolo a guida autonoma è uno dei temi di ricerca più importati nellarea dell'intelligenza artificiale degli ultimi anni grazie al progressivo aumento della potenza di calcolo disponibile. Combinato il machine learning, il design di veicoli autonomi non è mai stato così vicino a conseguire il livello più elevato di automazione.Questa tesi ha lo scopo di presentare una procedura completa per il controllo di veicoli autonomi attraverso tecniche di machine learning quali Inverse reinforce learning e reinforcement learning. In particolare, una rete neurale è stata definita per classificare e riconoscere i differenti scenari di guida mentre due algoritmi di reicforcement learning sono stati utilizzati per eseguire il training della logica di guida.Per poter comparare le performance del controllo risultante, l'autore ha indagato due differenti tecniche numeriche note come reinforce e ddpg. Inoltre, sapendo che la guida autonoma è un task complesso, il training della logica è stato eseguito attraverso l'osservazione della guida di un pilota esperto dalla quale è stata determinata la funzione obiettivo attraverso la tecnica del Gradient inverse reinforcement learning.i risultati dimostrano che entrambi gli algoritmi sono in grado di convergere su policy ottime anche se con performance differenti.

Autonomous vehicle control via inverse reinforcement learning and deep reinforcement learning

HUANG, WENHUI

2017/2018

Abstract

Autonomous vehicle has became one of the most hot trend inAltificial Intelegencearea in current years thanks to the advanced calculation capability of computer.Combining withMachine Learningalgorithm, the autonomous vechile get closer tothe full automation level than ever.This thesis is aiming at presenting a complete precedures of autonomous vehiclecontrol throughMachine Learningtechniques such asInverse Reinforcement LearningandReinforcement Learning. More specifically, aNeuron Networkis employed to clas-sify and recognize the scenarios and twoReinforcement Learningalgorithms are im-plemented to train the vehicle afterwards. In order to compare the performance ofthe vehicle after training, the author selects two completely different types of algo-rithms which areREINFORCEandDDPGrespectively. Moreover, knowing that au-tonomous driving is a complex task, expert’s demonstrations are provided to let thevehicle observe first and thus the reward function of expert is recovered byGradientInverse Reinforcement Learningalgorithm before the training. The results show thatboth of the algorithms are able to converge to optimal policy and a brief comparisonof the performance between two algorithms is presented at the end.

Scheda breve

Scheda completa

	Relatore
	
				BRAGHIN, FRANCESCO
			
	Correlatore/i
	
				ARRIGONI, STEFANO
			
	Scuola / Dip.
	
				ING  - Scuola di Ingegneria Industriale e dell'Informazione
			
	Data
	
				20-dic-2018
			
	Anno accademico
	
				2017/2018
			
	Abstract in italiano
	
				il veicolo a guida autonoma è uno dei temi di ricerca più importati nellarea dell'intelligenza artificiale degli ultimi anni grazie al progressivo aumento della potenza di calcolo disponibile. Combinato il machine learning, il design di veicoli autonomi non è mai stato così vicino a conseguire il livello più elevato di automazione.Questa tesi ha lo scopo di presentare una procedura completa per il controllo di veicoli autonomi attraverso tecniche di machine learning quali Inverse reinforce learning e reinforcement learning. In particolare, una rete neurale è stata definita per classificare e riconoscere i differenti scenari di guida mentre due algoritmi di reicforcement learning sono stati utilizzati per eseguire il training della logica di guida.Per poter comparare le performance del controllo risultante, l'autore ha indagato due differenti tecniche numeriche note come reinforce e ddpg. Inoltre, sapendo che la guida autonoma è un task complesso, il training della logica è stato eseguito attraverso l'osservazione della guida di un pilota esperto dalla quale è stata determinata la funzione obiettivo attraverso la tecnica del Gradient inverse reinforcement learning.i risultati dimostrano che entrambi gli algoritmi sono in grado di convergere su policy ottime anche se con performance differenti.
			
	Tipo di documento
	
				Tesi di laurea Magistrale
			
	Appare nelle tipologie:
	
				Tesi di laurea Magistrale

File allegati

File	Dimensione	Formato
Autonomous vehicle via Inverse Reinforcement Learning and Reinforcement Learning_WenhuiHuang.pdf non accessibile Descrizione: Master Thesis- Wenhui Huang Dimensione 4.19 MB Formato Adobe PDF Visualizza/Apri	4.19 MB	Adobe PDF	Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/144036