On linear and quadratic training methods for deep learning

Biblioteche e Archivi
POLITesi - Archivio digitale delle tesi di laurea e di dottorato

Since they were proposed, artificial neural networks (NN) have received ever growing interest and they went, thanks to the increasing computational power available, from mere theoretical studies to an established tool with impact in a large number of technological and scientific applications. Usage of this kind of models requires tuning of their parameters via a procedure called learning, which is based on a set of data. This thesis studies the learning problem from the point of view of numerical optimization, and proposes several new algorithms. The latter are tested and compared with the state-of-the-art on the same learning tasks, in order to draw conclusions on their strengths and weaknesses.

Da quando furono proposte, le reti neurali artificiali (NN) hanno suscitato un interesse sempre crescente e sono arrivate, grazie alla crescente potenza computazionale disponibile, da semplici studi teorici a strumento affermato con impatto su un gran numero di applicazioni tecnologiche e scentifiche. L'uso di questo tipo di modelli richiede di tararne i parametri tramite una procedura detta apprendimento, che si basa su un set di dati. Questa tesi studia il problema di apprendimento dal punto di vista dell'ottimizzazione numerica, e propone diversi nuovi algoritmi. Questi ultimi sono testati e comparati con lo stato dell'arte sugli stessi problemi di apprendimento, così da poter trarre conclusioni sui loro punti di forza e debolezze.

On linear and quadratic training methods for deep learning

Gini, Roberto

2019/2020

Abstract

Since they were proposed, artificial neural networks (NN) have received ever growing interest and they went, thanks to the increasing computational power available, from mere theoretical studies to an established tool with impact in a large number of technological and scientific applications. Usage of this kind of models requires tuning of their parameters via a procedure called learning, which is based on a set of data. This thesis studies the learning problem from the point of view of numerical optimization, and proposes several new algorithms. The latter are tested and compared with the state-of-the-art on the same learning tasks, in order to draw conclusions on their strengths and weaknesses.

Scheda breve

Scheda completa

	Relatore
	
				FAGIANO, LORENZO MARIO
			
	Scuola / Dip.
	
				ING  - Scuola di Ingegneria Industriale e dell'Informazione
			
	Data
	
				15-dic-2020
			
	Anno accademico
	
				2019/2020
			
	Abstract in italiano
	
				Da quando furono proposte, le reti neurali artificiali (NN) hanno suscitato un interesse sempre crescente e sono arrivate, grazie alla crescente potenza computazionale disponibile, da semplici studi teorici a strumento affermato con impatto su un gran numero di applicazioni tecnologiche e scentifiche. L'uso di questo tipo di modelli richiede di tararne i parametri tramite una procedura detta apprendimento, che si basa su un set di dati. Questa tesi studia il problema di apprendimento dal punto di vista dell'ottimizzazione numerica, e propone diversi nuovi algoritmi. Questi ultimi sono testati e comparati con lo stato dell'arte sugli stessi problemi di apprendimento, così da poter trarre conclusioni sui loro punti di forza e debolezze.
			
	Appare nelle tipologie:
	
				Tesi di laurea Magistrale

File allegati

File	Dimensione	Formato
On linear and quadratic training methods for deep learning.pdf accessibile in internet solo dagli utenti autorizzati Dimensione 651.43 kB Formato Adobe PDF Visualizza/Apri	651.43 kB	Adobe PDF	Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/169751