The goal of this thesis is to assess to what extent deep learning methodologies are able to perform when dealing with highly liquid financial assets' returns prediction. This branch of the broader field of research known as machine learning is characterized by the use of artificial neural networks to deal with a wide array of problems. Machine learning focuses on the study and the implementation of algorithms that are able to learn from and make predictions on data: such algorithms overcome the classical approach of following strictly static instructions by making data-driven predictions and decisions. Deep learning already has a considerable impact on many aspects of our everyday life, and the trading activity is certainly not excluded from this technological revolution. The application areas where these techniques have proven to be most successful are those of computer vision, image recognition, natural language processing and speech recognition. On the other hand, the use of deep neural networks for financial time series analysis is still relatively limited, at least with regard to the existing literature: indeed, in facing this kind of problems, methodologies referring to the so-called 'classical' machine learning area are often still preferred. This is mainly due to the fact that the performance achievable by training a deep neural network improves drastically with the increase in the number of available data. Applications like computer vision and speech recognition are all characterized by the availability of a huge amount of training instances, which can be collected or generated easily and at low cost. On the other hand, the datasets available for financial time series analysis are considerably smaller in size and cannot be generated at will. Furthermore, financial time series are typically characterized by a low signal-to-noise ratio. This peculiarity complicates the training of models which are capable of representing very complex interactions, since such powerful models may confuse the noise in the data with patterns emerging from the data-generating process: this phenomenon is known as overfitting. It takes place when the model memorizes the instances of the specific dataset on which it is trained, rather than learning generally valid properties of the data-generating process. These are the main reasons why artificial neural networks have not been equally successful in the financial sector as much as they are in the aforementioned fields, even though their use is constantly increasing. To be fair, this considerations are based on what we found by reviewing the public-available related literature, since it is impossible to accurately assess how the financial institutions make use of deep learning algorithms in this context. For sure, the ability to extract abstract features from raw data, and to identify hidden nonlinear relationships without relying on econometric assumptions and human expertise, makes deep learning particularly attractive as an alternative to existing models and approaches. This thesis differs from other similar existing works for the choice of the asset universe considered, made up by the most liquid futures on government bonds and the main currency pairs, and for the use of a heteroskedastic loss function in training the artificial neural network, which makes it possible to associate an input-dependent level of volatility to each prediction. Moreover, we investigate the impact of different bet sizing schemes on the Sharpe Ratio of trading strategies built upon the network's predictions.

Lo scopo di questa tesi è di valutare in che misura algoritmi attinenti all'area del deep learning sono in grado di performare se applicati al problema della previsione del rendimento di asset finanziari ad alta liquidità. Questa branca del più ampio campo di ricerca noto come machine learning utilizza reti neurali artficiali nell'affrontare una vasta gamma di problemi. Il machine learning si occupa dello studio e dell'implementazione di algoritmi che siano capaci di apprendere informazioni direttamente dai dati e fare previsioni su di essi: tali algoritmi superano il classico approccio del seguire un insieme di istruzioni statiche. Già attualemnte, il deep learning ha un impatto considerevole su molti aspetti della nostra vita di tutti i giorni, e il mondo del trading non è di certo escluso da questa rivoluzione tecnologica. Le applicazioni in cui questi algoritmi hanno avuto maggior successo sono computer vision, image recognition, natural language processing e speech recognition. D'altro canto, l'utilizzo di reti neurali per l'analisi di serie storiche finanziare è ancora piuttosto limitato, almeno per quanto riguarda la letteratura accessibile pubblicamente: per affrontare questo tipo di problemi spesso si preferisce ancora adottare metodologie attinenti al machine learning 'classico'. Questo è dovuto principalmente al fatto che le performance raggiungibili allenando artificial neural networks aumentano sensibilemnte con l'aumentare del numero di osservazioni disponibili. Applicazioni come computer vision o speech recognition sono caratterizzate dalla disponibilità di un elevato numero di dati su cui allenare la rete, dal momento che questi possono essere generati facilmente e a basso costo. Al contrario, i dataset tipici dell'ambito finanziario hanno dimensioni considerevolmente minori e non possono essere generati a piacere. Inoltre, le serie storiche relative a prezzi di strumenti finanziari sono solitamente caratterizzate da bassi valori di signal-to-noise ratio. Questa peculiarità complica l'allenamento di modelli che hanno la capacità di rappresentare interazioni molto complesse tra le variabili che si stanno analizzano. Modelli così complessi potrebbero intrerpretare il rumore di sottofondo presente nei dati come patterns carattestistici del fenomeno che si sta studiando: questo problema è noto come overfitting. Esso ha luogo quando l'algoritmo memorizza caratteristiche specifiche del dataset su cui è allenato, senza apprendere le proprietà generali del modello probabilistico sottostante al dataset. Queste sono le ragioni principali per cui, fino ad ora, le reti neurali non hanno goduto di un successo in ambito finanziario pari a quello che hanno avuto nelle aree applicative sopracitate, anche se il loro utilizzo è in continuo aumento. In ogni caso, queste considerazioni si basano esclusivamente su quanto si trova nella letteratura accessibile al pubblico, dal momento che risulta impossbile conoscere in che modo le varie istituzioni finanziarie facciano uso di algoritmi attinenti all'area del deep learning. Sicuramente la capacità di ricavare informazioni utili partendo da un insieme di dati grezzi, e di identificare complesse relazioni non lineari tra variabili senza dover fare affidamento su alcun assunto di carattere economico o finanziario, rendono il deep learning un'alternativa attraente agli approcci adottati tipicamente nello studio di serie storiche in ambito finanziario. Questa tesi si differenzia da altri lavori simili che si trovano in letteratura per la scelta dell'universo di asset di riferimento, costituito dai più liquidi futures su bond governativi e dai principali tassi di cambio tra valute nel mercato FX, e per l'uso di una loss function eteroschedastica nell'allentamento delle reti neurali, che permette di associare a ciascuna previsione un livello di volatilità dipendente dagli input del modello. Inoltre, viene analizzato l'impatto che diverse strategie di investimento hanno sullo Sharpe Ratio ottenibile da un investitore che faccia trading seguendo le previsioni degli algoritmi implementati.

Artificial neural networks application to financial markets

GRASSI, STEFANO
2017/2018

Abstract

The goal of this thesis is to assess to what extent deep learning methodologies are able to perform when dealing with highly liquid financial assets' returns prediction. This branch of the broader field of research known as machine learning is characterized by the use of artificial neural networks to deal with a wide array of problems. Machine learning focuses on the study and the implementation of algorithms that are able to learn from and make predictions on data: such algorithms overcome the classical approach of following strictly static instructions by making data-driven predictions and decisions. Deep learning already has a considerable impact on many aspects of our everyday life, and the trading activity is certainly not excluded from this technological revolution. The application areas where these techniques have proven to be most successful are those of computer vision, image recognition, natural language processing and speech recognition. On the other hand, the use of deep neural networks for financial time series analysis is still relatively limited, at least with regard to the existing literature: indeed, in facing this kind of problems, methodologies referring to the so-called 'classical' machine learning area are often still preferred. This is mainly due to the fact that the performance achievable by training a deep neural network improves drastically with the increase in the number of available data. Applications like computer vision and speech recognition are all characterized by the availability of a huge amount of training instances, which can be collected or generated easily and at low cost. On the other hand, the datasets available for financial time series analysis are considerably smaller in size and cannot be generated at will. Furthermore, financial time series are typically characterized by a low signal-to-noise ratio. This peculiarity complicates the training of models which are capable of representing very complex interactions, since such powerful models may confuse the noise in the data with patterns emerging from the data-generating process: this phenomenon is known as overfitting. It takes place when the model memorizes the instances of the specific dataset on which it is trained, rather than learning generally valid properties of the data-generating process. These are the main reasons why artificial neural networks have not been equally successful in the financial sector as much as they are in the aforementioned fields, even though their use is constantly increasing. To be fair, this considerations are based on what we found by reviewing the public-available related literature, since it is impossible to accurately assess how the financial institutions make use of deep learning algorithms in this context. For sure, the ability to extract abstract features from raw data, and to identify hidden nonlinear relationships without relying on econometric assumptions and human expertise, makes deep learning particularly attractive as an alternative to existing models and approaches. This thesis differs from other similar existing works for the choice of the asset universe considered, made up by the most liquid futures on government bonds and the main currency pairs, and for the use of a heteroskedastic loss function in training the artificial neural network, which makes it possible to associate an input-dependent level of volatility to each prediction. Moreover, we investigate the impact of different bet sizing schemes on the Sharpe Ratio of trading strategies built upon the network's predictions.
DE PRATO, MARTINO
ING - Scuola di Ingegneria Industriale e dell'Informazione
20-dic-2018
2017/2018
Lo scopo di questa tesi è di valutare in che misura algoritmi attinenti all'area del deep learning sono in grado di performare se applicati al problema della previsione del rendimento di asset finanziari ad alta liquidità. Questa branca del più ampio campo di ricerca noto come machine learning utilizza reti neurali artficiali nell'affrontare una vasta gamma di problemi. Il machine learning si occupa dello studio e dell'implementazione di algoritmi che siano capaci di apprendere informazioni direttamente dai dati e fare previsioni su di essi: tali algoritmi superano il classico approccio del seguire un insieme di istruzioni statiche. Già attualemnte, il deep learning ha un impatto considerevole su molti aspetti della nostra vita di tutti i giorni, e il mondo del trading non è di certo escluso da questa rivoluzione tecnologica. Le applicazioni in cui questi algoritmi hanno avuto maggior successo sono computer vision, image recognition, natural language processing e speech recognition. D'altro canto, l'utilizzo di reti neurali per l'analisi di serie storiche finanziare è ancora piuttosto limitato, almeno per quanto riguarda la letteratura accessibile pubblicamente: per affrontare questo tipo di problemi spesso si preferisce ancora adottare metodologie attinenti al machine learning 'classico'. Questo è dovuto principalmente al fatto che le performance raggiungibili allenando artificial neural networks aumentano sensibilemnte con l'aumentare del numero di osservazioni disponibili. Applicazioni come computer vision o speech recognition sono caratterizzate dalla disponibilità di un elevato numero di dati su cui allenare la rete, dal momento che questi possono essere generati facilmente e a basso costo. Al contrario, i dataset tipici dell'ambito finanziario hanno dimensioni considerevolmente minori e non possono essere generati a piacere. Inoltre, le serie storiche relative a prezzi di strumenti finanziari sono solitamente caratterizzate da bassi valori di signal-to-noise ratio. Questa peculiarità complica l'allenamento di modelli che hanno la capacità di rappresentare interazioni molto complesse tra le variabili che si stanno analizzano. Modelli così complessi potrebbero intrerpretare il rumore di sottofondo presente nei dati come patterns carattestistici del fenomeno che si sta studiando: questo problema è noto come overfitting. Esso ha luogo quando l'algoritmo memorizza caratteristiche specifiche del dataset su cui è allenato, senza apprendere le proprietà generali del modello probabilistico sottostante al dataset. Queste sono le ragioni principali per cui, fino ad ora, le reti neurali non hanno goduto di un successo in ambito finanziario pari a quello che hanno avuto nelle aree applicative sopracitate, anche se il loro utilizzo è in continuo aumento. In ogni caso, queste considerazioni si basano esclusivamente su quanto si trova nella letteratura accessibile al pubblico, dal momento che risulta impossbile conoscere in che modo le varie istituzioni finanziarie facciano uso di algoritmi attinenti all'area del deep learning. Sicuramente la capacità di ricavare informazioni utili partendo da un insieme di dati grezzi, e di identificare complesse relazioni non lineari tra variabili senza dover fare affidamento su alcun assunto di carattere economico o finanziario, rendono il deep learning un'alternativa attraente agli approcci adottati tipicamente nello studio di serie storiche in ambito finanziario. Questa tesi si differenzia da altri lavori simili che si trovano in letteratura per la scelta dell'universo di asset di riferimento, costituito dai più liquidi futures su bond governativi e dai principali tassi di cambio tra valute nel mercato FX, e per l'uso di una loss function eteroschedastica nell'allentamento delle reti neurali, che permette di associare a ciascuna previsione un livello di volatilità dipendente dagli input del modello. Inoltre, viene analizzato l'impatto che diverse strategie di investimento hanno sullo Sharpe Ratio ottenibile da un investitore che faccia trading seguendo le previsioni degli algoritmi implementati.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2018_12_Grassi_Stefano.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 2.22 MB
Formato Adobe PDF
2.22 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/144422