In recent years, long short-term memory networks (LSTM), due to their sequence learning abilities, have moved the performance frontier forward in a large variety of machine learning (ML) application fields. The objective of this thesis is to test their effectiveness in stock market predictions and in the construction of an illustrative trading strategy. Specifically, the study does not want to benchmark LSTM to show their edge over other ML models; rather, it aims to deliver useful hints regarding managerial decisions for the implementation of LSTM based trading systems. In doing so, an original approach providing for different LSTM networks predicting out-of-sample directional movements for 44 stocks in the S&P500 from November 2013 to November 2019 at different horizons is employed. It aims both to deal with the bias by ML trading systems to focus only on returns maximization, neglecting risk considerations, and to facilitate the identification of a forecasting horizon range in which an investment strategy can be profitably performed. From a data science perspective, results prove LSTM networks' ability in recognizing proper recurrent patterns within stock price time-series: they reach peaks in accuracy higher than 40%. From a financial one, the strategy created thanks to the predictions by LSTM networks delivers positive profits of 78.3%. Moreover, results challenge the standard training approach, followed also in this thesis, regarding the employment of a dataset composed just by most recent and strictly temporally close to the trading period observations; the evidence creates the conditions to think about the possibility to train specific models with observations coming from periods characterized by market conditions as similar as possible to the one actually playing in the market. In conclusion, to train all models, technical indicators and macroeconomic variables have been added to daily returns for the first time in LSTM literature, at least to the best of our knowledge. Anyhow, tests conducted to assess the benefits deriving from their introduction in the input features set raise doubts about their massive use in financial literature.

Recentemente, le reti di memoria a lungo termine (LSTM), grazie alla capacità di apprendimento sequenziale, hanno portato ad un incremento delle prestazioni in una grande varietà di campi di applicazione machine learning (ML). L'obiettivo della tesi è quello di testare la loro efficacia per la previsione del mercato azionario e per la costruzione di una strategia di trading illustrativa. Nel fare ciò, lo studio non intende confrontare le loro performance con modelli benchmark; vuole piuttosto fornire indicazioni rispetto alle decisioni operative da prendere per un loro efficace utilizzo. Nel lavoro empirico, viene adottato un approccio originale che prevede l'utilizzo di reti con differenti orizzonti di previsione per la predizione del movimento del prezzo di 44 azioni appartenenti al S&P500 da Novembre 2013 a Novembre 2019. L'approccio mira sia ad affrontare la tendenza da parte dei sistemi di trading ML a focalizzarsi sulla massimizzazione dei ritorni, tralasciando valutazioni di rischio, sia a facilitare l'identificazione di un intervallo di orizzonte di previsione adatto alla creazione di una strategia di investimento ML. Da un punto di vista data science, i risultati ottenuti dimostrano la potenzialità delle reti LSTM nel riconoscimento di pattern all'interno di serie temporali finanziarie: le reti raggiungono picchi di accuracy superiore al 40%. In termini di redditività, la strategia creata offre profitti positivi del 78,3%. Inoltre, i risultati ottenuti sfidano l'usuale approccio di training riguardante l'esclusivo impiego di osservazioni temporalmente precedenti a quelle del periodo di trading; evidenze fanno pensare alla possibilità di allenare i modelli con osservazioni provenienti da periodi caratterizzati da condizioni di mercato il più simili possibile a quelle presenti durante il periodo di investimento. Infine, per allenare tutti i modelli, sia indicatori tecnici che variabili macroeconomiche sono stati inseriti nel dataset per la prima volta in letteratura, almeno per quella che è la conoscenza dell'autore. Tuttavia, test condotti per valutare i benefici derivanti dalla loro introduzione sollevano dubbi sul loro massiccio utilizzo in letteratura.

Long short-term memory networks for stock market predictions and portfolio construction

MORANDI, STEFANO
2018/2019

Abstract

In recent years, long short-term memory networks (LSTM), due to their sequence learning abilities, have moved the performance frontier forward in a large variety of machine learning (ML) application fields. The objective of this thesis is to test their effectiveness in stock market predictions and in the construction of an illustrative trading strategy. Specifically, the study does not want to benchmark LSTM to show their edge over other ML models; rather, it aims to deliver useful hints regarding managerial decisions for the implementation of LSTM based trading systems. In doing so, an original approach providing for different LSTM networks predicting out-of-sample directional movements for 44 stocks in the S&P500 from November 2013 to November 2019 at different horizons is employed. It aims both to deal with the bias by ML trading systems to focus only on returns maximization, neglecting risk considerations, and to facilitate the identification of a forecasting horizon range in which an investment strategy can be profitably performed. From a data science perspective, results prove LSTM networks' ability in recognizing proper recurrent patterns within stock price time-series: they reach peaks in accuracy higher than 40%. From a financial one, the strategy created thanks to the predictions by LSTM networks delivers positive profits of 78.3%. Moreover, results challenge the standard training approach, followed also in this thesis, regarding the employment of a dataset composed just by most recent and strictly temporally close to the trading period observations; the evidence creates the conditions to think about the possibility to train specific models with observations coming from periods characterized by market conditions as similar as possible to the one actually playing in the market. In conclusion, to train all models, technical indicators and macroeconomic variables have been added to daily returns for the first time in LSTM literature, at least to the best of our knowledge. Anyhow, tests conducted to assess the benefits deriving from their introduction in the input features set raise doubts about their massive use in financial literature.
ING - Scuola di Ingegneria Industriale e dell'Informazione
6-giu-2020
2018/2019
Recentemente, le reti di memoria a lungo termine (LSTM), grazie alla capacità di apprendimento sequenziale, hanno portato ad un incremento delle prestazioni in una grande varietà di campi di applicazione machine learning (ML). L'obiettivo della tesi è quello di testare la loro efficacia per la previsione del mercato azionario e per la costruzione di una strategia di trading illustrativa. Nel fare ciò, lo studio non intende confrontare le loro performance con modelli benchmark; vuole piuttosto fornire indicazioni rispetto alle decisioni operative da prendere per un loro efficace utilizzo. Nel lavoro empirico, viene adottato un approccio originale che prevede l'utilizzo di reti con differenti orizzonti di previsione per la predizione del movimento del prezzo di 44 azioni appartenenti al S&P500 da Novembre 2013 a Novembre 2019. L'approccio mira sia ad affrontare la tendenza da parte dei sistemi di trading ML a focalizzarsi sulla massimizzazione dei ritorni, tralasciando valutazioni di rischio, sia a facilitare l'identificazione di un intervallo di orizzonte di previsione adatto alla creazione di una strategia di investimento ML. Da un punto di vista data science, i risultati ottenuti dimostrano la potenzialità delle reti LSTM nel riconoscimento di pattern all'interno di serie temporali finanziarie: le reti raggiungono picchi di accuracy superiore al 40%. In termini di redditività, la strategia creata offre profitti positivi del 78,3%. Inoltre, i risultati ottenuti sfidano l'usuale approccio di training riguardante l'esclusivo impiego di osservazioni temporalmente precedenti a quelle del periodo di trading; evidenze fanno pensare alla possibilità di allenare i modelli con osservazioni provenienti da periodi caratterizzati da condizioni di mercato il più simili possibile a quelle presenti durante il periodo di investimento. Infine, per allenare tutti i modelli, sia indicatori tecnici che variabili macroeconomiche sono stati inseriti nel dataset per la prima volta in letteratura, almeno per quella che è la conoscenza dell'autore. Tuttavia, test condotti per valutare i benefici derivanti dalla loro introduzione sollevano dubbi sul loro massiccio utilizzo in letteratura.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2020_06_Morandi.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 13.28 MB
Formato Adobe PDF
13.28 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/153808