Over the last few years, the commodity market has gained increasing interest and governments, corporations and investors are turning their attention to them to understand the state of the economy, protect themselves against inflation and increase portfolio diversification. It is therefore important and effective to be able to predict prices in advance and with accuracy. This paper takes into consideration commodities such as crude oil, heating oil, gasoline, natural gas, gold, silver, platinum, copper, cotton, sugar, coffee, corn, live cattle in order to cover the entire sector. Several models are applied for their forecast. In particular, statistical (ARIMA), machine learning (SVR, RF, FFNN) and deep learning (RNN, LSTM) approaches are analyzed. Two strategies are applied for these models: univariate analysis with multi step forecast and multivariate analysis with single step forecast. In the second case, macroeconomic and financial variables are added and subsequently also technical indicators. In the univariate analysis ARIMA and LSTM are the best, while in the multivariate case the RF is the undisputed model followed by the LSTM. The results were compared with the RMSE metric and finally the Diebold-Mariano test aimed to add statistical significance.

Negli ultimi anni, il mercato delle materie prime ha acquisito un interesse crescente e governi, istituti e investitori stanno rivolgendo l’attenzione ad esse per comprendere lo stato dell'economia, proteggersi dall'inflazione e aumentare la diversificazione del portafoglio. È quindi importante ed efficace poter prevedere i prezzi in anticipo e con precisione. Questo documento prende in considerazione materie prime come petrolio greggio, gasolio da riscaldamento, benzina, gas naturale, oro, argento, platino, rame, cotone, zucchero, caffè, mais, bestiame vivo in modo tale da coprire l'intero settore. Diversi modelli vengono applicati per la loro previsione. In particolare vengono analizzati approcci statistici (ARIMA), machine learning (SVR, RF, FFNN) e deep learning (RNN, LSTM). Per questi modelli vengono applicate due strategie: analisi univariata con previsione di più giorni e analisi multivariata con previsione del giorno successivo. Nel secondo caso si aggiungono variabili macroeconomiche e finanziarie e successivamente anche indicatori tecnici. Nell'analisi univariata ARIMA e LSTM sono i migliori, mentre nel caso multivariato RF è il modello indiscusso seguito da LSTM. I risultati sono stati confrontati con la metrica RMSE e, infine, il test Diebold-Mariano mirava ad aggiungere significatività statistica.

Single and multi step forecast of the commodity prices : econometrics, machine learning and deep learning approaches

TONELLI, ALESSIO
2020/2021

Abstract

Over the last few years, the commodity market has gained increasing interest and governments, corporations and investors are turning their attention to them to understand the state of the economy, protect themselves against inflation and increase portfolio diversification. It is therefore important and effective to be able to predict prices in advance and with accuracy. This paper takes into consideration commodities such as crude oil, heating oil, gasoline, natural gas, gold, silver, platinum, copper, cotton, sugar, coffee, corn, live cattle in order to cover the entire sector. Several models are applied for their forecast. In particular, statistical (ARIMA), machine learning (SVR, RF, FFNN) and deep learning (RNN, LSTM) approaches are analyzed. Two strategies are applied for these models: univariate analysis with multi step forecast and multivariate analysis with single step forecast. In the second case, macroeconomic and financial variables are added and subsequently also technical indicators. In the univariate analysis ARIMA and LSTM are the best, while in the multivariate case the RF is the undisputed model followed by the LSTM. The results were compared with the RMSE metric and finally the Diebold-Mariano test aimed to add statistical significance.
SCOTTI, FRANCESCO
ING - Scuola di Ingegneria Industriale e dell'Informazione
28-apr-2021
2020/2021
Negli ultimi anni, il mercato delle materie prime ha acquisito un interesse crescente e governi, istituti e investitori stanno rivolgendo l’attenzione ad esse per comprendere lo stato dell'economia, proteggersi dall'inflazione e aumentare la diversificazione del portafoglio. È quindi importante ed efficace poter prevedere i prezzi in anticipo e con precisione. Questo documento prende in considerazione materie prime come petrolio greggio, gasolio da riscaldamento, benzina, gas naturale, oro, argento, platino, rame, cotone, zucchero, caffè, mais, bestiame vivo in modo tale da coprire l'intero settore. Diversi modelli vengono applicati per la loro previsione. In particolare vengono analizzati approcci statistici (ARIMA), machine learning (SVR, RF, FFNN) e deep learning (RNN, LSTM). Per questi modelli vengono applicate due strategie: analisi univariata con previsione di più giorni e analisi multivariata con previsione del giorno successivo. Nel secondo caso si aggiungono variabili macroeconomiche e finanziarie e successivamente anche indicatori tecnici. Nell'analisi univariata ARIMA e LSTM sono i migliori, mentre nel caso multivariato RF è il modello indiscusso seguito da LSTM. I risultati sono stati confrontati con la metrica RMSE e, infine, il test Diebold-Mariano mirava ad aggiungere significatività statistica.
File allegati
File Dimensione Formato  
2021_04_Tonelli.pdf

solo utenti autorizzati dal 16/03/2022

Descrizione: Tesi
Dimensione 3.89 MB
Formato Adobe PDF
3.89 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/174948