Recently, the fast market evolution, the availability of new data and the cheaper and faster computing power have created the need for new techniques to forecast demand. Machine learning algorithms are able to overcome the limitations of traditional forecasting methods which are time-consuming and rely on purely historical time series. This thesis proposes a five-steps methodological framework which investigates the value of machine learning and explanatory features in improving forecasting accuracy. Based in a specific industry setting, the proposed approach for demand forecasting stems directly from the nature of the supply chain and aims to gain insights from the prediction results. The method consists in setting the forecasting problem, building the explanatory variables space, selecting the forecasting horizon, identifying the candidate machine learning algorithms and providing the metrics to evaluate the forecasting performances. Its success is demonstrated by the improvement in forecasting accuracy through the exploitation of both explanatory variables and machine learning algorithms compared to alternative methods. Furthermore, the proposed methodology has been applied on two datasets belonging to the Retail industry. The empirical results show that models integrating more information perform significantly better than the baselines, such as ARIMA or Linear and Regularized Regressions. Additionally, it emerges that Random Forest algorithms leveraging all features lead to an improvement of performances of both retailers’ empirical datasets.

Nell’ambito della previsione della domanda, accanto ai tradizionali metodi oggi utilizzati per la previsione della domanda, basati essenzialmente su serie storiche, sono sempre più di interesse gli algoritmi di Machine Learning. Sfruttando la potenza di calcolo ormai a basso costo, questi sono in grado di elaborare dati raccolti da nuove fonti consentendo di essere al passo con la rapida evoluzione del mercato. Questa tesi propone una struttura metodologica per la previsione della domanda suddivisa in cinque fasi, facendo leva su algoritmi di Machine Learning e su variabili esplicative della domanda per migliorarne l’accuratezza delle previsioni. Basato su uno specifico contesto industriale, l’approccio proposto deriva direttamente dalla natura della supply chain e mira a suscitare ulteriori riflessioni dai risultati della previsione. Il metodo consiste nell’impostare il problema di previsione, nel costruire lo spazio delle variabili esplicative, nel selezionare l’orizzonte previsionale, nell’identificare i possibili candidati fra gli algoritmi di Machine Learning ed infine nel fornire le metriche di valutazione delle loro prestazioni. Il suo successo è dimostrato dai miglioramenti dell’accuratezza dei risultati ottenuti attraverso l’utilizzo delle variabili esplicative e degli algoritmi di Machine Learning rispetto a metodi alternativi. I risultati empirici dell’applicazione della metodologia su due dataset appartenenti al settore della Grande Distribuzione Organizzata mostrano come i modelli che integrano più informazioni rivelano prestazioni significativamente migliori rispetto ai modelli di riferimento. Inoltre, dall’implementazione della metodologia emerge come gli algoritmi “Random Forest” che utilizzano tutte le variabili esplicative disponibili sono in grado di portare a un miglioramento delle prestazioni di entrambi i dataset.

Demand forecasting using machine learning : a comparison across industries and explanatory features

De SERIO, MARTINA
2017/2018

Abstract

Recently, the fast market evolution, the availability of new data and the cheaper and faster computing power have created the need for new techniques to forecast demand. Machine learning algorithms are able to overcome the limitations of traditional forecasting methods which are time-consuming and rely on purely historical time series. This thesis proposes a five-steps methodological framework which investigates the value of machine learning and explanatory features in improving forecasting accuracy. Based in a specific industry setting, the proposed approach for demand forecasting stems directly from the nature of the supply chain and aims to gain insights from the prediction results. The method consists in setting the forecasting problem, building the explanatory variables space, selecting the forecasting horizon, identifying the candidate machine learning algorithms and providing the metrics to evaluate the forecasting performances. Its success is demonstrated by the improvement in forecasting accuracy through the exploitation of both explanatory variables and machine learning algorithms compared to alternative methods. Furthermore, the proposed methodology has been applied on two datasets belonging to the Retail industry. The empirical results show that models integrating more information perform significantly better than the baselines, such as ARIMA or Linear and Regularized Regressions. Additionally, it emerges that Random Forest algorithms leveraging all features lead to an improvement of performances of both retailers’ empirical datasets.
ING - Scuola di Ingegneria Industriale e dell'Informazione
20-dic-2018
2017/2018
Nell’ambito della previsione della domanda, accanto ai tradizionali metodi oggi utilizzati per la previsione della domanda, basati essenzialmente su serie storiche, sono sempre più di interesse gli algoritmi di Machine Learning. Sfruttando la potenza di calcolo ormai a basso costo, questi sono in grado di elaborare dati raccolti da nuove fonti consentendo di essere al passo con la rapida evoluzione del mercato. Questa tesi propone una struttura metodologica per la previsione della domanda suddivisa in cinque fasi, facendo leva su algoritmi di Machine Learning e su variabili esplicative della domanda per migliorarne l’accuratezza delle previsioni. Basato su uno specifico contesto industriale, l’approccio proposto deriva direttamente dalla natura della supply chain e mira a suscitare ulteriori riflessioni dai risultati della previsione. Il metodo consiste nell’impostare il problema di previsione, nel costruire lo spazio delle variabili esplicative, nel selezionare l’orizzonte previsionale, nell’identificare i possibili candidati fra gli algoritmi di Machine Learning ed infine nel fornire le metriche di valutazione delle loro prestazioni. Il suo successo è dimostrato dai miglioramenti dell’accuratezza dei risultati ottenuti attraverso l’utilizzo delle variabili esplicative e degli algoritmi di Machine Learning rispetto a metodi alternativi. I risultati empirici dell’applicazione della metodologia su due dataset appartenenti al settore della Grande Distribuzione Organizzata mostrano come i modelli che integrano più informazioni rivelano prestazioni significativamente migliori rispetto ai modelli di riferimento. Inoltre, dall’implementazione della metodologia emerge come gli algoritmi “Random Forest” che utilizzano tutte le variabili esplicative disponibili sono in grado di portare a un miglioramento delle prestazioni di entrambi i dataset.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2018_12_DeSerio.pdf

solo utenti autorizzati dal 05/12/2019

Descrizione: Testo della tesi
Dimensione 9.16 MB
Formato Adobe PDF
9.16 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/145042