Machine Learning (ML) methods have been increasingly employed for time series forecasting. Recent studies have asserted the dependency of the obtained performance on the amount of training data. Cross-sectional forecasting is a technique that employs data from different time series to train the ML model. Also defined as cross-sectional training, it was recently developed to cope with the insufficient data given by short time series. This thesis will investigate the application of cross-sectional forecasting on supply chain demand. The work will be divided in three sections which will concern the following topics: (i) application of cross-sectional forecasting to the whole dataset by means of several ML methods; (ii) experimentation of four clustering approaches to cross-sectional forecasting; and (iii) inclusion of exogenous variables besides the historical demand data for the creation of the forecasts employing cross-sectional training. The experiments, performed on two datasets related to food distribution, resulted in the ML methods outperforming the statistical benchmarks. It was also shown that ML methods’ performance could be sensibly improved applying the right clustering approach, and that they were able to consider the influence of additional variables influencing demand reducing the forecasting error.

Nonostante l’applicazione dei metodi di Machine Learning (ML) per la previsione di serie temporali sia sempre più diffusa, sono state individuate delle problematiche legate alla quantità di dati disponibili per la fase di training. Per ovviare a questo problema è stata ideata la pratica del cross-sectional forecasting, che consiste nell’utilizzare dati provenienti da molteplici serie temporali. Questa tesi tratterà l’applicazione del cross-sectional forecasting per la previsione della domanda. I dati utilizzati, forniti da una società di consulenza francese, provengono da due aziende attive nel settore alimentare. Nel lavoro, diviso in tre sezioni, vengono affrontati i seguenti argomenti: (i) confronto tra metodi statistici e di Machine Learning mediante full cross-sectional forecasting; (ii) sperimentazione di quattro approcci al clustering delle serie temporali a supporto del cross-sectional forecasting; (iii) e inclusione di variabili esogene per la generazione delle previsioni tramite cross-sectional forecasting. I risultati degli esperimenti condotti testimoniano una superiorità dei metodi di Machine Learning rispetto ai benchmark statistici utilizzati. Si è inoltre verificato che l’applicazione di una corretta tecnica di clustering permette di migliorare sostanzialmente la qualità delle previsioni e, inoltre, che l’inclusione di variabili esogene è facilmente ottenibile tramite i metodi di ML e può portare ad un miglioramento delle loro prestazioni.

Food demand forecasting with machine learning : the prospects of cross-sectional training

PEREGO, LORENZO
2018/2019

Abstract

Machine Learning (ML) methods have been increasingly employed for time series forecasting. Recent studies have asserted the dependency of the obtained performance on the amount of training data. Cross-sectional forecasting is a technique that employs data from different time series to train the ML model. Also defined as cross-sectional training, it was recently developed to cope with the insufficient data given by short time series. This thesis will investigate the application of cross-sectional forecasting on supply chain demand. The work will be divided in three sections which will concern the following topics: (i) application of cross-sectional forecasting to the whole dataset by means of several ML methods; (ii) experimentation of four clustering approaches to cross-sectional forecasting; and (iii) inclusion of exogenous variables besides the historical demand data for the creation of the forecasts employing cross-sectional training. The experiments, performed on two datasets related to food distribution, resulted in the ML methods outperforming the statistical benchmarks. It was also shown that ML methods’ performance could be sensibly improved applying the right clustering approach, and that they were able to consider the influence of additional variables influencing demand reducing the forecasting error.
DALLERY, YVES
SAHIN, EVREN
ING - Scuola di Ingegneria Industriale e dell'Informazione
29-apr-2020
2018/2019
Nonostante l’applicazione dei metodi di Machine Learning (ML) per la previsione di serie temporali sia sempre più diffusa, sono state individuate delle problematiche legate alla quantità di dati disponibili per la fase di training. Per ovviare a questo problema è stata ideata la pratica del cross-sectional forecasting, che consiste nell’utilizzare dati provenienti da molteplici serie temporali. Questa tesi tratterà l’applicazione del cross-sectional forecasting per la previsione della domanda. I dati utilizzati, forniti da una società di consulenza francese, provengono da due aziende attive nel settore alimentare. Nel lavoro, diviso in tre sezioni, vengono affrontati i seguenti argomenti: (i) confronto tra metodi statistici e di Machine Learning mediante full cross-sectional forecasting; (ii) sperimentazione di quattro approcci al clustering delle serie temporali a supporto del cross-sectional forecasting; (iii) e inclusione di variabili esogene per la generazione delle previsioni tramite cross-sectional forecasting. I risultati degli esperimenti condotti testimoniano una superiorità dei metodi di Machine Learning rispetto ai benchmark statistici utilizzati. Si è inoltre verificato che l’applicazione di una corretta tecnica di clustering permette di migliorare sostanzialmente la qualità delle previsioni e, inoltre, che l’inclusione di variabili esogene è facilmente ottenibile tramite i metodi di ML e può portare ad un miglioramento delle loro prestazioni.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2020_04_Perego.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 2.63 MB
Formato Adobe PDF
2.63 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/154494