This thesis investigates sales forecasts for thousands of retail products across the most important hypermarkets and supermarkets in Italy. We compare a benchmark model in this sector, the meta-learning framework, developed by Ma and Fildes (2021), which relies on advanced deep Convolutional Neural Networks with a Long Short Term Memory (LSTM) networks we propose. Moreover, we introduce a probabilistic forecasting framework to build confidence intervals for the Meta Learner and LSTM models through Conformal Prediction, a non parametric method. Experiments based on Circana ILD weekly data demonstrate that direct forecasts from LSTM models strongly outperform the meta-learning approach in terms of all considered metrics. Additionally, LSTM models offer greater interpretability than the meta-learning framework, as they require the explanation of only one model compared to the multiple base forecasters utilized in the meta-learning approach.

Questa tesi analizza le previsioni di vendita per migliaia di prodotti al dettaglio nei principali ipermercati e supermercati in Italia. Si confronta in questo settore, il framework di meta-learning, sviluppato da Ma and Fildes (2021), che si basa su reti neurali convoluzionali profonde avanzate, con le reti Long Short Term Memory (LSTM) che proponiamo. Inoltre, introduciamo un framework di previsione probabilistica per costruire intervalli di confidenza per i modelli di Meta Learner e LSTM tramite la Conformal Prediction, un metodo non parametrico. Gli esperimenti basati su dati settimanali ILD di Circana dimostrano che le previsioni dirette dai modelli LSTM superano nettamente l'approccio di meta-apprendimento in termini di tutte le metriche considerate. Inoltre, i modelli LSTM offrono una maggiore interpretabilità rispetto al framework di meta-apprendimento, poiché richiedono l'interpretazione di un solo modello rispetto ai numerosi previsori di base utilizzati nell'approccio di meta-apprendimento.

SKU sales forecasting: meta learner versus LSTM

Quartuccio, Mattia
2024/2025

Abstract

This thesis investigates sales forecasts for thousands of retail products across the most important hypermarkets and supermarkets in Italy. We compare a benchmark model in this sector, the meta-learning framework, developed by Ma and Fildes (2021), which relies on advanced deep Convolutional Neural Networks with a Long Short Term Memory (LSTM) networks we propose. Moreover, we introduce a probabilistic forecasting framework to build confidence intervals for the Meta Learner and LSTM models through Conformal Prediction, a non parametric method. Experiments based on Circana ILD weekly data demonstrate that direct forecasts from LSTM models strongly outperform the meta-learning approach in terms of all considered metrics. Additionally, LSTM models offer greater interpretability than the meta-learning framework, as they require the explanation of only one model compared to the multiple base forecasters utilized in the meta-learning approach.
IUFFMANN GHEZZI, ALESSANDRO
ING - Scuola di Ingegneria Industriale e dell'Informazione
11-dic-2024
2024/2025
Questa tesi analizza le previsioni di vendita per migliaia di prodotti al dettaglio nei principali ipermercati e supermercati in Italia. Si confronta in questo settore, il framework di meta-learning, sviluppato da Ma and Fildes (2021), che si basa su reti neurali convoluzionali profonde avanzate, con le reti Long Short Term Memory (LSTM) che proponiamo. Inoltre, introduciamo un framework di previsione probabilistica per costruire intervalli di confidenza per i modelli di Meta Learner e LSTM tramite la Conformal Prediction, un metodo non parametrico. Gli esperimenti basati su dati settimanali ILD di Circana dimostrano che le previsioni dirette dai modelli LSTM superano nettamente l'approccio di meta-apprendimento in termini di tutte le metriche considerate. Inoltre, i modelli LSTM offrono una maggiore interpretabilità rispetto al framework di meta-apprendimento, poiché richiedono l'interpretazione di un solo modello rispetto ai numerosi previsori di base utilizzati nell'approccio di meta-apprendimento.
File allegati
File Dimensione Formato  
2024_12_Quartuccio_Executive Summary.pdf

accessibile in internet per tutti

Descrizione: Executive summary
Dimensione 985.53 kB
Formato Adobe PDF
985.53 kB Adobe PDF Visualizza/Apri
2024_12_Quartuccio_Tesi.pdf

accessibile in internet per tutti

Descrizione: Tesi
Dimensione 2.76 MB
Formato Adobe PDF
2.76 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/230603