This study analyzed a possible approach for courier fleet forecasting for a small urban logistics startup. The model was developed from data provided by the host company Blink Last Mile, which were processed and merged with additional datasets taken from external sources. These available data had some known limitations described and dealt with as far as possible in the creation of the model. To achieve the highest possible accuracy, several regression algorithms were considered. These ranged from statistical models to different machine learning models. For each of them, parameters were optimized and then the results were compared from the standpoint of reported absolute errors. The comparison saw the Random Forest Regressor model emerge as the best. Finally, a dataset related to future orders was estimated, to which the winning model was applied. Although still improvable, the results obtained were deemed acceptable by the company. Thus, after an appropriate period of testing, the product could begin to be employed operationally.

In questo studio è stato analizzato un possibile approccio per il forecasting della flotta di corrieri per una startup di logistica urbana di piccole dimensioni. Il modello è stato sviluppato a partire da dati forniti dall'azienda ospitante Blink Last Mile, che sono stati trattati e uniti ad altri dataset aggiuntivi presi da fonti esterne. Questi dati a disposizione avevano alcune limitazioni note, che sono state descritte e, per quanto possibile, trattate nella creazione del modello. Al fine di ottenere la maggiore accuratezza possibile sono stati considerati diversi algoritmi di regressione. Questi spaziano da modelli statistici a modelli di machine learning. Per ognuno di essi sono stati ottimizzati i parametri e quindi confrontati i risultati dal punto di vista degli errori assoluti riportati. Dal confronto tra i diversi modelli, il migliore per gestire il fenomeno considerato è risultato essere il Random Forest regressor. Infine si è andati a stimare un dataset relativo a futuri ordini, al quale è stato applicato il modello vincente. I risultati ottenuti, per quanto ancora migliorabili, sono stati ritenuti accettabili dall'azienda. Questa, dopo un adeguato periodo di test del prodotto, potrebbe iniziare ad impiegarlo operativamente.

Fleet sizing forecasting model for a last-mile logistics start-up

PIZZORUSSO, SEBASTIANO
2021/2022

Abstract

This study analyzed a possible approach for courier fleet forecasting for a small urban logistics startup. The model was developed from data provided by the host company Blink Last Mile, which were processed and merged with additional datasets taken from external sources. These available data had some known limitations described and dealt with as far as possible in the creation of the model. To achieve the highest possible accuracy, several regression algorithms were considered. These ranged from statistical models to different machine learning models. For each of them, parameters were optimized and then the results were compared from the standpoint of reported absolute errors. The comparison saw the Random Forest Regressor model emerge as the best. Finally, a dataset related to future orders was estimated, to which the winning model was applied. Although still improvable, the results obtained were deemed acceptable by the company. Thus, after an appropriate period of testing, the product could begin to be employed operationally.
ING - Scuola di Ingegneria Industriale e dell'Informazione
20-dic-2022
2021/2022
In questo studio è stato analizzato un possibile approccio per il forecasting della flotta di corrieri per una startup di logistica urbana di piccole dimensioni. Il modello è stato sviluppato a partire da dati forniti dall'azienda ospitante Blink Last Mile, che sono stati trattati e uniti ad altri dataset aggiuntivi presi da fonti esterne. Questi dati a disposizione avevano alcune limitazioni note, che sono state descritte e, per quanto possibile, trattate nella creazione del modello. Al fine di ottenere la maggiore accuratezza possibile sono stati considerati diversi algoritmi di regressione. Questi spaziano da modelli statistici a modelli di machine learning. Per ognuno di essi sono stati ottimizzati i parametri e quindi confrontati i risultati dal punto di vista degli errori assoluti riportati. Dal confronto tra i diversi modelli, il migliore per gestire il fenomeno considerato è risultato essere il Random Forest regressor. Infine si è andati a stimare un dataset relativo a futuri ordini, al quale è stato applicato il modello vincente. I risultati ottenuti, per quanto ancora migliorabili, sono stati ritenuti accettabili dall'azienda. Questa, dopo un adeguato periodo di test del prodotto, potrebbe iniziare ad impiegarlo operativamente.
File allegati
File Dimensione Formato  
Pizzorusso_Thesis.pdf

accessibile in internet solo dagli utenti autorizzati

Dimensione 2.13 MB
Formato Adobe PDF
2.13 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/196974