Nowadays, dynamic pricing is a widely studied strategy in e-commerce due to the digital availability of the historical sales data. In this thesis, we focus on the pricing problem of an online travel agency (OTA) which sells flight tickets and additional services such as insurance or car rental. The OTA needs to determine the best price to offer to the customers at the time of the search to maximize its expected profit. The final price depends on the base ticket price and the estimation of the non-deterministic costs and revenues which we call the OCRE. We exploit machine learning and data analysis techniques to offer an OCRE estimation method as an alternative solution to the one currently adopted by the OTAs. At first, we applied a set of preprocessing techniques on past bookings data, which have the purpose of augmenting the existing features, and determine the subset of features which are the most relevant for the goal of estimating the OCRE. Then, we build a decision tree whose leafs uses ARMAX models for the prediction, which we call the ARMAX tree, combined with different feature selection techniques to provide a prediction of the OCRE. We compare the results of the ARMAX tree with the existing baseline adopted by OTAs and different version of a regression tree on a real-world dataset provided us by an OTA. We show that our model performs similarly to those available in the literature, and it is able to outperform them in a specific setting. We also show that clustering the feature values decreases the average prediction time of the existing solution without a significant loss in the prediction performance.

Oggi la tariffazione dinamica è una strategia ampiamente studiata nel commercio elettronico a causa della disponibilità digitale dei dati storici relativi alle vendite. In questa tesi, ci concentriamo sul problema di assegnare dei prezzi ai biglietti venduti da un'agenzia di viaggi online (OTA), la quale vende sia biglietti aerei, sia servizi aggiuntivi come assicurazione o noleggio auto. L'OTA deve determinare il miglior prezzo da offrire ai clienti al momento della ricerca al fine di massimizzare il profitto atteso. Il prezzo finale dipende dal prezzo del biglietto di base e dalla stima dei costi e delle entrate non deterministici, che è comunemente chiamato Other Cost and REvenues, (OCRE). In questa tesi, sono state sfruttate delle tecniche di apprendimento automatico e di analisi dei dati per offrire una stima dell'OCRE alternativa alla soluzione precedentemente utilizzata dalle OTAs. Il primo passo è stato quello di applicare le tecniche di preprocessing dei dati delle prenotazioni passate, per selezionare le feature relative alla prenotazione che meglio riescono a predire il valore dell'OCRE. Quindi, su tali dati è stato costruito un albero decisionale, le cui foglie utilizzando per la predizione modelli ARMAX, che chiamiamo albero ARMAX, per fornire una predizione accurata dell'OCRE. I risultati dell'albero ARMAX sono stati confrontati con le tecniche correntemente utilizzate dalle OTA e con due differenti alberi di regressione su un dataset fornitoci da un'OTA. I risultati mostrano che il modello proposto si comporta in modo simile alle baseline ed in uno specifico caso è in grado di fornire prestazioni migliori. Infine, abbiamo mostrato che utilizzare delle tecniche di clustering sui valori delle feature riesce a ridurre il tempo computazionalre richiesto dall'albero ARMAX per il calcolo della previsione medio senza una perdita significativa nell'accuratezza della stima.

Exploiting temporal dependencies to predict the revenue of flight tickets

KULATU, ELÇIN
2018/2019

Abstract

Nowadays, dynamic pricing is a widely studied strategy in e-commerce due to the digital availability of the historical sales data. In this thesis, we focus on the pricing problem of an online travel agency (OTA) which sells flight tickets and additional services such as insurance or car rental. The OTA needs to determine the best price to offer to the customers at the time of the search to maximize its expected profit. The final price depends on the base ticket price and the estimation of the non-deterministic costs and revenues which we call the OCRE. We exploit machine learning and data analysis techniques to offer an OCRE estimation method as an alternative solution to the one currently adopted by the OTAs. At first, we applied a set of preprocessing techniques on past bookings data, which have the purpose of augmenting the existing features, and determine the subset of features which are the most relevant for the goal of estimating the OCRE. Then, we build a decision tree whose leafs uses ARMAX models for the prediction, which we call the ARMAX tree, combined with different feature selection techniques to provide a prediction of the OCRE. We compare the results of the ARMAX tree with the existing baseline adopted by OTAs and different version of a regression tree on a real-world dataset provided us by an OTA. We show that our model performs similarly to those available in the literature, and it is able to outperform them in a specific setting. We also show that clustering the feature values decreases the average prediction time of the existing solution without a significant loss in the prediction performance.
TROVÒ, FRANCESCO
ING - Scuola di Ingegneria Industriale e dell'Informazione
17-dic-2019
2018/2019
Oggi la tariffazione dinamica è una strategia ampiamente studiata nel commercio elettronico a causa della disponibilità digitale dei dati storici relativi alle vendite. In questa tesi, ci concentriamo sul problema di assegnare dei prezzi ai biglietti venduti da un'agenzia di viaggi online (OTA), la quale vende sia biglietti aerei, sia servizi aggiuntivi come assicurazione o noleggio auto. L'OTA deve determinare il miglior prezzo da offrire ai clienti al momento della ricerca al fine di massimizzare il profitto atteso. Il prezzo finale dipende dal prezzo del biglietto di base e dalla stima dei costi e delle entrate non deterministici, che è comunemente chiamato Other Cost and REvenues, (OCRE). In questa tesi, sono state sfruttate delle tecniche di apprendimento automatico e di analisi dei dati per offrire una stima dell'OCRE alternativa alla soluzione precedentemente utilizzata dalle OTAs. Il primo passo è stato quello di applicare le tecniche di preprocessing dei dati delle prenotazioni passate, per selezionare le feature relative alla prenotazione che meglio riescono a predire il valore dell'OCRE. Quindi, su tali dati è stato costruito un albero decisionale, le cui foglie utilizzando per la predizione modelli ARMAX, che chiamiamo albero ARMAX, per fornire una predizione accurata dell'OCRE. I risultati dell'albero ARMAX sono stati confrontati con le tecniche correntemente utilizzate dalle OTA e con due differenti alberi di regressione su un dataset fornitoci da un'OTA. I risultati mostrano che il modello proposto si comporta in modo simile alle baseline ed in uno specifico caso è in grado di fornire prestazioni migliori. Infine, abbiamo mostrato che utilizzare delle tecniche di clustering sui valori delle feature riesce a ridurre il tempo computazionalre richiesto dall'albero ARMAX per il calcolo della previsione medio senza una perdita significativa nell'accuratezza della stima.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2019_12_Kulatu.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Thesis text
Dimensione 1.53 MB
Formato Adobe PDF
1.53 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/150625