Our work is developed in the applicative context of a pricing problem, in which a seller needs to determine the optimal price for an unlimited amount of non-perishable products, without having information on how the buyers will evaluate them. Different prizes, called bonuses, are given to the seller, when she manages to sell a number of products that is higher than certain thresholds. The goal is to maximize her profit, coming both from the sale of products and from revenues obtained from the collection of bonuses. Our study was aimed to produce a computational model to deal with this kind of situations. After reviewing some of the works already done in literature, we present our solution. Our model consists of a Markov Decision Process, exploiting a Bayesian approach to deal with the lack of information: estimates about the expected sales are kept for each possible action, and updated as soon as new information becomes available. We also include in the model the risk aversion of the decision maker, with the introduction of a truncation on these estimates that leads to pessimism in expected future sales. Due to the large computational time required by practical cases, in which the number of daily requests of a product may be really large, we introduced some approximations, like an aggregation of the states to reduce the complexity of the model and the Monte Carlo method to speed up the computation of transition probabilities between them. We evaluated the model in many realistic configurations within the application context we study and analysed its behaviour in practical examples to confirm the strengths of the implemented methods, showing the results of our experiments and comparing them with the optimal solutions.

Il nostro lavoro si sviluppa in un contesto applicativo di un problema di pricing, in cui un venditore ha bisogno di determinare il prezzo ottimale per un numero illimitato di prodotti non deperibili, senza avere informazioni su come gli acquirenti li valuteranno. Dei bonus sono dati al venditore, quando riesce a vendere un numero di prodotti superiore a determinate soglie. L’obiettivo è quello di massimizzare il suo profitto, derivato sia dalla vendita di prodotti sia dai guadagni ottenuti dalla raccolta di bonus. Il nostro studio era finalizzato a produrre un modello computazionale per affrontare questo tipo di situazione. Dopo aver esaminato alcune delle opere in letteratura, presentiamo la nostra soluzione. Il nostro modello è costituito da un processo di decisione di Markov, sfruttando un approccio bayesiano per far fronte alla mancanza di informazioni: stime sulle vendite attese per ogni possibile azione vengono calcolate ed aggiornate dall’algoritmo proposto non appena nuove informazioni sono disponibili. Nella soluzione proposta è stata anchepresa in considerazione l’avversione al rischio del venditore, grazie all’introduzione di un troncamento di queste stime che porta a un pessimismo nelle vendite future previste. A causa del grande tempo computazionale richiesto dai casi pratici, in cui il numero di richieste quotidiane di un prodotto può essere molto alto, abbiamo introdotto alcune approssimazioni, come un’aggregazione di stati per ridurre la complessità del modello e il metodo Monte Carlo per accelerare il calcolo delle probabilità di transizione tra di essi. Abbiamo valutato il modello in molte configurazioni realistiche nel contesto dell’applicazione e analizzato il suo comportamento in esempi pratici per confermare i punti di forza dei metodi implementati, mostrando i risultati dei nostri esperimenti e confrontandoli con le soluzioni ottimali.

Bayesian learning for flight tickets pricing with performance-based bonus

MAPELLI, DARIO;ENERLI, DAMIANO
2015/2016

Abstract

Our work is developed in the applicative context of a pricing problem, in which a seller needs to determine the optimal price for an unlimited amount of non-perishable products, without having information on how the buyers will evaluate them. Different prizes, called bonuses, are given to the seller, when she manages to sell a number of products that is higher than certain thresholds. The goal is to maximize her profit, coming both from the sale of products and from revenues obtained from the collection of bonuses. Our study was aimed to produce a computational model to deal with this kind of situations. After reviewing some of the works already done in literature, we present our solution. Our model consists of a Markov Decision Process, exploiting a Bayesian approach to deal with the lack of information: estimates about the expected sales are kept for each possible action, and updated as soon as new information becomes available. We also include in the model the risk aversion of the decision maker, with the introduction of a truncation on these estimates that leads to pessimism in expected future sales. Due to the large computational time required by practical cases, in which the number of daily requests of a product may be really large, we introduced some approximations, like an aggregation of the states to reduce the complexity of the model and the Monte Carlo method to speed up the computation of transition probabilities between them. We evaluated the model in many realistic configurations within the application context we study and analysed its behaviour in practical examples to confirm the strengths of the implemented methods, showing the results of our experiments and comparing them with the optimal solutions.
PALADINO, STEFANO
PIROTTA, MATTEO
TROVÒ, FRANCESCO
ING - Scuola di Ingegneria Industriale e dell'Informazione
28-apr-2017
2015/2016
Il nostro lavoro si sviluppa in un contesto applicativo di un problema di pricing, in cui un venditore ha bisogno di determinare il prezzo ottimale per un numero illimitato di prodotti non deperibili, senza avere informazioni su come gli acquirenti li valuteranno. Dei bonus sono dati al venditore, quando riesce a vendere un numero di prodotti superiore a determinate soglie. L’obiettivo è quello di massimizzare il suo profitto, derivato sia dalla vendita di prodotti sia dai guadagni ottenuti dalla raccolta di bonus. Il nostro studio era finalizzato a produrre un modello computazionale per affrontare questo tipo di situazione. Dopo aver esaminato alcune delle opere in letteratura, presentiamo la nostra soluzione. Il nostro modello è costituito da un processo di decisione di Markov, sfruttando un approccio bayesiano per far fronte alla mancanza di informazioni: stime sulle vendite attese per ogni possibile azione vengono calcolate ed aggiornate dall’algoritmo proposto non appena nuove informazioni sono disponibili. Nella soluzione proposta è stata anchepresa in considerazione l’avversione al rischio del venditore, grazie all’introduzione di un troncamento di queste stime che porta a un pessimismo nelle vendite future previste. A causa del grande tempo computazionale richiesto dai casi pratici, in cui il numero di richieste quotidiane di un prodotto può essere molto alto, abbiamo introdotto alcune approssimazioni, come un’aggregazione di stati per ridurre la complessità del modello e il metodo Monte Carlo per accelerare il calcolo delle probabilità di transizione tra di essi. Abbiamo valutato il modello in molte configurazioni realistiche nel contesto dell’applicazione e analizzato il suo comportamento in esempi pratici per confermare i punti di forza dei metodi implementati, mostrando i risultati dei nostri esperimenti e confrontandoli con le soluzioni ottimali.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2017_04_Enerli_Mapelli.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Testo della tesi
Dimensione 4.14 MB
Formato Adobe PDF
4.14 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/133746