International reports quantify that more than 14 trillion USD per year, since 2030, will be unlocked thanks to the automation of industrial and business processes. Automation of pricing tasks, in particular, is estimated to unlock value for about 0.5 trillion USD per year worldwide. In this work, we investigate this class of problems relying on fully data-driven methodologies. One of the main challenges in these settings usually concerns how scarce data can be effectively adopted to optimize the processes. We present a novel dynamic pricing approach that can incorporate business logic and operate in scenarios where industry needs are hard to assess for most of the other works. We focus on a monopolistic pricing problem on e-commerce with volume discounts and a strong seasonality, where the objective function is a convex combination between margins and turnover and only transaction data are available. We design an online learning (bandit) algorithm, namely PSV-B, in which the relationship controlling sales is decomposed into two terms, the first depending on seasonality and the second depending on the price elasticity. Furthermore, to alleviate data scarcity issues, we assume this relationship to be monotonically decreasing in price and we design a novel Bayesian regression algorithm capable of capturing such behavior. We develop a new methodology to compute optimal volume discounts starting from the prices proposed by our algorithm. This approach is evaluated both in synthetic environments and through a real-world experimental campaign. Model's design choices are validated performing multiple simulations, monotonicity comes up as a crucial feature when dealing with uncertainty and nonstationarity of the market. To quantify the business value unlocked by this approach, we performed a real-world, 4-month-long, A/B testing experiment, where our algorithm PSV-B, corresponding to A configuration, has been compared with human pricing specialists, corresponding to the B configuration. At the end of the experiment, PSV-B produced a total turnover of about 300 KEuros with a performance that is better than the performance of B configuration for about 55%.

Report internazionali stimano che, a partire dal 2030, l'automazione di processi industriali ed aziendali genererà valore per più di 14 trilioni di dollari. L'automazione del pricing di prodotti, in particolare, genererà circa 0.5 trilioni di dollari a livello mondiale. In questo lavoro, studiamo questa classe di problemi basandoci esclusivamente su metodologie data-driven. Una delle sfide principali in questo contesto è quella di costruire una soluzione in grado di operare anche in scarsità di dati. Noi presentiamo un nuovo algoritmo di pricing dinamico che sia in grado di incorporare logiche di business e operare in scenari in cui i bisogni delle aziende sono difficili da fronteggiare per le altre soluzioni esistenti. Ci concentriamo su un problema di pricing monopolistico su un e-commerce, dove vige una forte stagionalità e una politica di scontistica per quantità. La funzione obiettivo sarà una combinazione convessa del margine netto operativo e del fatturato, e l'algoritmo avrà accesso solamente a dati transazionali. In questo lavoro progettiamo un algoritmo di online learning (bandit), chiamato PSV-B, dove i volumi di vendita sono decomposti in due componenti: la prima dipendente dalla stagionalità e dal trend di mercato, mentre la seconda dalla curva di domanda dei clienti. Inoltre, per mitigare la scarsità di dati, assumiamo che all'aumentare dei prezzi i volumi decrescano. Proponiamo un nuovo modello di regressione Bayesiana integrandovi la relazione monotona tra i volumi e la seconda componente. Sviluppiamo una nuova metodologia che, partendo dal prezzo proposto dal nostro algoritmo di pricing, calcoli una politica di scontistica per quantità ottimale. Abbiamo valutato questo approccio sia in ambienti simulati che con una campagna sperimentale reale. Le scelte di design del modello sono state validate attraverso molteplici simulazioni, la monotonicità si è rivelata una caratteristica determinante per gestire la rumorosità dei dati e la nonstazionarietà nella curva di domanda. Per quantificare il valore economico di questo approccio, abbiamo effettuato un A/ B test lungo 4 mesi su un e-commerce italiano. Il nostro algoritmo, PSV-B, è stato valutato rispetto ad un pricing effettuato da specialisti umani. Alla fine dell'esperimento, PSV-B ha prodotto un fatturato totale per 300.000 Euro, con una performance migliore rispetto alla configurazione B di circa il 55%.

A multi-armed bandit approach to dynamic pricing

Genalti, Gianmarco
2020/2021

Abstract

International reports quantify that more than 14 trillion USD per year, since 2030, will be unlocked thanks to the automation of industrial and business processes. Automation of pricing tasks, in particular, is estimated to unlock value for about 0.5 trillion USD per year worldwide. In this work, we investigate this class of problems relying on fully data-driven methodologies. One of the main challenges in these settings usually concerns how scarce data can be effectively adopted to optimize the processes. We present a novel dynamic pricing approach that can incorporate business logic and operate in scenarios where industry needs are hard to assess for most of the other works. We focus on a monopolistic pricing problem on e-commerce with volume discounts and a strong seasonality, where the objective function is a convex combination between margins and turnover and only transaction data are available. We design an online learning (bandit) algorithm, namely PSV-B, in which the relationship controlling sales is decomposed into two terms, the first depending on seasonality and the second depending on the price elasticity. Furthermore, to alleviate data scarcity issues, we assume this relationship to be monotonically decreasing in price and we design a novel Bayesian regression algorithm capable of capturing such behavior. We develop a new methodology to compute optimal volume discounts starting from the prices proposed by our algorithm. This approach is evaluated both in synthetic environments and through a real-world experimental campaign. Model's design choices are validated performing multiple simulations, monotonicity comes up as a crucial feature when dealing with uncertainty and nonstationarity of the market. To quantify the business value unlocked by this approach, we performed a real-world, 4-month-long, A/B testing experiment, where our algorithm PSV-B, corresponding to A configuration, has been compared with human pricing specialists, corresponding to the B configuration. At the end of the experiment, PSV-B produced a total turnover of about 300 KEuros with a performance that is better than the performance of B configuration for about 55%.
MUSSI, MARCO
NUARA, ALESSANDRO
ING - Scuola di Ingegneria Industriale e dell'Informazione
21-dic-2021
2020/2021
Report internazionali stimano che, a partire dal 2030, l'automazione di processi industriali ed aziendali genererà valore per più di 14 trilioni di dollari. L'automazione del pricing di prodotti, in particolare, genererà circa 0.5 trilioni di dollari a livello mondiale. In questo lavoro, studiamo questa classe di problemi basandoci esclusivamente su metodologie data-driven. Una delle sfide principali in questo contesto è quella di costruire una soluzione in grado di operare anche in scarsità di dati. Noi presentiamo un nuovo algoritmo di pricing dinamico che sia in grado di incorporare logiche di business e operare in scenari in cui i bisogni delle aziende sono difficili da fronteggiare per le altre soluzioni esistenti. Ci concentriamo su un problema di pricing monopolistico su un e-commerce, dove vige una forte stagionalità e una politica di scontistica per quantità. La funzione obiettivo sarà una combinazione convessa del margine netto operativo e del fatturato, e l'algoritmo avrà accesso solamente a dati transazionali. In questo lavoro progettiamo un algoritmo di online learning (bandit), chiamato PSV-B, dove i volumi di vendita sono decomposti in due componenti: la prima dipendente dalla stagionalità e dal trend di mercato, mentre la seconda dalla curva di domanda dei clienti. Inoltre, per mitigare la scarsità di dati, assumiamo che all'aumentare dei prezzi i volumi decrescano. Proponiamo un nuovo modello di regressione Bayesiana integrandovi la relazione monotona tra i volumi e la seconda componente. Sviluppiamo una nuova metodologia che, partendo dal prezzo proposto dal nostro algoritmo di pricing, calcoli una politica di scontistica per quantità ottimale. Abbiamo valutato questo approccio sia in ambienti simulati che con una campagna sperimentale reale. Le scelte di design del modello sono state validate attraverso molteplici simulazioni, la monotonicità si è rivelata una caratteristica determinante per gestire la rumorosità dei dati e la nonstazionarietà nella curva di domanda. Per quantificare il valore economico di questo approccio, abbiamo effettuato un A/ B test lungo 4 mesi su un e-commerce italiano. Il nostro algoritmo, PSV-B, è stato valutato rispetto ad un pricing effettuato da specialisti umani. Alla fine dell'esperimento, PSV-B ha prodotto un fatturato totale per 300.000 Euro, con una performance migliore rispetto alla configurazione B di circa il 55%.
File allegati
File Dimensione Formato  
genalti_thesis.pdf

Open Access dal 30/11/2022

Descrizione: Tesi di Laurea Magistrale di Gianmarco Genalti.
Dimensione 730.87 kB
Formato Adobe PDF
730.87 kB Adobe PDF Visualizza/Apri
genalti_executive_summary.pdf

Open Access dal 30/11/2022

Descrizione: Executive Summary della Tesi di Laurea Magistrale di Gianmarco Genalti
Dimensione 463.57 kB
Formato Adobe PDF
463.57 kB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/183733