The market for long-term rental of rooms in large cities has observed a considerable increase in recent years, recording in some cities an increase in demand of more than 80%. Given the reduced offer of rooms and a still limited flow of users, until some years ago, the few existing players in the market could afford to manage the room pricing manually. However, the simultaneous growth in the number of rooms to rent and the presence of ever stronger competition have made the management of the pricing process through automatic systems an essential need. This led DoveVivo, the first and largest Italian co-living company, to invest in technological solutions to automate the room pricing process. This project, born from the collaboration with the Politecnico di Milano, aims to create models and algorithms able to capture the peculiarities of this problem and automatically generate pricing schemes for rented rooms. The approach followed to develop these models is the data-driven one, motivated by the fact that the target company of this study has a large database of historical data, which can be used to extract the information necessary to build an accurate model. Our contribution is to provide all the data analysis and machine learning tools necessary to transform the raw data collected by DoveVivo into useful information to support the corporate pricing process. We propose two different formulations of the problem. Initially, we want to replicate the manual work performed by the internal pricing team at DoveVivo, building models that minimize the estimated error of the listing price. Then, we propose a second approach that is based on identifying and assigning the best price to a room that minimizes the number of vacancy days. From the experiments conducted on real-world data we obtained satisfactory results: we get an error of about 3% when estimating the price set by the DoveVivo pricing team and show that it is possible to increase the current listing prices, up to a maximum of 5%, without risking to have days of vacancy.

Il mercato degli affitti a lungo termine di stanze nelle grandi città ha conosciuto un incremento considerevole negli ultimi anni, registrando in alcune città un aumento della domanda superiore all’80%. Data l’offerta di stanze ridotta e un flusso di utenti ancora contenuto, fino a qualche anno fa i pochi player sul mercato esistenti potevano permettersi di gestire manualmente il pricing delle stanze. Tuttavia, la contemporanea crescita del numero di stanze da affittare e la presenza di una concorrenza sempre più ampia hanno reso la gestione del processo di pricing attraverso sistemi automatici una necessità improrogabile. Questo ha portato DoveVivo, la prima e la più grande azienda italiana di co-living, ad investire in soluzioni tecnologiche per automatizzare il processo di pricing delle stanze. Questo progetto, nato dalla collaborazione con il Politecnico di Milano, si propone di creare modelli e algoritmi capaci di catturare le peculiarità di questo problema e di generare in maniera automatica degli schemi di pricing per le stanze in affitto. L'approccio seguito per sviluppare tali modelli è quello data-driven, motivato dal fatto che l'azienda target di questo studio possiede dei dati storici, i quali possono essere utilizzati per estrarre le informazioni necessarie per costruire modelli accurati. Il nostro contributo consiste nel fornire tutti gli strumenti di data analysis e machine learning necessari per trasformare i dati grezzi raccolti in informazioni utili per supportare il processo di decision making aziendale. Proponiamo due diverse formulazioni del problema. Inizialmente vogliamo replicare il lavoro manuale eseguito dal team di pricing interno a DoveVivo, costruendo modelli che minimizzano l'errore stimato del prezzo di listino. Infine, partendo dall'idea che maggiore è il prezzo assegnato ad una stanza, maggiore sarà la probabilità che questa rimanga sfitta per un più lungo periodo di tempo, proponiamo un secondo approccio che si basa sull'identificare ed assegnare il più alto prezzo ad una stanza che minimizzi il numero di giorni di sfitto. %Tali obbiettivi sono stati raggiunti grazie all'applicazione di una procedura di machine learning rigorosa. Inizialmente, i dati vengono processati per ottenere un data set privo di inconsistenze, valori mancanti e outlier. In seguito mostriamo come è possibile raffinare il data set integrando ulteriori informazioni da fonti esterne. I dati vengono poi forniti come input a diversi modelli supervisionati di machine learnig e, infine, mostriamo le performance ottenute dai nostri algoritmi. Dai nostri esperimenti abbiamo ottenuto dei risultati molto soddisfacenti a parere degli esperiti di pricing dell'azienda. Cercando di emulare l'assegnamento dei prezzi che fa DoveVivo attualmente, otteniamo un errore di circa il 3% rispetto a quanto fatto dal team di pricing correntemente. Mentre i risultati della seconda formulazione ci mostrano come sia possibile incrementare i prezzi attuali di listino, fino ad un massimo del 5%, senza rischiare di avere periodi significativi di sfitto.

Development of machine learning algorithms for long-term room rentals pricing

GIANOLA, GIOVANNI MARIA
2018/2019

Abstract

The market for long-term rental of rooms in large cities has observed a considerable increase in recent years, recording in some cities an increase in demand of more than 80%. Given the reduced offer of rooms and a still limited flow of users, until some years ago, the few existing players in the market could afford to manage the room pricing manually. However, the simultaneous growth in the number of rooms to rent and the presence of ever stronger competition have made the management of the pricing process through automatic systems an essential need. This led DoveVivo, the first and largest Italian co-living company, to invest in technological solutions to automate the room pricing process. This project, born from the collaboration with the Politecnico di Milano, aims to create models and algorithms able to capture the peculiarities of this problem and automatically generate pricing schemes for rented rooms. The approach followed to develop these models is the data-driven one, motivated by the fact that the target company of this study has a large database of historical data, which can be used to extract the information necessary to build an accurate model. Our contribution is to provide all the data analysis and machine learning tools necessary to transform the raw data collected by DoveVivo into useful information to support the corporate pricing process. We propose two different formulations of the problem. Initially, we want to replicate the manual work performed by the internal pricing team at DoveVivo, building models that minimize the estimated error of the listing price. Then, we propose a second approach that is based on identifying and assigning the best price to a room that minimizes the number of vacancy days. From the experiments conducted on real-world data we obtained satisfactory results: we get an error of about 3% when estimating the price set by the DoveVivo pricing team and show that it is possible to increase the current listing prices, up to a maximum of 5%, without risking to have days of vacancy.
NUARA, ALESSANDRO
ROMANO, GIULIA
TROVÒ, FRANCESCO
ING - Scuola di Ingegneria Industriale e dell'Informazione
29-apr-2020
2018/2019
Il mercato degli affitti a lungo termine di stanze nelle grandi città ha conosciuto un incremento considerevole negli ultimi anni, registrando in alcune città un aumento della domanda superiore all’80%. Data l’offerta di stanze ridotta e un flusso di utenti ancora contenuto, fino a qualche anno fa i pochi player sul mercato esistenti potevano permettersi di gestire manualmente il pricing delle stanze. Tuttavia, la contemporanea crescita del numero di stanze da affittare e la presenza di una concorrenza sempre più ampia hanno reso la gestione del processo di pricing attraverso sistemi automatici una necessità improrogabile. Questo ha portato DoveVivo, la prima e la più grande azienda italiana di co-living, ad investire in soluzioni tecnologiche per automatizzare il processo di pricing delle stanze. Questo progetto, nato dalla collaborazione con il Politecnico di Milano, si propone di creare modelli e algoritmi capaci di catturare le peculiarità di questo problema e di generare in maniera automatica degli schemi di pricing per le stanze in affitto. L'approccio seguito per sviluppare tali modelli è quello data-driven, motivato dal fatto che l'azienda target di questo studio possiede dei dati storici, i quali possono essere utilizzati per estrarre le informazioni necessarie per costruire modelli accurati. Il nostro contributo consiste nel fornire tutti gli strumenti di data analysis e machine learning necessari per trasformare i dati grezzi raccolti in informazioni utili per supportare il processo di decision making aziendale. Proponiamo due diverse formulazioni del problema. Inizialmente vogliamo replicare il lavoro manuale eseguito dal team di pricing interno a DoveVivo, costruendo modelli che minimizzano l'errore stimato del prezzo di listino. Infine, partendo dall'idea che maggiore è il prezzo assegnato ad una stanza, maggiore sarà la probabilità che questa rimanga sfitta per un più lungo periodo di tempo, proponiamo un secondo approccio che si basa sull'identificare ed assegnare il più alto prezzo ad una stanza che minimizzi il numero di giorni di sfitto. %Tali obbiettivi sono stati raggiunti grazie all'applicazione di una procedura di machine learning rigorosa. Inizialmente, i dati vengono processati per ottenere un data set privo di inconsistenze, valori mancanti e outlier. In seguito mostriamo come è possibile raffinare il data set integrando ulteriori informazioni da fonti esterne. I dati vengono poi forniti come input a diversi modelli supervisionati di machine learnig e, infine, mostriamo le performance ottenute dai nostri algoritmi. Dai nostri esperimenti abbiamo ottenuto dei risultati molto soddisfacenti a parere degli esperiti di pricing dell'azienda. Cercando di emulare l'assegnamento dei prezzi che fa DoveVivo attualmente, otteniamo un errore di circa il 3% rispetto a quanto fatto dal team di pricing correntemente. Mentre i risultati della seconda formulazione ci mostrano come sia possibile incrementare i prezzi attuali di listino, fino ad un massimo del 5%, senza rischiare di avere periodi significativi di sfitto.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Giovanni_Gianola_Development of machine learning algorithms for long-term rooms rentals pricing.pdf

accessibile in internet per tutti

Descrizione: Thesis text
Dimensione 2.78 MB
Formato Adobe PDF
2.78 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/165493