Recommender systems serve the purpose of recommending items to users in online environments such as a streaming service, an E-commerce, a news ag- gregator. As both computational and networking capabilities significantly im- proved over the years, the volumes of user activity data that are collected exponentially grew as well, providing intelligent systems like modern recom- mender systems with additional, precious sources of information. An example of voluminous and potentially valuable kind of data is given by impressions, which are tracked records of users simply being displayed items on online pages. In this work we will perform an analysis of impressions that occurs repeatedly between the same user-item couples, on an impression dataset from a luxury fashion e-commerce. We will observe interesting behavioral patterns, which suggest that users that views items multiple times interacts more frequently with them, and we will try to model such patterns. Finally, we will demonstrate the potential value of this source of information by incorporating it offline in the existing recommendation pipeline, implementing a plug-in weighting model that, based on previous repeated impressions, boosts or penalizes the recom- mendation score given to items by the the recommendation model in place. We will see that it was possible to increase the recommendation accuracy without giving up diversity, proving that in this context impressions can represent a valid and informative input to the recommender system.

I sistemi di raccomandazione svolgono la funzione di raccomandare articoli agli utenti di piattaforme online come servizi di straming, E-commerce, siti di notizie. Con la grande espansione delle capacità computazionali e di rete degli ultimi anni, anche i volumi dei dati raccolti durante le più svariate at- tività online degli utenti sono cresciuti esponenzialmente, fornendo a sistemi intelligenti come i moderni sistemi di raccomandazione nuove e preziose fonti di informazioni. Un esempio rilevante di fonte di dati voluminosa e potenzial- mente ricca di informazione è dato dalle impressioni, che registrano l’avvenuta visualizzazione di un articolo da parte dell’utente su una pagina web. Questo lavoro includerà un’analisi delle impressioni che avvengono ripetuta- mente tra le stesse coppie utente-articolo, su un dataset di un E-commerce di moda di fascia alta. Osserveremo delle tendenze comportamentali interes- santi, le quali suggeriscono che gli utenti che visualizzano ripetutamente degli articoli siano più propensi ad interagire con gli stessi, e tenteremo di model- lare ciò che osserveremo. Infine, dimostreremo il potenziale valore di questa fonte di informazione incorporandone i dati nella pipeline di raccomandazione esistente, testandola offline; ciò verrà realizzato implementando un modello supplementare che, basandosi sulle precedenti impressioni ripetute, si innesta in coda all’algoritmo di raccomandazione esistente e ne pesa i valori calcolati, favorendo o penalizzando gli articoli candidati alla raccomandazione. Vedremo come sia stato possibile migliorare l’accuratezza delle raccomandazioni senza intaccarne in modo significativo la diversità, dimostrando come in questo con- testo le impressions possano rappresentare un input prezioso e ricco di infor- mazione per il sistema di raccomandazione.

Improving an e-commerce's recommendations accuracy by exploiting impression data

Rota, Francesco
2021/2022

Abstract

Recommender systems serve the purpose of recommending items to users in online environments such as a streaming service, an E-commerce, a news ag- gregator. As both computational and networking capabilities significantly im- proved over the years, the volumes of user activity data that are collected exponentially grew as well, providing intelligent systems like modern recom- mender systems with additional, precious sources of information. An example of voluminous and potentially valuable kind of data is given by impressions, which are tracked records of users simply being displayed items on online pages. In this work we will perform an analysis of impressions that occurs repeatedly between the same user-item couples, on an impression dataset from a luxury fashion e-commerce. We will observe interesting behavioral patterns, which suggest that users that views items multiple times interacts more frequently with them, and we will try to model such patterns. Finally, we will demonstrate the potential value of this source of information by incorporating it offline in the existing recommendation pipeline, implementing a plug-in weighting model that, based on previous repeated impressions, boosts or penalizes the recom- mendation score given to items by the the recommendation model in place. We will see that it was possible to increase the recommendation accuracy without giving up diversity, proving that in this context impressions can represent a valid and informative input to the recommender system.
FERRARI DACREMA, MAURIZIO
ING - Scuola di Ingegneria Industriale e dell'Informazione
28-apr-2022
2021/2022
I sistemi di raccomandazione svolgono la funzione di raccomandare articoli agli utenti di piattaforme online come servizi di straming, E-commerce, siti di notizie. Con la grande espansione delle capacità computazionali e di rete degli ultimi anni, anche i volumi dei dati raccolti durante le più svariate at- tività online degli utenti sono cresciuti esponenzialmente, fornendo a sistemi intelligenti come i moderni sistemi di raccomandazione nuove e preziose fonti di informazioni. Un esempio rilevante di fonte di dati voluminosa e potenzial- mente ricca di informazione è dato dalle impressioni, che registrano l’avvenuta visualizzazione di un articolo da parte dell’utente su una pagina web. Questo lavoro includerà un’analisi delle impressioni che avvengono ripetuta- mente tra le stesse coppie utente-articolo, su un dataset di un E-commerce di moda di fascia alta. Osserveremo delle tendenze comportamentali interes- santi, le quali suggeriscono che gli utenti che visualizzano ripetutamente degli articoli siano più propensi ad interagire con gli stessi, e tenteremo di model- lare ciò che osserveremo. Infine, dimostreremo il potenziale valore di questa fonte di informazione incorporandone i dati nella pipeline di raccomandazione esistente, testandola offline; ciò verrà realizzato implementando un modello supplementare che, basandosi sulle precedenti impressioni ripetute, si innesta in coda all’algoritmo di raccomandazione esistente e ne pesa i valori calcolati, favorendo o penalizzando gli articoli candidati alla raccomandazione. Vedremo come sia stato possibile migliorare l’accuratezza delle raccomandazioni senza intaccarne in modo significativo la diversità, dimostrando come in questo con- testo le impressions possano rappresentare un input prezioso e ricco di infor- mazione per il sistema di raccomandazione.
File allegati
File Dimensione Formato  
Improving_an_e_commerce_s_recommendations_relevance_by_exploiting_past_exposure_data.pdf

solo utenti autorizzati dal 08/04/2023

Dimensione 1.32 MB
Formato Adobe PDF
1.32 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/187510