The last decade has seen an exponential increase in the amount of available information thanks to the ever-growing number of connected devices and interaction of users with online content like social media, e-commerce, etc. While this translates in more choices for users given their diverse set of preferences, it makes it difficult for them to explore this vast amount of information. Recommender systems (RS) aim to alleviate this problem by filtering the content offered to users by predicting either the rating of items by users or the propensity of users to like specific items. The latter is known as Top-N recommendation in the RS community and it refers to the problem of recommending items to users, preferably in the order from most likely-to-interact to least likely-to-interact. RS use two main approaches for providing recommendations to users; collaborative filtering and content-based filtering. One of the main algorithms used in collaborative filtering is matrix factorization which constitutes in estimating the user preferences by decomposing a user-item interaction matrix into matrices of lower dimensionality of latent features of users and items. The burst of big data has triggered a corresponding response in the machine learning community in trying to come up with new techniques to extract relevant information from data. One such technique is Generative Adversarial Nets (GAN) proposed in 2014 by Goodfellow et al. which initiated a fresh interest in generative modelling. Under this modelling paradigm, GANs have shown great results in estimating high-dimensional, degenerate distributions in Computer Vision, Natural Language Processing and various other scientific fields. Despite their popularity and abilities in learning arbitrary distributions, GANs, and more generally generative modelling, have not been widely applied in RS. In this thesis we investigate a novel approach that estimates the user and item latent factors in a matrix factorization setting through the application of Generative Adversarial Networks for generic Top-N recommendation problem. We detail the formulation of this approach and show its performance through different experiments on well know datasets in the RS community.

Durante l’ultimo decennio c’`e stato un aumento esponenziale nell’ammontare delle informazioni disponibili, questo grazie alla crescita percepita del numero di strumenti collegati e interazioni degli utenti con i contenuti online come i social media, e-commerce, etc. Anche se questo significa un aumento delle possibilit`a di scelta per gli utenti, dato le diverse preferenze personali, diventa comunque difficile l‘esplorazione di tutti i dati e informazioni disponibili. A questo proposito nascono i Sistemi di Raccomandazione (SR), che hanno come obiettivo quello di ridurre questa problematica filtrando i contenuti offerti facendo una predizione sulla valutazione dei vari item da parte dell’utente o la propensione a preferire item specifici. Quest’ultimo viene riconosciuto nelle communita di SR anche come Raccomandazioni Top-N e si riferisce a problematiche di raccomandazioni di item agli utenti, preferibilmente nell’ordine di interazioni maggiori a quelle meno probabili. Per poter offrire delle raccomandazioni all’utente i SR usano due approcci principali: quello collaborativo e l’approccio basato sul contenuto. Un terzo approccio, quello ibrido, pu`o essere costruito dalla combinazione dei due precedenti. La fattorizzazione matriciale `e uno degli algoritmi principali usati nell’approccio collaborativo e consiste nell’estimazione delle preferenze degli utenti basandosi sulla decomposizione della matrice dell’interazione utente-item in matrice di minori dimensioni di fattori latenti di utente e item. L’esplosione dei big data ha influenzato un’analoga risposta nella com- munita di machine learning per quanto riguarda l’intento di trovare nuove tecniche ed estrarre le informazioni rilevanti dai data disponibili. Una simile tecnica `e il Generative Adversial Net (GAN) proposta nel 2014 da Goodfellow et. al, che porto alla crescita di un interesse nei confronti dei modelli generativi. Sotto questo paradigma di modellazione, i GANs hanno dimostrato ottimi risultati nell’estimare distribuzioni multi-dimensionali e degenere in Visione Artificiale, Elaborazione del linguaggio naturale e altri vari campi scientifici. Nonostante la loro popolarit`a e abilit`a nell’imparare distribuzioni arbitrarie, i GANs e altri simili modelli, non sono stati implementati ampiamente nell’ambito dei RS. L’obiettivo principale di questa tesi `e quello di esplorare l’applicabilit`a di un approccio nuovo nello stimare i fattori latenti di utente e item in una matrice fattoriale tramite l’utilizzo dei GANs per problemi di raccomandazione Top-N. La formulazione di questo approccio verr`a descritto con dettaglio e la performance sar`a presentata tramite vari esperimenti su dataset ben riconosciuti nell’ambito della comunita di SR.

GAN-based matrix factorization for recommender systems

DERVISHAJ, ERVIN
2018/2019

Abstract

The last decade has seen an exponential increase in the amount of available information thanks to the ever-growing number of connected devices and interaction of users with online content like social media, e-commerce, etc. While this translates in more choices for users given their diverse set of preferences, it makes it difficult for them to explore this vast amount of information. Recommender systems (RS) aim to alleviate this problem by filtering the content offered to users by predicting either the rating of items by users or the propensity of users to like specific items. The latter is known as Top-N recommendation in the RS community and it refers to the problem of recommending items to users, preferably in the order from most likely-to-interact to least likely-to-interact. RS use two main approaches for providing recommendations to users; collaborative filtering and content-based filtering. One of the main algorithms used in collaborative filtering is matrix factorization which constitutes in estimating the user preferences by decomposing a user-item interaction matrix into matrices of lower dimensionality of latent features of users and items. The burst of big data has triggered a corresponding response in the machine learning community in trying to come up with new techniques to extract relevant information from data. One such technique is Generative Adversarial Nets (GAN) proposed in 2014 by Goodfellow et al. which initiated a fresh interest in generative modelling. Under this modelling paradigm, GANs have shown great results in estimating high-dimensional, degenerate distributions in Computer Vision, Natural Language Processing and various other scientific fields. Despite their popularity and abilities in learning arbitrary distributions, GANs, and more generally generative modelling, have not been widely applied in RS. In this thesis we investigate a novel approach that estimates the user and item latent factors in a matrix factorization setting through the application of Generative Adversarial Networks for generic Top-N recommendation problem. We detail the formulation of this approach and show its performance through different experiments on well know datasets in the RS community.
SCRIMINACI, MARIO
ING - Scuola di Ingegneria Industriale e dell'Informazione
6-giu-2020
2018/2019
Durante l’ultimo decennio c’`e stato un aumento esponenziale nell’ammontare delle informazioni disponibili, questo grazie alla crescita percepita del numero di strumenti collegati e interazioni degli utenti con i contenuti online come i social media, e-commerce, etc. Anche se questo significa un aumento delle possibilit`a di scelta per gli utenti, dato le diverse preferenze personali, diventa comunque difficile l‘esplorazione di tutti i dati e informazioni disponibili. A questo proposito nascono i Sistemi di Raccomandazione (SR), che hanno come obiettivo quello di ridurre questa problematica filtrando i contenuti offerti facendo una predizione sulla valutazione dei vari item da parte dell’utente o la propensione a preferire item specifici. Quest’ultimo viene riconosciuto nelle communita di SR anche come Raccomandazioni Top-N e si riferisce a problematiche di raccomandazioni di item agli utenti, preferibilmente nell’ordine di interazioni maggiori a quelle meno probabili. Per poter offrire delle raccomandazioni all’utente i SR usano due approcci principali: quello collaborativo e l’approccio basato sul contenuto. Un terzo approccio, quello ibrido, pu`o essere costruito dalla combinazione dei due precedenti. La fattorizzazione matriciale `e uno degli algoritmi principali usati nell’approccio collaborativo e consiste nell’estimazione delle preferenze degli utenti basandosi sulla decomposizione della matrice dell’interazione utente-item in matrice di minori dimensioni di fattori latenti di utente e item. L’esplosione dei big data ha influenzato un’analoga risposta nella com- munita di machine learning per quanto riguarda l’intento di trovare nuove tecniche ed estrarre le informazioni rilevanti dai data disponibili. Una simile tecnica `e il Generative Adversial Net (GAN) proposta nel 2014 da Goodfellow et. al, che porto alla crescita di un interesse nei confronti dei modelli generativi. Sotto questo paradigma di modellazione, i GANs hanno dimostrato ottimi risultati nell’estimare distribuzioni multi-dimensionali e degenere in Visione Artificiale, Elaborazione del linguaggio naturale e altri vari campi scientifici. Nonostante la loro popolarit`a e abilit`a nell’imparare distribuzioni arbitrarie, i GANs e altri simili modelli, non sono stati implementati ampiamente nell’ambito dei RS. L’obiettivo principale di questa tesi `e quello di esplorare l’applicabilit`a di un approccio nuovo nello stimare i fattori latenti di utente e item in una matrice fattoriale tramite l’utilizzo dei GANs per problemi di raccomandazione Top-N. La formulazione di questo approccio verr`a descritto con dettaglio e la performance sar`a presentata tramite vari esperimenti su dataset ben riconosciuti nell’ambito della comunita di SR.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
ErvinDervishaj_GAN-based Matrix Factorization for Recommender Systems.pdf

accessibile in internet per tutti

Descrizione: Final Version
Dimensione 16.67 MB
Formato Adobe PDF
16.67 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/154120