Recommender Systems are a field of computer science and data analysis that has become more and more essential in the last years. This is due to the fact that internet is easier and faster to access, and with it enormous virtual companies like Amazon and Netflix arised proposing huge catalogues to a even bigger customer base. Dealing with such a wide range of customers brought up the problem of trying to personalize the content shown to each user, in order to enhance her experience while buying on an e-commerce site or watching a movie on a streaming provider. Recommender systems address exactly these kind of issues, in every possible field, from the above-cited to music and also jobs. Our thesis work was born from an international competition, RecSys Challenge 2017, organized by XING, a business social network, whose aim was to personalize job recommendations to a portion of their user base. Both this work and the competition focuses on finding a solution for the cold-start item problem, i.e. how to provide recommendations for items newly inserted in a catalogue, with no interaction with any user. In this thesis we look at previous approaches for providing high quality recommendations for new items, then we present a novel hybrid method that exploits both the collaborative and the content information available in the data. The proposed framework exploits a collaborative technique to learn an item-item similarity and then use this result to train an embedded method whose optimization procedure aims at approximating this item similarity and not the rating matrix. The effectiveness of our method is proved testing its performances against state-of- the-art technique on two different environments, including the dataset used in the Xing competition where, our global effort as team Lunatic Goats, granted us the 2nd place overall, qualifying as the best academic team.
I sistemi di raccomandazione sono un campo dell’informatica che è diventato sempre più essenziale nell’ultimo decennio. Grazie alla diffusione sempre più capillare della connessione ad internet e alla velocità di accesso ad esso in aumento vertiginoso, è stato possibile che colossi virtuali come Amazon e Netflix si affermassero offrendo enormi cataloghi di prodotti ad una vastissima clientela. La vastità, e quindi la diversità, degli utenti che si sono trovati a servire ha creato l'esigenza da parte di queste aziende di riuscire a personalizzare le pagine e i prodotti offerti a ciascun cliente, in modo tale da migliorare la sua esperienza. L'obbiettivo dei sistemi di raccomandazione giace proprio nella personalizzazione del contenuto mostrato ad ogni cliente, ed è applicabile a qualsiasi campo del commercio virtuale: siti di e-commerce, streaming di film e musica, ma anche social network relativi ad offerte di lavoro. Il nostro lavoro di tesi nasce da una competizione internazionale, la ACM RecSys Challenge 2017, organizzata da XING, un social network impiegato principalmente nello sviluppo di contatti professionali, il cui obbiettivo era quello di migliorare la qualità della personalizzazione delle offerte di lavoro mostrate a parte dei loro utenti. Sia questo lavoro di tesi che la competizione sono stati incentrati sul trovare una soluzione al problema dei contenuti cosiddetti “cold start”, ossia come fornire raccomandazioni per oggetti che sono stati recentemente aggiunti nel catalogo, quindi completamente privi di interazioni con altri utenti. In questa tesi analizziamo gli approcci esistenti in merito alla produzione di raccomandazioni di qualità per oggetti nuovi e in seguito presentiamo un nuovo approccio ibrido che sfrutta sia l'informazione collaborativa presente nei dati a disposizione che le proprietà e gli attributi dei singoli prodotti. Il framework proposto utilizza tecniche collaborative per produrre una matrice di similarità tra prodotti, e successivamente usa questo risultato all’interno di un metodo embedded che viene ottimizzato mirando ad approssimare la suddetta matrice di similarità piuttosto che la matrice delle preferenze. L’efficacia del nostro metodo viene avvalorata dal confronto delle sue performance rispetto ad altre tecniche presenti in letteratura, confronto effettuato su due dataset distinti, tra cui quello usato nella competizione di XING, dove il nostro sforzo come team Lunatic Goats ci ha garantito il secondo posto finale, qualificandoci come miglior team accademico.
A feature-based machine learning approach for the cold start item problem
BIANCHI, MATTIA;GASPARIN, ALBERTO
2016/2017
Abstract
Recommender Systems are a field of computer science and data analysis that has become more and more essential in the last years. This is due to the fact that internet is easier and faster to access, and with it enormous virtual companies like Amazon and Netflix arised proposing huge catalogues to a even bigger customer base. Dealing with such a wide range of customers brought up the problem of trying to personalize the content shown to each user, in order to enhance her experience while buying on an e-commerce site or watching a movie on a streaming provider. Recommender systems address exactly these kind of issues, in every possible field, from the above-cited to music and also jobs. Our thesis work was born from an international competition, RecSys Challenge 2017, organized by XING, a business social network, whose aim was to personalize job recommendations to a portion of their user base. Both this work and the competition focuses on finding a solution for the cold-start item problem, i.e. how to provide recommendations for items newly inserted in a catalogue, with no interaction with any user. In this thesis we look at previous approaches for providing high quality recommendations for new items, then we present a novel hybrid method that exploits both the collaborative and the content information available in the data. The proposed framework exploits a collaborative technique to learn an item-item similarity and then use this result to train an embedded method whose optimization procedure aims at approximating this item similarity and not the rating matrix. The effectiveness of our method is proved testing its performances against state-of- the-art technique on two different environments, including the dataset used in the Xing competition where, our global effort as team Lunatic Goats, granted us the 2nd place overall, qualifying as the best academic team.File | Dimensione | Formato | |
---|---|---|---|
2017_12_Gasparin_Bianchi.pdf
non accessibile
Descrizione: Testo della tesi
Dimensione
963.89 kB
Formato
Adobe PDF
|
963.89 kB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/137490