Content based recommendations enhanced with collaborative information

Recommender systems are software tools which analyze di erent source of data in order to predict the rating or preference that a user would give to an item. They are divided in two main families: Collaborative Filtering and Content-Based Fil- tering approaches. Collaborative algorithms compute recommendations analyzing the history of users' ratings, while Content-based methods rely on items' content, described as set of features. Hybridization methods try to combine the best features of both approaches. In general, Collaborative algorithms have better performances, due to the fact that they consider the users' behavior, which is fundamental for recommendation problems. However, there are cases in which they are not applicable, such as in the new-item problem. In fact, when a new item is added into a system, no ratings are present for it and the only way to perform meaningful recommendations is adopting a Content- based approach. The goal of this thesis is to explore a new way of combining content and collab- orative data. Usually, item side information are used to enhance pure collaborative models. In this work, the inverse approach was used to develop the Content Based Collaborative algorithm (CBC). CBC is a content based approach which considers the relative importance that the various features of an item have in a system. To do so, numerical weights are assigned to items' features and to their relations with every user of the system. In order to learn these parameters, collaborative data are used. The advantages of CBC with respect to other content based techniques are the use of past users' ratings to compute weights' values and the di erent importance given to features when computing items' similarities. As all content based approaches, CBC is applicable both in a normal recommendation scenario and in a new-item problem.

I sistemi di raccomandazione sono strumenti software che analizzano dati prove- nienti da diverse fonti al ne di predire il voto o la preferenza che un utente darebbe a un prodotto. Essi sono suddivisi in due famiglie: Collaborative Filtering e Content- Based Filtering. Gli algoritmi collaborativi calcolano le raccomandazioni analizzando lo storico dei voti degli utenti, mentre i metodi Content-based si a dano al contenuto dei prodotti, descritto da un insieme di caratteristiche. Gli algoritmi ibridi provano a combinare le migliori caratteristiche di entrambi gli approcci. In generale, gli algoritmi collaborativi hanno prestazioni superiori, in quanto essi considerano il comportamento degli utenti che è fondamentale per problemi di raccomandazione. Nonostante ciò, ci sono delle situazioni in cui essi non possono essere applicati, come ad esempio nel problema del new-item. Infatti, quando un nuovo prodotto (item) viene aggiunto in un sistema, non sono presenti voti ad esso correlati e l'unico modo di fare raccomandazioni sensate è a darsi a un approccio di tipo content. L'obiettivo della tesi è esplorare un nuovo modo di combinare dati di tipo col- laborativo con dati di tipo content. Di solito, le informazioni sul contenuto di un prodotto sono usate per migliorare modelli puramente collaborativi. In questo la- voro, l'approccio inverso è stato usato per sviluppare l'algoritmo Content Based Collaborative (CBC). CBC è un algoritmo content based che considera l'importanza relativa che le varie caratteristiche di un prodotto hanno all'interno di un sistema. Per fare ciò, pesi numerici sono assegnati alle caratteristiche dei prodotti e alle re- lazioni che esse hanno con ogni singolo utente. Per apprendere questi parametri, vengono sfruttati dati collaborativi. I vantaggi di CBC rispetto ad altri algoritmi content based sono l'uso dei voti passati degli utenti per calcolare il valore dei pesi e la diversa importanza data alle caratteristiche di un prodotto quando le misure di similarità sono calcolate. Come tutti gli approcci content based, CBC è applica- bile sia un un normale scenario di raccomandazione e sia in un problema di new-item.