Recommender Systems are tools and techniques aimed to recommend items to users and in recent years they have become increasingly popular. In order to make recommendations, they usually try to predict preferences or ratings that users would give to items by exploiting available information, that can be of two main types: content or collaborative. The first refers to the characteristics of items or users, called features, and forms a set of recommendation techniques defined as content-based filtering approaches. The second refers to past interactions of users and forms another set of techniques defined as collaborative filtering approaches. Collaborative approaches perform better in most situations, but they can not be used when previous interactions are not available, like the cold-start scenario, where new items are added to the catalogue and they have to be recommended. To optimize performance of content-based approaches, some techniques have been studied in recent past. One of them is called feature weighting, which assigns to every feature a real value that estimates its importance. Statistical approaches for feature weighting were commonly used in Information Retrieval, but when applied to Recommender Systems they did not provide relevant performance improvements. Performing weights estimation by extracting collaborative information using machine learning techniques, instead, has shown promising results. In this thesis, we propose a novel graph, feature-based machine learning model to face the cold-start item scenario, learning the relevance of features from probabilities of item-based collaborative filtering algorithms. We also test it in different cold-start situations and we compare its performance with other state-of-the-art approaches.

I Sistemi di Raccomandazione sono un insieme di strumenti e tecniche utilizzati per raccomandare oggetti agli utenti e nel recente passato sono diventati sempre più popolari. Per proporre delle raccomandazioni, questi sistemi solitamente predicono le preferenze o le valutazioni che gli utenti darebbero agli oggetti utilizzando le informazioni che hanno a disposizione, le quali possono essere principalmente di due tipi: contenutistico e collaborativo. Il primo si riferisce alle caratteristiche degli oggetti o degli utenti, ed è alla base di un intero insieme di tecniche per la raccomandazione definite "approcci basati sul filtraggio del contenuto". Il secondo si riferisce alle passate interazioni degli utenti ed è alla base di un altro insieme di tecniche definite "approcci basati sul filtraggio collaborativo". Gli approcci collaborativi ottengono delle performance migliori nella maggior parte delle situazioni, ma esistono dei casi in cui non possono essere utilizzati, come, ad esempio, negli scenari "cold-start", quando si vogliono raccomandare dei nuovi oggetti che vengono aggiunti al catalogo. Per ottimizzare le performance degli approcci basati sul contenuto, recentemente sono state studiate alcune tecniche. Una di esse viene chiamata "ponderazione delle caratteristiche" e consiste nell'assegnare ad ogni caratteristica un valore che stimi la sua importanza. Approcci statistici per la ponderazione delle caratteristiche sono comunemente usati nel campo del Recupero di Informazioni, ma applicati ai Sistemi di Raccomandazione non hanno portato a miglioramenti delle prestazioni rilevanti. Estrarre informazione collaborativa attraverso tecniche di machine learning per stimare questi pesi, invece, ha prodotto risultati molto promettenti. In questa tesi proponiamo un nuovo modello di machine learning basato su grafi che apprende la rilevanza delle caratteristiche dalle probabilità ottenute tramite algoritmi di filtraggio collaborativo basati sugli oggetti. Inoltre lo testeremo in diverse situazioni cold-start e confronteremo le sue performance con altri approcci appartenenti all'attuale stato dell'arte dei Sistemi di Raccomandazione.

A novel graph-based model for hybrid recommendations in cold-start scenarios

BERNARDIS, CESARE
2016/2017

Abstract

Recommender Systems are tools and techniques aimed to recommend items to users and in recent years they have become increasingly popular. In order to make recommendations, they usually try to predict preferences or ratings that users would give to items by exploiting available information, that can be of two main types: content or collaborative. The first refers to the characteristics of items or users, called features, and forms a set of recommendation techniques defined as content-based filtering approaches. The second refers to past interactions of users and forms another set of techniques defined as collaborative filtering approaches. Collaborative approaches perform better in most situations, but they can not be used when previous interactions are not available, like the cold-start scenario, where new items are added to the catalogue and they have to be recommended. To optimize performance of content-based approaches, some techniques have been studied in recent past. One of them is called feature weighting, which assigns to every feature a real value that estimates its importance. Statistical approaches for feature weighting were commonly used in Information Retrieval, but when applied to Recommender Systems they did not provide relevant performance improvements. Performing weights estimation by extracting collaborative information using machine learning techniques, instead, has shown promising results. In this thesis, we propose a novel graph, feature-based machine learning model to face the cold-start item scenario, learning the relevance of features from probabilities of item-based collaborative filtering algorithms. We also test it in different cold-start situations and we compare its performance with other state-of-the-art approaches.
FERRARI DACREMA, MAURIZIO
ING - Scuola di Ingegneria Industriale e dell'Informazione
19-apr-2018
2016/2017
I Sistemi di Raccomandazione sono un insieme di strumenti e tecniche utilizzati per raccomandare oggetti agli utenti e nel recente passato sono diventati sempre più popolari. Per proporre delle raccomandazioni, questi sistemi solitamente predicono le preferenze o le valutazioni che gli utenti darebbero agli oggetti utilizzando le informazioni che hanno a disposizione, le quali possono essere principalmente di due tipi: contenutistico e collaborativo. Il primo si riferisce alle caratteristiche degli oggetti o degli utenti, ed è alla base di un intero insieme di tecniche per la raccomandazione definite "approcci basati sul filtraggio del contenuto". Il secondo si riferisce alle passate interazioni degli utenti ed è alla base di un altro insieme di tecniche definite "approcci basati sul filtraggio collaborativo". Gli approcci collaborativi ottengono delle performance migliori nella maggior parte delle situazioni, ma esistono dei casi in cui non possono essere utilizzati, come, ad esempio, negli scenari "cold-start", quando si vogliono raccomandare dei nuovi oggetti che vengono aggiunti al catalogo. Per ottimizzare le performance degli approcci basati sul contenuto, recentemente sono state studiate alcune tecniche. Una di esse viene chiamata "ponderazione delle caratteristiche" e consiste nell'assegnare ad ogni caratteristica un valore che stimi la sua importanza. Approcci statistici per la ponderazione delle caratteristiche sono comunemente usati nel campo del Recupero di Informazioni, ma applicati ai Sistemi di Raccomandazione non hanno portato a miglioramenti delle prestazioni rilevanti. Estrarre informazione collaborativa attraverso tecniche di machine learning per stimare questi pesi, invece, ha prodotto risultati molto promettenti. In questa tesi proponiamo un nuovo modello di machine learning basato su grafi che apprende la rilevanza delle caratteristiche dalle probabilità ottenute tramite algoritmi di filtraggio collaborativo basati sugli oggetti. Inoltre lo testeremo in diverse situazioni cold-start e confronteremo le sue performance con altri approcci appartenenti all'attuale stato dell'arte dei Sistemi di Raccomandazione.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2018_04_Bernardis.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 1.34 MB
Formato Adobe PDF
1.34 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/140118