Sale forecasts, market trends, user tastes are strongly influenced by recommender systems. Modern research focuses primarily on trying to develop recommender algorithms which rely on different information beyond the traditional “User x Item” matrix. The context of our work will regard the movies area, a field that best serve our purpose of collecting data about user preferences. The main goal of our thesis work is to test our innovative dataset on all the methods used to model user profiles so far. We have created a dataset which includes explicit opinions on attributes of items. In order to create our preference dataset, we have developed an online survey called PoliMovie with IMDb dataset, integrated with Facebook and with a crowdsourcing service. After the collecting phase we have evaluated in different methods the similarities between explicit and implicit user profiles by means of an “User x Feature” matrix respectively for genre, cast and director. The results of our study underline the importance of our innovative dataset, since all the methods used for modeling user profiles would not reach the efficiency to replace this feature-based dataset.
Le previsioni di vendita, le tendenze di mercato e gli interessi degli utenti vengono fortemente influenzati dai sistemi di raccomandazione. Le più attuali ricerche si focalizzano sullo sviluppo di algoritmi di raccomandazione basati su tipologie aggiuntive di informazione rispetto a quelle fornite dalle più comuni matrici “Utente x Oggetto”. Il contesto nel quale si pone questo lavoro di ricerca riguarda le opere cinematografiche e le relative caratteristiche di quest’ultime. Tale scelta scaturisce dalla necessità di acquisire ulteriori preferenze correlate ad un oggetto. Lo scopo di questo lavoro di tesi è creare un dataset innovativo da testare con i differenti metodi di profilazione utente già esistenti. Tale dataset è strutturato in modo da contenere sia preferenze esplicite sui film sia sugli attributi associati a questi ultimi. A tal fine è stata sviluppata una web application sotto forma di questionario online, denominato PoliMovie, che utilizza il catalogo IMDb dei film e dei loro relativi attributi. Per la creazione del dataset, PoliMovie è stato integrato con Facebook e con un servizio di crowdsourcing. Successivamente sono state confrontate le preferenze esplicite fornite dagli utenti su generi, cast e registi con quelle implicite, dedotte utilizzando differenti metodi di profilazione utente creando delle apposite matrici “Utente x Caratteristica”. I risultati di questo studio sottolineano l’importanza del dataset creato, poiché tutti i metodi confrontati per la profilazione utente non raggiungono valori di similarità soddisfacenti messi a confronto con gli stessi ottenuti utilizzando una raccolta dati di questo tipo.
User modeling comparisons on a feature-based dataset
PISTONE, BRUNO;PRUNELLA, RAFFAELE
2014/2015
Abstract
Sale forecasts, market trends, user tastes are strongly influenced by recommender systems. Modern research focuses primarily on trying to develop recommender algorithms which rely on different information beyond the traditional “User x Item” matrix. The context of our work will regard the movies area, a field that best serve our purpose of collecting data about user preferences. The main goal of our thesis work is to test our innovative dataset on all the methods used to model user profiles so far. We have created a dataset which includes explicit opinions on attributes of items. In order to create our preference dataset, we have developed an online survey called PoliMovie with IMDb dataset, integrated with Facebook and with a crowdsourcing service. After the collecting phase we have evaluated in different methods the similarities between explicit and implicit user profiles by means of an “User x Feature” matrix respectively for genre, cast and director. The results of our study underline the importance of our innovative dataset, since all the methods used for modeling user profiles would not reach the efficiency to replace this feature-based dataset.File | Dimensione | Formato | |
---|---|---|---|
Our_thesis.pdf
accessibile in internet per tutti
Descrizione: Testo della tesi
Dimensione
7.13 MB
Formato
Adobe PDF
|
7.13 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/116027