With the growth of Over-The-Top media services, the way content is delivered to viewers changed dramatically. On such platforms, every episode of TV-series seasons is released most of the time simultaneously. Consequently, viewers' behavior has evolved, and they often watch several episodes one after the other in most of their watching sessions. This phenomenon is referred to as binge-watching, while binge-worthy series are series prone to be binge-watched. Therefore, this thesis aims to provide methods to identify binge-watchers and binge-worthy series and explore the relevance of this information as features of Recommender Systems. First, we identify user-series watching sessions, and we extract binge-watchers and binge-worthy series by applying high-level definitions of binge-watching we find in the literature. Next, we outline how to introduce these features into Recommender Systems. We use two approaches: for models that do not use features by default, we extend the User Rating Matrix adding this information as an extra user and item; for Factorization Machines, we add features straightforwardly. We then train models weighting their features so that their importance can be automatically learned during the hyper-parameter optimization. Our experiments show that Machine Learning models like SLIM and Factorization Machines leverage the information on binge-worthy series and improve their recommendation quality, both in terms of accuracy and beyond accuracy metrics. We also highlight that the models do not use binge-watchers' information as it does not lead to improvements in recommendation quality. Finally, we outline possible use cases and research questions that can benefit from the extraction of binge-watchers and binge-worthy series information.

Conseguentemente alla crescita dei servizi media Over-The-Top, il modo in cui i contenuti sono trasmessi al pubblico è cambiato drasticamente. In queste piattaforme, gli episodi delle stagioni delle serie-TV vengono rilasciati simultaneamente di frequente. Di conseguenza, anche il comportamento del pubblico si è profondamente evoluto: sempre più utenti di queste piattaforme guardano diversi episodi di fila in ogni sessione. Questo fenomeno è definito come binge-watching, mentre le serie-TV binge-worthy sono serie che il più delle volte vengono guardate attraverso binge-watching. L'obiettivo di questa tesi consiste nel fornire metodi per l'identificazione dei binge-watcher e delle serie binge-worthy, e nell'esplorare la rilevanza di queste informazioni all'interno di Sistemi di Raccomandazione. Innanzitutto, identifichiamo le singole sessioni in cui un utente guarda una certa serie, ed estraiamo sia i binge-watcher che le serie binge-worthy, utilizzando definizioni di alto livello che troviamo nella bibliografia. Successivamente, illustriamo come introdurre queste feature all'interno dei Sistemi di Raccomandazione. Adottiamo due approcci differenti: per quanto riguarda i modelli che non prevedono l'utilizzo di features, estendiamo la User Rating Matrix aggiungendo queste informazioni come se fossero un utente e un oggetto extra; per le Factorization Machines, possiamo utilizzare direttamente le features. In prosieguo, addestriamo i modelli pesando le feature affinché la loro importanza venga automaticamente imparata durante l'ottimizzazione degli iper-parametri. I nostri esperimenti mostrano che i modelli di Machine Learning come SLIM e le Factorization Machines sfruttano le informazioni sulle serie binge-worthy e migliorano la qualità delle loro raccomandazioni, sia per quanto riguarda le metriche di accuracy e beyond-accuracy. Inoltre, risulta che i modelli non usino le informazioni sui binge-watchers, siccome non migliorano la qualità delle raccomandazioni. Infine, illustriamo possibili casi d'uso e sviluppi di ricerca che possono trarre beneficio dall'estrazione di binge-watchers e serie binge-worthy.

Identifying binge-watching behavior on serial content and exploring its relevance in recommender systems

Carretta, Matteo
2020/2021

Abstract

With the growth of Over-The-Top media services, the way content is delivered to viewers changed dramatically. On such platforms, every episode of TV-series seasons is released most of the time simultaneously. Consequently, viewers' behavior has evolved, and they often watch several episodes one after the other in most of their watching sessions. This phenomenon is referred to as binge-watching, while binge-worthy series are series prone to be binge-watched. Therefore, this thesis aims to provide methods to identify binge-watchers and binge-worthy series and explore the relevance of this information as features of Recommender Systems. First, we identify user-series watching sessions, and we extract binge-watchers and binge-worthy series by applying high-level definitions of binge-watching we find in the literature. Next, we outline how to introduce these features into Recommender Systems. We use two approaches: for models that do not use features by default, we extend the User Rating Matrix adding this information as an extra user and item; for Factorization Machines, we add features straightforwardly. We then train models weighting their features so that their importance can be automatically learned during the hyper-parameter optimization. Our experiments show that Machine Learning models like SLIM and Factorization Machines leverage the information on binge-worthy series and improve their recommendation quality, both in terms of accuracy and beyond accuracy metrics. We also highlight that the models do not use binge-watchers' information as it does not lead to improvements in recommendation quality. Finally, we outline possible use cases and research questions that can benefit from the extraction of binge-watchers and binge-worthy series information.
PÉREZ MAURERA, FERNANDO BENJAMÍN
SCRIMINACI, MARIO
ING - Scuola di Ingegneria Industriale e dell'Informazione
28-apr-2021
2020/2021
Conseguentemente alla crescita dei servizi media Over-The-Top, il modo in cui i contenuti sono trasmessi al pubblico è cambiato drasticamente. In queste piattaforme, gli episodi delle stagioni delle serie-TV vengono rilasciati simultaneamente di frequente. Di conseguenza, anche il comportamento del pubblico si è profondamente evoluto: sempre più utenti di queste piattaforme guardano diversi episodi di fila in ogni sessione. Questo fenomeno è definito come binge-watching, mentre le serie-TV binge-worthy sono serie che il più delle volte vengono guardate attraverso binge-watching. L'obiettivo di questa tesi consiste nel fornire metodi per l'identificazione dei binge-watcher e delle serie binge-worthy, e nell'esplorare la rilevanza di queste informazioni all'interno di Sistemi di Raccomandazione. Innanzitutto, identifichiamo le singole sessioni in cui un utente guarda una certa serie, ed estraiamo sia i binge-watcher che le serie binge-worthy, utilizzando definizioni di alto livello che troviamo nella bibliografia. Successivamente, illustriamo come introdurre queste feature all'interno dei Sistemi di Raccomandazione. Adottiamo due approcci differenti: per quanto riguarda i modelli che non prevedono l'utilizzo di features, estendiamo la User Rating Matrix aggiungendo queste informazioni come se fossero un utente e un oggetto extra; per le Factorization Machines, possiamo utilizzare direttamente le features. In prosieguo, addestriamo i modelli pesando le feature affinché la loro importanza venga automaticamente imparata durante l'ottimizzazione degli iper-parametri. I nostri esperimenti mostrano che i modelli di Machine Learning come SLIM e le Factorization Machines sfruttano le informazioni sulle serie binge-worthy e migliorano la qualità delle loro raccomandazioni, sia per quanto riguarda le metriche di accuracy e beyond-accuracy. Inoltre, risulta che i modelli non usino le informazioni sui binge-watchers, siccome non migliorano la qualità delle raccomandazioni. Infine, illustriamo possibili casi d'uso e sviluppi di ricerca che possono trarre beneficio dall'estrazione di binge-watchers e serie binge-worthy.
File allegati
File Dimensione Formato  
Carretta_Thesis.pdf

accessibile in internet per tutti

Dimensione 820.1 kB
Formato Adobe PDF
820.1 kB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/173792