Social Media nowadays play a more relevant than ever role in our lives. Their presence has such a widespread reach that they have assumed a key relevance; not only for the single end-users, but also for businesses and institutions, which desire to uncap the potential of the data generated from these communication platforms. This great amount of data, while almost useless if not processed, can be turned in valuable information, not only about the users behaviour but also about the context in which they live, giving a quick picture of the ever changing social network. Over the years many techniques have been proposed and developed in order to extract such information, and the fields of application for such techniques are growing steadily. The purpose of this thesis is to extract, through the use of exploratory data analysis and natural language processing techniques, the main topics that can describe the trending videos on the Social Media platform YouTube. This platform not only is one of the most used worldwide but it has also an open nature with well documented libraries and fully-featured API support. In this scenario we analyse a span of six months of trending videos: using the metadata of such videos from nine distinct countries in order to describe the different use of the Social Network both from a temporal and a geo-spatial point of view; we will then delve in the analysis of the closed captions of the videos from three English speaking countries in order to extract the trending topics on YouTube and their relationship with the popularity of their videos.

I Social Media in questi giorni hanno raggiunto un ruolo quanto mai rilevante nelle nostre vite. La loro presenza è ormai così capillare da aver assunto un'importanza chiave; non solo per i singoli utenti finali, ma anche per le imprese e le istituzioni, che desiderano sbloccare il potenziale dei dati generati da queste piattaforme di comunicazione. Questo grande ammontare di dati , sebbene pressochè inutile se non processato, può essere trasformato in preziose informazioni, non solo riguardo il comportamento degli utenti coinvolti ma anche riguardo il contesto in cui vivono, producendo un'istantanea dei social networks che cambiano ogni giorno. Nel corso degli anni sono state proposte e raffinate molte tecniche al fine di estrarre queste informazioni e i campi applicativi per queste tecniche sono in costante crescita. Lo scopo di questa tesi è di estrarre, tramite l'utilizzo di tecniche di analisi esplorativa dei dati e di elaborazione del linguaggio naturale, gli argomenti principali che possono descrivere i video di tendenza sulla piattaforma Social Media di YouTube. Questa piattaforma non solo è una delle più usate al mondo ma presenta anche una natura aperta allo studio con librerie ben documentate e un completo supporto API. In questo scenario analizziamo un arco temporale di sei mesi di video di tendenza: usando i metadati di questi video da nove nazioni distinte in modo da descrivere i diversi impieghi del Social Network sia da un punto di vista temporale che da un punto di vista geospaziale; quindi approfondiremo l'analisi dei sottotitoli dei video da tre nazioni anglofone al fine di estrarre gli argomenti di tendenza su YouTube e la loro relazione con la popolarità dei video.

Exploratory data analysis of videos shared on social media platforms

Lunetti, Michele
2019/2020

Abstract

Social Media nowadays play a more relevant than ever role in our lives. Their presence has such a widespread reach that they have assumed a key relevance; not only for the single end-users, but also for businesses and institutions, which desire to uncap the potential of the data generated from these communication platforms. This great amount of data, while almost useless if not processed, can be turned in valuable information, not only about the users behaviour but also about the context in which they live, giving a quick picture of the ever changing social network. Over the years many techniques have been proposed and developed in order to extract such information, and the fields of application for such techniques are growing steadily. The purpose of this thesis is to extract, through the use of exploratory data analysis and natural language processing techniques, the main topics that can describe the trending videos on the Social Media platform YouTube. This platform not only is one of the most used worldwide but it has also an open nature with well documented libraries and fully-featured API support. In this scenario we analyse a span of six months of trending videos: using the metadata of such videos from nine distinct countries in order to describe the different use of the Social Network both from a temporal and a geo-spatial point of view; we will then delve in the analysis of the closed captions of the videos from three English speaking countries in order to extract the trending topics on YouTube and their relationship with the popularity of their videos.
ING - Scuola di Ingegneria Industriale e dell'Informazione
9-giu-2021
2019/2020
I Social Media in questi giorni hanno raggiunto un ruolo quanto mai rilevante nelle nostre vite. La loro presenza è ormai così capillare da aver assunto un'importanza chiave; non solo per i singoli utenti finali, ma anche per le imprese e le istituzioni, che desiderano sbloccare il potenziale dei dati generati da queste piattaforme di comunicazione. Questo grande ammontare di dati , sebbene pressochè inutile se non processato, può essere trasformato in preziose informazioni, non solo riguardo il comportamento degli utenti coinvolti ma anche riguardo il contesto in cui vivono, producendo un'istantanea dei social networks che cambiano ogni giorno. Nel corso degli anni sono state proposte e raffinate molte tecniche al fine di estrarre queste informazioni e i campi applicativi per queste tecniche sono in costante crescita. Lo scopo di questa tesi è di estrarre, tramite l'utilizzo di tecniche di analisi esplorativa dei dati e di elaborazione del linguaggio naturale, gli argomenti principali che possono descrivere i video di tendenza sulla piattaforma Social Media di YouTube. Questa piattaforma non solo è una delle più usate al mondo ma presenta anche una natura aperta allo studio con librerie ben documentate e un completo supporto API. In questo scenario analizziamo un arco temporale di sei mesi di video di tendenza: usando i metadati di questi video da nove nazioni distinte in modo da descrivere i diversi impieghi del Social Network sia da un punto di vista temporale che da un punto di vista geospaziale; quindi approfondiremo l'analisi dei sottotitoli dei video da tre nazioni anglofone al fine di estrarre gli argomenti di tendenza su YouTube e la loro relazione con la popolarità dei video.
File allegati
File Dimensione Formato  
Thesis_Report_Michele_Lunetti.pdf

Open Access dal 25/05/2022

Descrizione: Tesi Report Lunetti 24 May
Dimensione 1.44 MB
Formato Adobe PDF
1.44 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/176208