In recent times, significant efforts have gone into studying how to harness the ever-increasing amount of data that comes in the form of social media content, such as tweets, posts, and comments. In this work, we develop a sentiment analysis system, allowing for extraction of trends and insight from social media comments. We focus on analyzing political discussion in Albania. We adapt BERT (Bidirectional Encoder Representations from Transformers), a language modeling framework based on Transformer neural networks, to tackle two sentiment analysis tasks: sentiment classification of comments (positive/neutral/negative) and level of agreement categorization of post/comment pairs (agree/neutral/disagree). We review various fine-tuning techniques and optimizations, and we introduce a monolingual BERT variant: sqBERT. Finally, we employ the network predictions, alongside the collected comment metadata, to extract quantitative information in time-series format. This allows us to build a prototype of flexible dashboard for social media trend monitoring.

Recentemente, molto interesse è stato indirizzato allo studio dell'utilizzo della crescente quantità di dati sotto forma di contenuto proveniente da social media, come tweet, post, e commenti. In questo elaborato, sviluppiamo un sistema per l'analisi del sentiment su queste piattaforme, al fine di estrarne andamenti e informazioni. Ci concentriamo sull'analisi automatizzata di conversazioni politiche in Albania. Adattiamo BERT (Bidirectional Encoder Representations from Transformers), un framework per la modellizzazione del linguaggio naturale, basato su reti neurali Transformer, al fine di risolvere due problemi di sentiment analysis: la classificazione del tono e sentimento complessivo dei commenti (positivo/negativo/neutrale), e la classificazione del livello di concordanza all'interno di coppie post/commento (accordo/neutrale/disaccordo). Studiamo diverse tecniche e ottimizzazioni rivolte al fine-tuning, e introduciamo una versione monolingue di BERT: sqBERT. Infine, sfruttando le predizioni del modello, insieme ai metadati ottenuti dai commenti raccolti, estraiamo informazioni quantitative sotto forma di serie temporali. Questo ci permetterà di sviluppare un prototipo di dashboard interattiva per il monitoring e l'analisi di trend su social media.

What do voters like? Analysis of public sentiment and agreement to Albanian leaders' social media activity

d'Amato, Francesco
2021/2022

Abstract

In recent times, significant efforts have gone into studying how to harness the ever-increasing amount of data that comes in the form of social media content, such as tweets, posts, and comments. In this work, we develop a sentiment analysis system, allowing for extraction of trends and insight from social media comments. We focus on analyzing political discussion in Albania. We adapt BERT (Bidirectional Encoder Representations from Transformers), a language modeling framework based on Transformer neural networks, to tackle two sentiment analysis tasks: sentiment classification of comments (positive/neutral/negative) and level of agreement categorization of post/comment pairs (agree/neutral/disagree). We review various fine-tuning techniques and optimizations, and we introduce a monolingual BERT variant: sqBERT. Finally, we employ the network predictions, alongside the collected comment metadata, to extract quantitative information in time-series format. This allows us to build a prototype of flexible dashboard for social media trend monitoring.
ALIMEHMETI, GENC
CHIGGIATO, DAVIDE
FALCETTA, ALESSANDRO
RIVA, DIEGO
ING - Scuola di Ingegneria Industriale e dell'Informazione
6-ott-2022
2021/2022
Recentemente, molto interesse è stato indirizzato allo studio dell'utilizzo della crescente quantità di dati sotto forma di contenuto proveniente da social media, come tweet, post, e commenti. In questo elaborato, sviluppiamo un sistema per l'analisi del sentiment su queste piattaforme, al fine di estrarne andamenti e informazioni. Ci concentriamo sull'analisi automatizzata di conversazioni politiche in Albania. Adattiamo BERT (Bidirectional Encoder Representations from Transformers), un framework per la modellizzazione del linguaggio naturale, basato su reti neurali Transformer, al fine di risolvere due problemi di sentiment analysis: la classificazione del tono e sentimento complessivo dei commenti (positivo/negativo/neutrale), e la classificazione del livello di concordanza all'interno di coppie post/commento (accordo/neutrale/disaccordo). Studiamo diverse tecniche e ottimizzazioni rivolte al fine-tuning, e introduciamo una versione monolingue di BERT: sqBERT. Infine, sfruttando le predizioni del modello, insieme ai metadati ottenuti dai commenti raccolti, estraiamo informazioni quantitative sotto forma di serie temporali. Questo ci permetterà di sviluppare un prototipo di dashboard interattiva per il monitoring e l'analisi di trend su social media.
File allegati
File Dimensione Formato  
THESIS.pdf

non accessibile

Descrizione: Thesis
Dimensione 1.28 MB
Formato Adobe PDF
1.28 MB Adobe PDF   Visualizza/Apri
EXECUTIVE SUMMARY.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Executive summary
Dimensione 493.27 kB
Formato Adobe PDF
493.27 kB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/192397