What do voters like? Analysis of public sentiment and agreement to Albanian leaders' social media activity

Biblioteche e Archivi
POLITesi - Archivio digitale delle tesi di laurea e di dottorato

In recent times, significant efforts have gone into studying how to harness the ever-increasing amount of data that comes in the form of social media content, such as tweets, posts, and comments. In this work, we develop a sentiment analysis system, allowing for extraction of trends and insight from social media comments. We focus on analyzing political discussion in Albania. We adapt BERT (Bidirectional Encoder Representations from Transformers), a language modeling framework based on Transformer neural networks, to tackle two sentiment analysis tasks: sentiment classification of comments (positive/neutral/negative) and level of agreement categorization of post/comment pairs (agree/neutral/disagree). We review various fine-tuning techniques and optimizations, and we introduce a monolingual BERT variant: sqBERT. Finally, we employ the network predictions, alongside the collected comment metadata, to extract quantitative information in time-series format. This allows us to build a prototype of flexible dashboard for social media trend monitoring.

Recentemente, molto interesse è stato indirizzato allo studio dell'utilizzo della crescente quantità di dati sotto forma di contenuto proveniente da social media, come tweet, post, e commenti. In questo elaborato, sviluppiamo un sistema per l'analisi del sentiment su queste piattaforme, al fine di estrarne andamenti e informazioni. Ci concentriamo sull'analisi automatizzata di conversazioni politiche in Albania. Adattiamo BERT (Bidirectional Encoder Representations from Transformers), un framework per la modellizzazione del linguaggio naturale, basato su reti neurali Transformer, al fine di risolvere due problemi di sentiment analysis: la classificazione del tono e sentimento complessivo dei commenti (positivo/negativo/neutrale), e la classificazione del livello di concordanza all'interno di coppie post/commento (accordo/neutrale/disaccordo). Studiamo diverse tecniche e ottimizzazioni rivolte al fine-tuning, e introduciamo una versione monolingue di BERT: sqBERT. Infine, sfruttando le predizioni del modello, insieme ai metadati ottenuti dai commenti raccolti, estraiamo informazioni quantitative sotto forma di serie temporali. Questo ci permetterà di sviluppare un prototipo di dashboard interattiva per il monitoring e l'analisi di trend su social media.

What do voters like? Analysis of public sentiment and agreement to Albanian leaders' social media activity

d'Amato, Francesco

2021/2022

Abstract

In recent times, significant efforts have gone into studying how to harness the ever-increasing amount of data that comes in the form of social media content, such as tweets, posts, and comments. In this work, we develop a sentiment analysis system, allowing for extraction of trends and insight from social media comments. We focus on analyzing political discussion in Albania. We adapt BERT (Bidirectional Encoder Representations from Transformers), a language modeling framework based on Transformer neural networks, to tackle two sentiment analysis tasks: sentiment classification of comments (positive/neutral/negative) and level of agreement categorization of post/comment pairs (agree/neutral/disagree). We review various fine-tuning techniques and optimizations, and we introduce a monolingual BERT variant: sqBERT. Finally, we employ the network predictions, alongside the collected comment metadata, to extract quantitative information in time-series format. This allows us to build a prototype of flexible dashboard for social media trend monitoring.

Scheda breve

Scheda completa

	Relatore
	
			ROVERI, MANUEL
		
	Correlatore/i
	
			ALIMEHMETI, GENC
CHIGGIATO, DAVIDE
FALCETTA, ALESSANDRO
RIVA, DIEGO
		
	Scuola / Dip.
	
			ING  - Scuola di Ingegneria Industriale e dell'Informazione
		
	Data
	
			6-ott-2022
		
	Anno accademico
	
			2021/2022
		
	Abstract in italiano
	
			Recentemente, molto interesse è stato indirizzato allo studio dell'utilizzo della crescente quantità di dati sotto forma di contenuto proveniente da social media, come tweet, post, e commenti. In questo elaborato, sviluppiamo un sistema per l'analisi del sentiment su queste piattaforme, al fine di estrarne andamenti e informazioni. Ci concentriamo sull'analisi automatizzata di conversazioni politiche in Albania. Adattiamo BERT (Bidirectional Encoder Representations from Transformers), un framework per la modellizzazione del linguaggio naturale, basato su reti neurali Transformer, al fine di risolvere due problemi di sentiment analysis: la classificazione del tono e sentimento complessivo dei commenti (positivo/negativo/neutrale), e la classificazione del livello di concordanza all'interno di coppie post/commento (accordo/neutrale/disaccordo).
Studiamo diverse tecniche e ottimizzazioni rivolte al fine-tuning, e introduciamo una versione monolingue di BERT: sqBERT. Infine, sfruttando le predizioni del modello, insieme ai metadati ottenuti dai commenti raccolti, estraiamo informazioni quantitative sotto forma di serie temporali. Questo ci permetterà di sviluppare un prototipo di dashboard interattiva per il monitoring e l'analisi di trend su social media.
		
	Appare nelle tipologie:
	
			Tesi di laurea Magistrale

File allegati

File	Dimensione	Formato
THESIS.pdf non accessibile Descrizione: Thesis Dimensione 1.28 MB Formato Adobe PDF Visualizza/Apri	1.28 MB	Adobe PDF	Visualizza/Apri
EXECUTIVE SUMMARY.pdf accessibile in internet solo dagli utenti autorizzati Descrizione: Executive summary Dimensione 493.27 kB Formato Adobe PDF Visualizza/Apri	493.27 kB	Adobe PDF	Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/192397