Thanks to the Web 2.0 technologies, Social Media usage and User Generated Content creation spread, thus enabling all the Internet users to express themselves and share their opinions with many other people. This phenomenon has gained great relevance among knowledge workers, who can analyze textual content published on the Internet in order to obtain information and therefore knowledge, that can be useful in any decision making process. In order to identify opinions and moods expressed by an author regarding an entity or event, several Sentiment Analysis methods emerged. This kind of analysis has been applied with varied goals to different domains, such as health, finance, politics, sociology and psychology. In this thesis, Machine Learning techniques have been applied to extract sentiment from tweets regarding two relevant media events: the European elections 2014 in Italy and the Brasil 2014 FIFA World Cup final. The objectives of this study are manifold. The first goal involves the selection of a classification algorithm in order to label every tweet with its polarity (positive, negative or neutral). The second one concerns the possibility of using these results for a predictive purpose. As regards the political topic only, one last objective is to monitor the time trend of the sentiment related to parties and thus correlate its fluctuations with electoral campaign specific events.
L’avvento dei Social Media e la diffusione degli User Generated Content, nati grazie alle tecnologie del Web 2.0, hanno permesso a tutti gli utenti della Rete di esprimere e condividere la propria opinione con il resto del mondo. Questo fenomeno è di notevole importanza anche per i knowledge worker, i quali, analizzando i contenuti testuali pubblicati su Internet possono ricavare informazioni e, conseguentemente, conoscenza utilizzabile in fase decisionale. È in questo contesto che si sono quindi affermati molteplici metodi di Sentiment Analysis (SA), aventi come scopo l’identificazione e la classificazione delle opinioni e degli umori, espressi da un autore in relazione ad un’entità o un evento, a seconda della loro polarità. Questo tipo di analisi è stato utilizzato con obiettivi diversi in numerosi settori, come ad esempio in sanità, finanza, politica, sociologia e psicologia. In questo lavoro di tesi sono state applicate delle tecniche di Machine Learning per l’analisi del sentiment di testi provenienti dal sito di microblogging Twitter in relazione a due eventi mediatici: le Elezioni Europee in Italia del 25 maggio 2014 e la finale dei Mondiali di Calcio Brasile 2014. Gli obiettivi di questo studio sono molteplici: innanzitutto si vuole utilizzare un algoritmo di classificazione per associare in maniera automatica ad ogni tweet la rispettiva polarità, positiva, negativa o neutra. Secondariamente, si vuole verificare la possibilità di utilizzare i risultati così ottenuti da Twitter a scopo predittivo e, infine, solamente per l’argomento politico, si intende monitorare l’andamento temporale del sentiment relativo ai partiti correlandone le fluttuazioni con eventi specifici della campagna elettorale.
Tecniche di machine learning per l'analisi del sentiment di testi su Twitter
OTTAVIANI, MARCO;PACCA, GIULIA
2013/2014
Abstract
Thanks to the Web 2.0 technologies, Social Media usage and User Generated Content creation spread, thus enabling all the Internet users to express themselves and share their opinions with many other people. This phenomenon has gained great relevance among knowledge workers, who can analyze textual content published on the Internet in order to obtain information and therefore knowledge, that can be useful in any decision making process. In order to identify opinions and moods expressed by an author regarding an entity or event, several Sentiment Analysis methods emerged. This kind of analysis has been applied with varied goals to different domains, such as health, finance, politics, sociology and psychology. In this thesis, Machine Learning techniques have been applied to extract sentiment from tweets regarding two relevant media events: the European elections 2014 in Italy and the Brasil 2014 FIFA World Cup final. The objectives of this study are manifold. The first goal involves the selection of a classification algorithm in order to label every tweet with its polarity (positive, negative or neutral). The second one concerns the possibility of using these results for a predictive purpose. As regards the political topic only, one last objective is to monitor the time trend of the sentiment related to parties and thus correlate its fluctuations with electoral campaign specific events.File | Dimensione | Formato | |
---|---|---|---|
2015_4_Ottaviani_Pacca.pdf
non accessibile
Descrizione: Testo della tesi
Dimensione
5.02 MB
Formato
Adobe PDF
|
5.02 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/107979