L'obiettivo di questa tesi è quello di applicare la sentiment analysis ai social network, analizzando i metodi preesistenti e formulando delle nuove strategie per determinare un classficatore più preciso ed accurato. Dopo un breve excursus sulla letteratura si presenterà il metodo di classificazione aggregata di Hopkins e King, che risulta essere quello più adatto all'obiettivo prefissato, valutandone tutte le sue caratteristiche, i vantaggi e gli svantaggi. Successivamente si propongono alcune strategie innovative che da una parte sfruttano la classificazione classica, detta individuale, per selezionare e pesare opportunamente le parole dei testi, dall'altra si propongono di ridurre la complessità testuale tramite la sostituzione dei termini con i sinonimi, con l'obiettivo, in entrambe i casi, di migliorare le prestazioni della classificazione. Si valutano quindi i metodi applicandoli allo studio del sentiment espresso dalla popolazione Twitter sull'esposizione universale Expo Milano 2015, Nutrire il Pianeta, Energia per la Vita. I risultati evidenziano che le nuove strategie portano in alcuni casi a dei miglioramenti rispetto alle strategie preesistenti, arrivando quindi alla conclusione che la strada percorsa è buona, ma deve essere approfondita e valutata meglio. In conclusione sono stati discussi tutti i problemi che ci sono stati e che devono essere ancora risolti, riguardanti principalmente l'aspetto pratico di trattare con variabili rappresentate da stringhe di caratteri e quindi i possibili sviluppi futuri.

Nuove strategie per la sentiment analysis applicata ai social network. Analisi dei tweet su Expo Milano 2015

SATTA, MATTIA
2014/2015

Abstract

L'obiettivo di questa tesi è quello di applicare la sentiment analysis ai social network, analizzando i metodi preesistenti e formulando delle nuove strategie per determinare un classficatore più preciso ed accurato. Dopo un breve excursus sulla letteratura si presenterà il metodo di classificazione aggregata di Hopkins e King, che risulta essere quello più adatto all'obiettivo prefissato, valutandone tutte le sue caratteristiche, i vantaggi e gli svantaggi. Successivamente si propongono alcune strategie innovative che da una parte sfruttano la classificazione classica, detta individuale, per selezionare e pesare opportunamente le parole dei testi, dall'altra si propongono di ridurre la complessità testuale tramite la sostituzione dei termini con i sinonimi, con l'obiettivo, in entrambe i casi, di migliorare le prestazioni della classificazione. Si valutano quindi i metodi applicandoli allo studio del sentiment espresso dalla popolazione Twitter sull'esposizione universale Expo Milano 2015, Nutrire il Pianeta, Energia per la Vita. I risultati evidenziano che le nuove strategie portano in alcuni casi a dei miglioramenti rispetto alle strategie preesistenti, arrivando quindi alla conclusione che la strada percorsa è buona, ma deve essere approfondita e valutata meglio. In conclusione sono stati discussi tutti i problemi che ci sono stati e che devono essere ancora risolti, riguardanti principalmente l'aspetto pratico di trattare con variabili rappresentate da stringhe di caratteri e quindi i possibili sviluppi futuri.
ING - Scuola di Ingegneria Industriale e dell'Informazione
29-apr-2015
2014/2015
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2015_04_SATTA.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 2.59 MB
Formato Adobe PDF
2.59 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/107286