L'obiettivo di questa tesi è quello di applicare la sentiment analysis ai social network, analizzando i metodi preesistenti e formulando delle nuove strategie per determinare un classficatore più preciso ed accurato. Dopo un breve excursus sulla letteratura si presenterà il metodo di classificazione aggregata di Hopkins e King, che risulta essere quello più adatto all'obiettivo prefissato, valutandone tutte le sue caratteristiche, i vantaggi e gli svantaggi. Successivamente si propongono alcune strategie innovative che da una parte sfruttano la classificazione classica, detta individuale, per selezionare e pesare opportunamente le parole dei testi, dall'altra si propongono di ridurre la complessità testuale tramite la sostituzione dei termini con i sinonimi, con l'obiettivo, in entrambe i casi, di migliorare le prestazioni della classificazione. Si valutano quindi i metodi applicandoli allo studio del sentiment espresso dalla popolazione Twitter sull'esposizione universale Expo Milano 2015, Nutrire il Pianeta, Energia per la Vita. I risultati evidenziano che le nuove strategie portano in alcuni casi a dei miglioramenti rispetto alle strategie preesistenti, arrivando quindi alla conclusione che la strada percorsa è buona, ma deve essere approfondita e valutata meglio. In conclusione sono stati discussi tutti i problemi che ci sono stati e che devono essere ancora risolti, riguardanti principalmente l'aspetto pratico di trattare con variabili rappresentate da stringhe di caratteri e quindi i possibili sviluppi futuri.
Nuove strategie per la sentiment analysis applicata ai social network. Analisi dei tweet su Expo Milano 2015
SATTA, MATTIA
2014/2015
Abstract
L'obiettivo di questa tesi è quello di applicare la sentiment analysis ai social network, analizzando i metodi preesistenti e formulando delle nuove strategie per determinare un classficatore più preciso ed accurato. Dopo un breve excursus sulla letteratura si presenterà il metodo di classificazione aggregata di Hopkins e King, che risulta essere quello più adatto all'obiettivo prefissato, valutandone tutte le sue caratteristiche, i vantaggi e gli svantaggi. Successivamente si propongono alcune strategie innovative che da una parte sfruttano la classificazione classica, detta individuale, per selezionare e pesare opportunamente le parole dei testi, dall'altra si propongono di ridurre la complessità testuale tramite la sostituzione dei termini con i sinonimi, con l'obiettivo, in entrambe i casi, di migliorare le prestazioni della classificazione. Si valutano quindi i metodi applicandoli allo studio del sentiment espresso dalla popolazione Twitter sull'esposizione universale Expo Milano 2015, Nutrire il Pianeta, Energia per la Vita. I risultati evidenziano che le nuove strategie portano in alcuni casi a dei miglioramenti rispetto alle strategie preesistenti, arrivando quindi alla conclusione che la strada percorsa è buona, ma deve essere approfondita e valutata meglio. In conclusione sono stati discussi tutti i problemi che ci sono stati e che devono essere ancora risolti, riguardanti principalmente l'aspetto pratico di trattare con variabili rappresentate da stringhe di caratteri e quindi i possibili sviluppi futuri.File | Dimensione | Formato | |
---|---|---|---|
2015_04_SATTA.pdf
accessibile in internet per tutti
Descrizione: Testo della tesi
Dimensione
2.59 MB
Formato
Adobe PDF
|
2.59 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/107286