This graduate thesis is part of a broader research project which aims to design a methodology and related tools to perform evaluations on the Web reputation of brands from texts that come from the Web. Existing tools for reputation analysis can be divided into two categories: semantic and non semantic. The first base their evaluation of the reputation content of Web information on the semantic interpretation of natural language. The second base their competitiveness on the vastness of the Web information that they consider (high number of sources), but provide a gross evaluation of the reputation content that is obtained without an understanding of the semantic of the content itself. This research, and so the work of thesis, focuses on the first type of tools. Currently we are observing the explosion of Web 2.0 services, like Facebook and Twitter. Web users express their opinions through those services and the monitoring of such sources is becoming also important for marketing purposes. This graduate thesis focuses on the development of a tool for the categorization and Sentiment Analysis of texts extracted from Web 2.0 sources. To reach this purpose, a new semantic network was created and, thanks to this network, it was possible to avoid using tools that already exist in the literature like WordNet, which have important limitations. In order to evaluate the quality of the devoloped tool, we compared our results with the ones of a benchmark tool.
Questo lavoro di tesi trova collocazione come parte di un progetto di ricerca il cui fine è quello di definire una metodologia di costruzione di una rete semantica e dei relativi strumenti per utilizzarla ed effettuare valutazioni sulla Web reputation di brand su testi provenienti dalla rete Internet. Il progetto di ricerca, e quindi questo lavoro di tesi, è focalizzato sugli strumenti semantici. Attualmente stiamo assistendo all’esplosione di piattaforme Web 2.0, tra le quali non possiamo non citare Facebook e Twitter. Gli utenti della rete ormai, esprimono le loro opinioni attraverso queste piattaforme ed è per questo che il loro monitoraggio sta diventando di capitale importanza anche dal punto di vista del marketing. Ciò che questo lavoro di tesi si pone come obiettivo, è quindi quello di sviluppare uno strumento in grado di effettuare la Sentiment Analysis e la categorazzazione di testi provenienti da fonti Web 2.0. Per riuscire a raggiungere questo scopo è stata creata una nuova rete semantica di base che permettesse di non dover più ricorrere a prodotti già esistenti in letteratura, come ad esempio WordNet, a causa delle sue importanti limitazioni, ed avesse tutte le caratteristiche necessarie per l’analisi di testi caratterizzati da una scarsa attenzione per l’ortografia e la punteggiatura. Per valutare la qualità dello strumento sviluppato è stato infine fatto un confronto con uno strumento di benchmark presente sul mercato.
Progettazione e validazione empirica di una rete semantica orientata alla sentiment analysis
CEREDA, LUCA
2009/2010
Abstract
This graduate thesis is part of a broader research project which aims to design a methodology and related tools to perform evaluations on the Web reputation of brands from texts that come from the Web. Existing tools for reputation analysis can be divided into two categories: semantic and non semantic. The first base their evaluation of the reputation content of Web information on the semantic interpretation of natural language. The second base their competitiveness on the vastness of the Web information that they consider (high number of sources), but provide a gross evaluation of the reputation content that is obtained without an understanding of the semantic of the content itself. This research, and so the work of thesis, focuses on the first type of tools. Currently we are observing the explosion of Web 2.0 services, like Facebook and Twitter. Web users express their opinions through those services and the monitoring of such sources is becoming also important for marketing purposes. This graduate thesis focuses on the development of a tool for the categorization and Sentiment Analysis of texts extracted from Web 2.0 sources. To reach this purpose, a new semantic network was created and, thanks to this network, it was possible to avoid using tools that already exist in the literature like WordNet, which have important limitations. In order to evaluate the quality of the devoloped tool, we compared our results with the ones of a benchmark tool.File | Dimensione | Formato | |
---|---|---|---|
Tesi.pdf
non accessibile
Descrizione: Testo della tesi
Dimensione
2.61 MB
Formato
Adobe PDF
|
2.61 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/17143