This graduate thesis is part of a broader research project which aims to design a methodology and related tools to perform evaluations on the Web reputation of brands from texts that come from the Web. Existing tools for reputation analysis can be divided into two categories: semantic and non semantic. The first base their evaluation of the reputation content of Web information on the semantic interpretation of natural language. The second base their competitiveness on the vastness of the Web information that they consider (high number of sources), but provide a gross evaluation of the reputation content that is obtained without an understanding of the semantic of the content itself. This research, and so the work of thesis, focuses on the first type of tools. Currently we are observing the explosion of Web 2.0 services, like Facebook and Twitter. Web users express their opinions through those services and the monitoring of such sources is becoming also important for marketing purposes. This graduate thesis focuses on the development of a tool for the categorization and Sentiment Analysis of texts extracted from Web 2.0 sources. To reach this purpose, a new semantic network was created and, thanks to this network, it was possible to avoid using tools that already exist in the literature like WordNet, which have important limitations. In order to evaluate the quality of the devoloped tool, we compared our results with the ones of a benchmark tool.

Questo lavoro di tesi trova collocazione come parte di un progetto di ricerca il cui fine è quello di definire una metodologia di costruzione di una rete semantica e dei relativi strumenti per utilizzarla ed effettuare valutazioni sulla Web reputation di brand su testi provenienti dalla rete Internet. Il progetto di ricerca, e quindi questo lavoro di tesi, è focalizzato sugli strumenti semantici. Attualmente stiamo assistendo all’esplosione di piattaforme Web 2.0, tra le quali non possiamo non citare Facebook e Twitter. Gli utenti della rete ormai, esprimono le loro opinioni attraverso queste piattaforme ed è per questo che il loro monitoraggio sta diventando di capitale importanza anche dal punto di vista del marketing. Ciò che questo lavoro di tesi si pone come obiettivo, è quindi quello di sviluppare uno strumento in grado di effettuare la Sentiment Analysis e la categorazzazione di testi provenienti da fonti Web 2.0. Per riuscire a raggiungere questo scopo è stata creata una nuova rete semantica di base che permettesse di non dover più ricorrere a prodotti già esistenti in letteratura, come ad esempio WordNet, a causa delle sue importanti limitazioni, ed avesse tutte le caratteristiche necessarie per l’analisi di testi caratterizzati da una scarsa attenzione per l’ortografia e la punteggiatura. Per valutare la qualità dello strumento sviluppato è stato infine fatto un confronto con uno strumento di benchmark presente sul mercato.

Progettazione e validazione empirica di una rete semantica orientata alla sentiment analysis

CEREDA, LUCA
2009/2010

Abstract

This graduate thesis is part of a broader research project which aims to design a methodology and related tools to perform evaluations on the Web reputation of brands from texts that come from the Web. Existing tools for reputation analysis can be divided into two categories: semantic and non semantic. The first base their evaluation of the reputation content of Web information on the semantic interpretation of natural language. The second base their competitiveness on the vastness of the Web information that they consider (high number of sources), but provide a gross evaluation of the reputation content that is obtained without an understanding of the semantic of the content itself. This research, and so the work of thesis, focuses on the first type of tools. Currently we are observing the explosion of Web 2.0 services, like Facebook and Twitter. Web users express their opinions through those services and the monitoring of such sources is becoming also important for marketing purposes. This graduate thesis focuses on the development of a tool for the categorization and Sentiment Analysis of texts extracted from Web 2.0 sources. To reach this purpose, a new semantic network was created and, thanks to this network, it was possible to avoid using tools that already exist in the literature like WordNet, which have important limitations. In order to evaluate the quality of the devoloped tool, we compared our results with the ones of a benchmark tool.
BARBAGALLO, DONATO
ING V - Facolta' di Ingegneria dell'Informazione
31-mar-2011
2009/2010
Questo lavoro di tesi trova collocazione come parte di un progetto di ricerca il cui fine è quello di definire una metodologia di costruzione di una rete semantica e dei relativi strumenti per utilizzarla ed effettuare valutazioni sulla Web reputation di brand su testi provenienti dalla rete Internet. Il progetto di ricerca, e quindi questo lavoro di tesi, è focalizzato sugli strumenti semantici. Attualmente stiamo assistendo all’esplosione di piattaforme Web 2.0, tra le quali non possiamo non citare Facebook e Twitter. Gli utenti della rete ormai, esprimono le loro opinioni attraverso queste piattaforme ed è per questo che il loro monitoraggio sta diventando di capitale importanza anche dal punto di vista del marketing. Ciò che questo lavoro di tesi si pone come obiettivo, è quindi quello di sviluppare uno strumento in grado di effettuare la Sentiment Analysis e la categorazzazione di testi provenienti da fonti Web 2.0. Per riuscire a raggiungere questo scopo è stata creata una nuova rete semantica di base che permettesse di non dover più ricorrere a prodotti già esistenti in letteratura, come ad esempio WordNet, a causa delle sue importanti limitazioni, ed avesse tutte le caratteristiche necessarie per l’analisi di testi caratterizzati da una scarsa attenzione per l’ortografia e la punteggiatura. Per valutare la qualità dello strumento sviluppato è stato infine fatto un confronto con uno strumento di benchmark presente sul mercato.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Tesi.pdf

non accessibile

Descrizione: Testo della tesi
Dimensione 2.61 MB
Formato Adobe PDF
2.61 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/17143