Analisi semantica e machine learning  per l'attribuzione del sentimento a testi

With the advent of the Web, and even more with the spread of Web 2.0, knowledge is considered one of the most important levers that can enable competitive advantages. For a company it is important to play a leadership role within the industry in which it operates because this ensures that his knowledge is a pervasive element among its employees and is correctly perceived by its customers. Thus, all aspects and techniques related to "how” to explore, to improve and to exploit knowledge, considered as an indicator of enterprise’s high competitiveness, are critical tasks that require and show growing attention. If a company wants to be competitive on the market, it must develop knowledge management systems that deal with identifying, extracting, collecting, classifying and organizing information, produced mainly on the web where its consumers disclose their opinions. For this reason, the WWW as a huge information repository is rapidly becoming the main source of wealth for many companies. Therefore, Text Mining is an important technique for knowledge discovery that makes possible to structure the data in the network, so that it can analyze and build efficient and effective methods to classify automatically the content available on the Internet platform. So, this thesis aims to highlight the strategic importance of this activity and to study the importance of the preprocessing phase, evaluating whether an enrichment of information for each word in the text leads to improvements in the classification accuracy.

Con la nascita del Web e ancor più con la diffusione del Web 2.0, la conoscenza viene considerata una delle leve più importanti che possono abilitare vantaggio competitivo. Per un’azienda è importante assumere il ruolo di leader all’interno del settore in cui opera perché ciò garantisce che la sua conoscenza sia già ampliamente diffusa tra i suoi impiegati e correttamente percepita dai suoi clienti. Di conseguenza, tutti gli aspetti e le tecniche legati al “come” esplorare, esplicitare e valorizzare la conoscenza, intesa come indicatore di alta competitività dell’impresa, sono attività critiche che richiedono e manifestano sempre più attenzione. Un’azienda che vuole quindi essere competitiva sul mercato deve implementare sistemi di gestione della conoscenza che si occupino di individuare, estrarre, collezionare, classificare ed organizzare informazioni, derivanti soprattutto dai suoi consumatori che esplicitano sul web le proprie opinioni. Proprio per questo motivo, il www, un enorme magazzino di informazioni sta diventando rapidamente la principale ricchezza e risorsa per molte società. In questi termini, il text mining è un’importante tecnica di knowledge discovery attraverso la quale è possibile strutturare i dati presenti in rete, in modo da poterli analizzare e costruire efficienti ed efficaci metodi che classifichino in maniera automatica i contenuti disponibili su Internet. Questo elaborato si pone l’obiettivo di evidenziare la strategicità di questa attività e di studiare l’importanza della fase di preprocessing, andando a valutare se un arricchimento delle informazioni relative ad ogni parola presente nel testo porta a miglioramenti nell’accuratezza di classificazione.

Analisi semantica e machine learning per l'attribuzione del sentimento a testi

BERGAMINI, ANNA

2013/2014

Abstract

With the advent of the Web, and even more with the spread of Web 2.0, knowledge is considered one of the most important levers that can enable competitive advantages. For a company it is important to play a leadership role within the industry in which it operates because this ensures that his knowledge is a pervasive element among its employees and is correctly perceived by its customers. Thus, all aspects and techniques related to "how” to explore, to improve and to exploit knowledge, considered as an indicator of enterprise’s high competitiveness, are critical tasks that require and show growing attention. If a company wants to be competitive on the market, it must develop knowledge management systems that deal with identifying, extracting, collecting, classifying and organizing information, produced mainly on the web where its consumers disclose their opinions. For this reason, the WWW as a huge information repository is rapidly becoming the main source of wealth for many companies. Therefore, Text Mining is an important technique for knowledge discovery that makes possible to structure the data in the network, so that it can analyze and build efficient and effective methods to classify automatically the content available on the Internet platform. So, this thesis aims to highlight the strategic importance of this activity and to study the importance of the preprocessing phase, evaluating whether an enrichment of information for each word in the text leads to improvements in the classification accuracy.

Scheda breve

Scheda completa

	Relatore
	
				VERCELLIS, CARLO
			
	Scuola / Dip.
	
				ING  - Scuola di Ingegneria Industriale e dell'Informazione
			
	Data
	
				25-lug-2014
			
	Anno accademico
	
				2013/2014
			
	Abstract in italiano
	
				Con la nascita del Web e ancor più con la diffusione del Web 2.0, la conoscenza viene considerata una delle leve più importanti che possono abilitare vantaggio competitivo. Per un’azienda è importante assumere il ruolo di leader all’interno del settore in cui opera perché ciò garantisce che la sua conoscenza sia già ampliamente diffusa tra i suoi impiegati e correttamente percepita
dai suoi clienti.
Di conseguenza, tutti gli aspetti e le tecniche legati al “come” esplorare, esplicitare e valorizzare la conoscenza, intesa come indicatore di alta competitività dell’impresa, sono attività critiche che richiedono e manifestano sempre più attenzione.
Un’azienda che vuole quindi essere competitiva sul mercato deve implementare sistemi di gestione della conoscenza che si occupino di individuare, estrarre, collezionare, classificare ed organizzare informazioni, derivanti soprattutto dai suoi consumatori che esplicitano sul web le proprie opinioni. Proprio per questo motivo, il www, un enorme magazzino di informazioni sta diventando rapidamente la principale ricchezza e risorsa per molte società.
In questi termini, il text mining è un’importante tecnica di knowledge discovery attraverso la quale è possibile strutturare i dati presenti in rete, in modo da poterli analizzare e costruire efficienti ed efficaci metodi che classifichino in maniera automatica i contenuti disponibili su Internet. 
Questo elaborato si pone l’obiettivo di evidenziare la strategicità di questa attività e di studiare l’importanza della fase di preprocessing, andando a valutare se un arricchimento delle informazioni relative ad ogni parola presente nel testo porta a miglioramenti nell’accuratezza di classificazione.
			
	Tipo di documento
	
				Tesi di laurea Magistrale
			
	Appare nelle tipologie:
	
				Tesi di laurea Magistrale

File allegati

File	Dimensione	Formato
2014_07_Bergamini.pdf solo utenti autorizzati dal 08/07/2015 Descrizione: Testo della Tesi Dimensione 3.61 MB Formato Adobe PDF Visualizza/Apri	3.61 MB	Adobe PDF	Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/93849

Analisi semantica e machine learning per l'attribuzione del sentimento a testi

BERGAMINI, ANNA

2013/2014

Abstract

Scheda breve Scheda completa

----- Informazioni -----

Conferma cancellazione

Scheda breve

Scheda completa