With the advent of the Web, and even more with the spread of Web 2.0, knowledge is considered one of the most important levers that can enable competitive advantages. For a company it is important to play a leadership role within the industry in which it operates because this ensures that his knowledge is a pervasive element among its employees and is correctly perceived by its customers. Thus, all aspects and techniques related to "how” to explore, to improve and to exploit knowledge, considered as an indicator of enterprise’s high competitiveness, are critical tasks that require and show growing attention. If a company wants to be competitive on the market, it must develop knowledge management systems that deal with identifying, extracting, collecting, classifying and organizing information, produced mainly on the web where its consumers disclose their opinions. For this reason, the WWW as a huge information repository is rapidly becoming the main source of wealth for many companies. Therefore, Text Mining is an important technique for knowledge discovery that makes possible to structure the data in the network, so that it can analyze and build efficient and effective methods to classify automatically the content available on the Internet platform. So, this thesis aims to highlight the strategic importance of this activity and to study the importance of the preprocessing phase, evaluating whether an enrichment of information for each word in the text leads to improvements in the classification accuracy.

Con la nascita del Web e ancor più con la diffusione del Web 2.0, la conoscenza viene considerata una delle leve più importanti che possono abilitare vantaggio competitivo. Per un’azienda è importante assumere il ruolo di leader all’interno del settore in cui opera perché ciò garantisce che la sua conoscenza sia già ampliamente diffusa tra i suoi impiegati e correttamente percepita dai suoi clienti. Di conseguenza, tutti gli aspetti e le tecniche legati al “come” esplorare, esplicitare e valorizzare la conoscenza, intesa come indicatore di alta competitività dell’impresa, sono attività critiche che richiedono e manifestano sempre più attenzione. Un’azienda che vuole quindi essere competitiva sul mercato deve implementare sistemi di gestione della conoscenza che si occupino di individuare, estrarre, collezionare, classificare ed organizzare informazioni, derivanti soprattutto dai suoi consumatori che esplicitano sul web le proprie opinioni. Proprio per questo motivo, il www, un enorme magazzino di informazioni sta diventando rapidamente la principale ricchezza e risorsa per molte società. In questi termini, il text mining è un’importante tecnica di knowledge discovery attraverso la quale è possibile strutturare i dati presenti in rete, in modo da poterli analizzare e costruire efficienti ed efficaci metodi che classifichino in maniera automatica i contenuti disponibili su Internet. Questo elaborato si pone l’obiettivo di evidenziare la strategicità di questa attività e di studiare l’importanza della fase di preprocessing, andando a valutare se un arricchimento delle informazioni relative ad ogni parola presente nel testo porta a miglioramenti nell’accuratezza di classificazione.

Analisi semantica e machine learning per l'attribuzione del sentimento a testi

BERGAMINI, ANNA
2013/2014

Abstract

With the advent of the Web, and even more with the spread of Web 2.0, knowledge is considered one of the most important levers that can enable competitive advantages. For a company it is important to play a leadership role within the industry in which it operates because this ensures that his knowledge is a pervasive element among its employees and is correctly perceived by its customers. Thus, all aspects and techniques related to "how” to explore, to improve and to exploit knowledge, considered as an indicator of enterprise’s high competitiveness, are critical tasks that require and show growing attention. If a company wants to be competitive on the market, it must develop knowledge management systems that deal with identifying, extracting, collecting, classifying and organizing information, produced mainly on the web where its consumers disclose their opinions. For this reason, the WWW as a huge information repository is rapidly becoming the main source of wealth for many companies. Therefore, Text Mining is an important technique for knowledge discovery that makes possible to structure the data in the network, so that it can analyze and build efficient and effective methods to classify automatically the content available on the Internet platform. So, this thesis aims to highlight the strategic importance of this activity and to study the importance of the preprocessing phase, evaluating whether an enrichment of information for each word in the text leads to improvements in the classification accuracy.
ING - Scuola di Ingegneria Industriale e dell'Informazione
25-lug-2014
2013/2014
Con la nascita del Web e ancor più con la diffusione del Web 2.0, la conoscenza viene considerata una delle leve più importanti che possono abilitare vantaggio competitivo. Per un’azienda è importante assumere il ruolo di leader all’interno del settore in cui opera perché ciò garantisce che la sua conoscenza sia già ampliamente diffusa tra i suoi impiegati e correttamente percepita dai suoi clienti. Di conseguenza, tutti gli aspetti e le tecniche legati al “come” esplorare, esplicitare e valorizzare la conoscenza, intesa come indicatore di alta competitività dell’impresa, sono attività critiche che richiedono e manifestano sempre più attenzione. Un’azienda che vuole quindi essere competitiva sul mercato deve implementare sistemi di gestione della conoscenza che si occupino di individuare, estrarre, collezionare, classificare ed organizzare informazioni, derivanti soprattutto dai suoi consumatori che esplicitano sul web le proprie opinioni. Proprio per questo motivo, il www, un enorme magazzino di informazioni sta diventando rapidamente la principale ricchezza e risorsa per molte società. In questi termini, il text mining è un’importante tecnica di knowledge discovery attraverso la quale è possibile strutturare i dati presenti in rete, in modo da poterli analizzare e costruire efficienti ed efficaci metodi che classifichino in maniera automatica i contenuti disponibili su Internet. Questo elaborato si pone l’obiettivo di evidenziare la strategicità di questa attività e di studiare l’importanza della fase di preprocessing, andando a valutare se un arricchimento delle informazioni relative ad ogni parola presente nel testo porta a miglioramenti nell’accuratezza di classificazione.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2014_07_Bergamini.pdf

solo utenti autorizzati dal 08/07/2015

Descrizione: Testo della Tesi
Dimensione 3.61 MB
Formato Adobe PDF
3.61 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/93849