The present thesis work proposes an innovative approach to sentiment classification through the usage of the Conditional Random Fields probabilistic model applied to a company-related Twitter data stream, evaluated using a statistical correlation analysis with the companies` securities prices variation, performed using regression methods. It has been achieved interesting adherences and trends in-between the classified results, labeled with the tailored classification model, which by itself presented solid performance indicators, and the stock market values.

Il presente lavoro di tesi propone un approccio innovativo alla classificazione dei sentimenti tra l`uso del modello probabilistico “Conditional Random Fields” applicato a un flusso di dati estrato da Twitter con l`oggetivo di cercare una correlazione con la variazione dei prezzi delle azioni di due societèa tra l’uso di una analisi statistica di regressione. Risultati interessanti sono stati raggiunti, relative alle aderenze e tendenze in-tra i sentimenti, etichettati con il modello di classificazione costruito (con misure di prestazioni affidabili) e i valori di borsa.

CRF to find stock price correlation with company related Twitter sentiment

SHABUNINA, EKATERINA
2012/2013

Abstract

The present thesis work proposes an innovative approach to sentiment classification through the usage of the Conditional Random Fields probabilistic model applied to a company-related Twitter data stream, evaluated using a statistical correlation analysis with the companies` securities prices variation, performed using regression methods. It has been achieved interesting adherences and trends in-between the classified results, labeled with the tailored classification model, which by itself presented solid performance indicators, and the stock market values.
ING - Scuola di Ingegneria Industriale e dell'Informazione
24-lug-2013
2012/2013
Il presente lavoro di tesi propone un approccio innovativo alla classificazione dei sentimenti tra l`uso del modello probabilistico “Conditional Random Fields” applicato a un flusso di dati estrato da Twitter con l`oggetivo di cercare una correlazione con la variazione dei prezzi delle azioni di due societèa tra l’uso di una analisi statistica di regressione. Risultati interessanti sono stati raggiunti, relative alle aderenze e tendenze in-tra i sentimenti, etichettati con il modello di classificazione costruito (con misure di prestazioni affidabili) e i valori di borsa.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2013_07_Shabunina.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 1.88 MB
Formato Adobe PDF
1.88 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/80687