With the recent explosive growth of social media on the Web, Sentiment Analysis has become increasingly effective in decision-making processes. Stock trading is a complex decision-making process characterized by noisy and non-stationary data, high degree of uncertainty and hidden relations. This study investigates to what extent Sentiment Analysis can be effective on the stock trading process. The research is conducted on ten Dutch stocks by making use of Parabots' sentiment data. Classification techniques are used to predict next-day stock returns and to guide a long, short or stay out trading strategy. Since no single Data Mining technique is superior over all others for all domains, different classification and validation methods are tested and compared. Moreover, parameters of classifiers and selections of features are optimized to increase the classification accuracy. Results indicate that K-Nearest-Neighbor and Stratified 10-Fold Cross-Validation are respectively the most suitable classification and validation technique for next-day stock return classification. In addition, results show that Parabots' Sentiment Analysis is an influencing factor in classifying next-day stock returns. Finally, results of trading simulations (based on real trading costs) indicate that the proposed long, short or stay out trading strategy based on next-day stock return classification and Sentiment Analysis is profitable. Positive returns are generated on all the ten tested stocks, with six cases over ten in which the achieved profits are significantly higher than the profits generated by the Buy and Hold benchmark trading strategy.

Con la recente crescita dei social media sul Web, l'Analisi Sentimentale è diventata sempre più efficace nei processi decisionali. Il trading è un processo decisionale complesso caratterizzato da dati rumorosi e non stazionari, elevato grado di incertezza e relazioni nascoste. Questo studio indaga in quale misura l'Analisi Sentimentale può essere efficace nel processo di trading. La ricerca è condotta su dieci azioni olandesi utilizzando dati sentimentali raccolti da Parabots. Tecniche di classificazione sono utilizzate per prevedere il ritorno azionario giornaliero futuro dei titoli azionari e per guidare una strategia di trading long, short o stay out. Poiché in Data Mining non esiste una tecnica superiore su tutte le altre per tutti i domini, metodi diversi di classificazione e di validazione sono confrontati. Inoltre, i parametri dei classificatori e gli attributi selezionati sono entrambi ottimizzati. Tale procedura consente l'aumento dell'accuratezza di classificazione. Risultati sperimentali indicano che K-Nearest-Neighbor e Stratified 10-Fold Cross-Validation sono rispettivamente le tecniche di classificazione e validazione più adatte per classificare i ritorni azionari giornalieri futuri. Inoltre, l'Analisi Sentimentale di Parabots è dimostrata essere un fattore importante per tale classificazione. Infine, risultati di simulazioni finanziarie (sulla base di costi d'investimento reali) evidenziano che la strategia di investimento proposta in questa ricerca basata su Analisi Sentimentale e classificazione è redditizia. Profitti positivi sono generati su tutte le dieci azioni esaminate, con sei casi su dieci in cui gli utili conseguiti sono significativamente più elevati dei profitti generati dalla strategia di riferimento Buy and Hold.

Next day stock return classification using sentiment analysis

CASATI, ANDREA
2011/2012

Abstract

With the recent explosive growth of social media on the Web, Sentiment Analysis has become increasingly effective in decision-making processes. Stock trading is a complex decision-making process characterized by noisy and non-stationary data, high degree of uncertainty and hidden relations. This study investigates to what extent Sentiment Analysis can be effective on the stock trading process. The research is conducted on ten Dutch stocks by making use of Parabots' sentiment data. Classification techniques are used to predict next-day stock returns and to guide a long, short or stay out trading strategy. Since no single Data Mining technique is superior over all others for all domains, different classification and validation methods are tested and compared. Moreover, parameters of classifiers and selections of features are optimized to increase the classification accuracy. Results indicate that K-Nearest-Neighbor and Stratified 10-Fold Cross-Validation are respectively the most suitable classification and validation technique for next-day stock return classification. In addition, results show that Parabots' Sentiment Analysis is an influencing factor in classifying next-day stock returns. Finally, results of trading simulations (based on real trading costs) indicate that the proposed long, short or stay out trading strategy based on next-day stock return classification and Sentiment Analysis is profitable. Positive returns are generated on all the ten tested stocks, with six cases over ten in which the achieved profits are significantly higher than the profits generated by the Buy and Hold benchmark trading strategy.
BISON, PIETER
ING V - Scuola di Ingegneria dell'Informazione
20-dic-2012
2011/2012
Con la recente crescita dei social media sul Web, l'Analisi Sentimentale è diventata sempre più efficace nei processi decisionali. Il trading è un processo decisionale complesso caratterizzato da dati rumorosi e non stazionari, elevato grado di incertezza e relazioni nascoste. Questo studio indaga in quale misura l'Analisi Sentimentale può essere efficace nel processo di trading. La ricerca è condotta su dieci azioni olandesi utilizzando dati sentimentali raccolti da Parabots. Tecniche di classificazione sono utilizzate per prevedere il ritorno azionario giornaliero futuro dei titoli azionari e per guidare una strategia di trading long, short o stay out. Poiché in Data Mining non esiste una tecnica superiore su tutte le altre per tutti i domini, metodi diversi di classificazione e di validazione sono confrontati. Inoltre, i parametri dei classificatori e gli attributi selezionati sono entrambi ottimizzati. Tale procedura consente l'aumento dell'accuratezza di classificazione. Risultati sperimentali indicano che K-Nearest-Neighbor e Stratified 10-Fold Cross-Validation sono rispettivamente le tecniche di classificazione e validazione più adatte per classificare i ritorni azionari giornalieri futuri. Inoltre, l'Analisi Sentimentale di Parabots è dimostrata essere un fattore importante per tale classificazione. Infine, risultati di simulazioni finanziarie (sulla base di costi d'investimento reali) evidenziano che la strategia di investimento proposta in questa ricerca basata su Analisi Sentimentale e classificazione è redditizia. Profitti positivi sono generati su tutte le dieci azioni esaminate, con sei casi su dieci in cui gli utili conseguiti sono significativamente più elevati dei profitti generati dalla strategia di riferimento Buy and Hold.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2012_12_Casati.pdf

non accessibile

Descrizione: Testo della tesi
Dimensione 1.59 MB
Formato Adobe PDF
1.59 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/72543