The overall purpose of this thesis is to study the correlation between scattered public mood and financial markets. The study of the impact of investors’ sentiment on stock returns has gained increasing momentum in the past few years, and it has been widely accepted that public mood is correlated with financial markets. Nevertheless, only a very scam number of studies discuss in which way public financial sentiment affects the fundamental problems of computational finance. For this reason, the first three articles present a solution to three classical problems of applied finance: the portfolio allocation problem, the formalization of market views and the use of mixed methods for stock returns prediction. Those solutions are implemented through machine learning methods driven by public financial sentiment, lagged data and others technical indicators. The financial sentiment is collected from different online sources and analysed by means of sentiment analysis (SA) techniques. One of the main issue observed in the conclusion of these three articles is the scarcity available data. Financial lexicon, financial sentiment time series and financial mood data in general are few and often incomplete. For this reason, the fourth paper focuses on the problem of data augmentation, proposing a novel approach to simultaneously train a sentiment classifier on sentiment classes and generate synthetic domain-conditional and class-conditional data. The aim of this research is to produce a sufficient data base for the training of Machine Learning (ML) models for sentiment classification.

Questa tesi è volta a studiare la correlazione tra i mercati finanziari e l’umore espresso online dagli investitori. Lo studio dell’impatto del “sentiment” degli investitori sui mercati finanziari ha acquisito grande popolarità negli ultimi anni, ed è ormai assodato che esiste una correlazione tra l’umore espresso pubblicamente e l’andamento dei mercati finanziari. Tuttavia il numero degli studi riguardo a come tali fenomeni influenzino i problemi fondamentali della finanzia computazionale è assai esiguo. Per questo motivo, i primi tre articoli che compongono questa tesi presentano tre possibili soluzioni di tre problemi classici in finanza: il problema dell’ottimizzazione di un portafoglio di titoli, quello della generazioni di market views ed infine l’uso di metodi misti per la predizione dell’andamento dei titoli. Tali soluzioni sono derivate tramite l’uso di algoritmi di machine learning, integrati con dai di sentiment ovvero serie storiche ovvero indicatori tecnici. L’umore finanziario è stato ottenuto tramite diverse fonti online ed analizzato tramite tecniche di sentiment analysis (SA). In questo contesto, uno dei problemi principali riscontrato dalla maggior parte dei ricercatori riguarda la carenza di dati. I vocabolari di termini finanziari corredati di dati riguardanti il sentiment, l’andamento temporale dell’umore degli investitori e più in generale i dataset riguardanti le opinioni riguardo ai mercati finanziari sono pochi e spesso incompleti. Per questa ragione il quarto articolo si focalizza sul problema dell’accrescimento dei dati. Proporremo infatti un approccio originale che consente di allenare un classificatore per il riconoscimento del sentiment e allo stesso tempo di generare nuove frasi sintetiche. Tali nuovi dati saranno specifici sia per il dominio di appartenenza sia per il sentiment espresso. Lo scopo finale è quello di produrre una base di dati che sia sufficiente per allenare un algoritmo di machine learning (ML) per la classificazione delle opinioni.

Investigating the impact of public mood in the stock market

MALANDRI, LORENZO

Abstract

The overall purpose of this thesis is to study the correlation between scattered public mood and financial markets. The study of the impact of investors’ sentiment on stock returns has gained increasing momentum in the past few years, and it has been widely accepted that public mood is correlated with financial markets. Nevertheless, only a very scam number of studies discuss in which way public financial sentiment affects the fundamental problems of computational finance. For this reason, the first three articles present a solution to three classical problems of applied finance: the portfolio allocation problem, the formalization of market views and the use of mixed methods for stock returns prediction. Those solutions are implemented through machine learning methods driven by public financial sentiment, lagged data and others technical indicators. The financial sentiment is collected from different online sources and analysed by means of sentiment analysis (SA) techniques. One of the main issue observed in the conclusion of these three articles is the scarcity available data. Financial lexicon, financial sentiment time series and financial mood data in general are few and often incomplete. For this reason, the fourth paper focuses on the problem of data augmentation, proposing a novel approach to simultaneously train a sentiment classifier on sentiment classes and generate synthetic domain-conditional and class-conditional data. The aim of this research is to produce a sufficient data base for the training of Machine Learning (ML) models for sentiment classification.
TRUCCO, PAOLO
COLOMBO, MASSIMO GAETANO
22-gen-2019
Questa tesi è volta a studiare la correlazione tra i mercati finanziari e l’umore espresso online dagli investitori. Lo studio dell’impatto del “sentiment” degli investitori sui mercati finanziari ha acquisito grande popolarità negli ultimi anni, ed è ormai assodato che esiste una correlazione tra l’umore espresso pubblicamente e l’andamento dei mercati finanziari. Tuttavia il numero degli studi riguardo a come tali fenomeni influenzino i problemi fondamentali della finanzia computazionale è assai esiguo. Per questo motivo, i primi tre articoli che compongono questa tesi presentano tre possibili soluzioni di tre problemi classici in finanza: il problema dell’ottimizzazione di un portafoglio di titoli, quello della generazioni di market views ed infine l’uso di metodi misti per la predizione dell’andamento dei titoli. Tali soluzioni sono derivate tramite l’uso di algoritmi di machine learning, integrati con dai di sentiment ovvero serie storiche ovvero indicatori tecnici. L’umore finanziario è stato ottenuto tramite diverse fonti online ed analizzato tramite tecniche di sentiment analysis (SA). In questo contesto, uno dei problemi principali riscontrato dalla maggior parte dei ricercatori riguarda la carenza di dati. I vocabolari di termini finanziari corredati di dati riguardanti il sentiment, l’andamento temporale dell’umore degli investitori e più in generale i dataset riguardanti le opinioni riguardo ai mercati finanziari sono pochi e spesso incompleti. Per questa ragione il quarto articolo si focalizza sul problema dell’accrescimento dei dati. Proporremo infatti un approccio originale che consente di allenare un classificatore per il riconoscimento del sentiment e allo stesso tempo di generare nuove frasi sintetiche. Tali nuovi dati saranno specifici sia per il dominio di appartenenza sia per il sentiment espresso. Lo scopo finale è quello di produrre una base di dati che sia sufficiente per allenare un algoritmo di machine learning (ML) per la classificazione delle opinioni.
Tesi di dottorato
File allegati
File Dimensione Formato  
PhD Thesis Lorenzo Malandri.pdf

accessibile in internet per tutti

Descrizione: Tesi PhD Lorenzo Malandri
Dimensione 3.85 MB
Formato Adobe PDF
3.85 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/144665