The estimation of missing values within analysts' prediction matrices poses a critical challenge in financial forecasting. This study presents an empirical analysis aimed at evaluating and comparing various methods for addressing this challenge. Through a systematic examination of traditional approaches, machine learning algorithms, and novel techniques, we assess their efficacy in imputing missing values across diverse datasets derived from quarterly financial reports and analysts' forecasts. Our investigation reveals nuanced insights into the strengths and limitations of each method, shedding light on their performance across different datasets and prediction metrics. Notably, we find that the best performance is achieved by Coupled Matrix Factorization and mean estimation, in datasets with less than 99% missing values, consistently outperforming the other methods considered in terms of R^2 and MSE. In extending our analysis to integrate estimated missing values into predictive modeling frameworks, we leverage machine learning algorithms such as LASSO, XGBoost, and SVR. Our findings underscore the importance of robust estimation methods in enhancing the accuracy and reliability of financial forecasts. We identify Coupled Matrix Factorization and mean estimation, integrated with LASSO regression, as the optimal model for predicting future earnings per share. Furthermore, drawing upon insights from mean estimation and Coupled Matrix Factorization techniques, we propose novel approaches for missing value estimation: the Latent Factors Weighted Mean and the Cluster Means methods. Through empirical evaluation and comparative analysis, we demonstrate the effectiveness of these novel methods in mitigating the impact of missing values on analysts' prediction matrices. Our research advances financial forecasting methodologies with novel techniques for integrating missing values into analysts' prediction matrices combining traditional and machine learning methods. This enhances forecast reliability and aids decision-making in complex financial markets.

La stima dei valori mancanti all'interno delle matrici di previsione degli analisti rappresenta una sfida critica nella previsione finanziaria. Questo studio presenta un'analisi empirica mirata a valutare e confrontare vari metodi per affrontare questa sfida. Attraverso un'esaminazione sistematica di approcci tradizionali, algoritmi di machine learning e modelli nuovi, valutiamo la loro efficacia nella stima dei valori mancanti in diversi set di dati derivati da rapporti finanziari trimestrali e dalle previsioni degli analisti. La nostra indagine rivela i punti di forza e le limitazioni di ciascun metodo, analizzando le loro prestazioni su diversi set di dati e rispetto a diverse metriche di previsione. In particolare, scopriamo che la stima attraverso Coupled Matrix Factorization e con la media mostrano prestazioni superiori nei dataset con meno del 99% di valori mancanti, superando costantemente gli altri metodi considerati in termini di R^2 ed MSE. Estendendo la nostra analisi per integrare i valori mancanti stimati nei framework di modellizzazione predittiva, sfruttiamo algoritmi di machine learning come LASSO, XGBoost e SVR. Le nostre conclusioni sottolineano l'importanza di metodi di stima robusti nel migliorare l'accuratezza e la affidabilità delle previsioni finanziarie. Identifichiamo la stima attraverso Coupled Matrix Factorization e con la media, integrate con la regressione LASSO, come modello ottimale per prevedere i futuri EPS. Inoltre, attingendo dalla media e dalle tecniche di Fattorizzazione, proponiamo approcci innovativi per la stima dei valori mancanti: i metodi Latent Factors Weighted Mean e Cluster Means. Attraverso valutazioni empiriche e analisi comparative, dimostriamo l'efficacia di questi metodi nel mitigare l'impatto dei valori mancanti sulle matrici di previsione degli analisti. La nostra ricerca contribuisce al campo delle metodologie di previsione finanziaria con tecniche innovative per integrare i valori mancanti nelle matrici di previsione degli analisti, combinando metodi tradizionali e di machine learning. Ciò migliora l'affidabilità delle previsioni e aiuta nel prendere decisioni nei complessi mercati finanziari.

A comprehensive approach to missing values estimation in analysts' predictions

IAMONI, ALICE
2022/2023

Abstract

The estimation of missing values within analysts' prediction matrices poses a critical challenge in financial forecasting. This study presents an empirical analysis aimed at evaluating and comparing various methods for addressing this challenge. Through a systematic examination of traditional approaches, machine learning algorithms, and novel techniques, we assess their efficacy in imputing missing values across diverse datasets derived from quarterly financial reports and analysts' forecasts. Our investigation reveals nuanced insights into the strengths and limitations of each method, shedding light on their performance across different datasets and prediction metrics. Notably, we find that the best performance is achieved by Coupled Matrix Factorization and mean estimation, in datasets with less than 99% missing values, consistently outperforming the other methods considered in terms of R^2 and MSE. In extending our analysis to integrate estimated missing values into predictive modeling frameworks, we leverage machine learning algorithms such as LASSO, XGBoost, and SVR. Our findings underscore the importance of robust estimation methods in enhancing the accuracy and reliability of financial forecasts. We identify Coupled Matrix Factorization and mean estimation, integrated with LASSO regression, as the optimal model for predicting future earnings per share. Furthermore, drawing upon insights from mean estimation and Coupled Matrix Factorization techniques, we propose novel approaches for missing value estimation: the Latent Factors Weighted Mean and the Cluster Means methods. Through empirical evaluation and comparative analysis, we demonstrate the effectiveness of these novel methods in mitigating the impact of missing values on analysts' prediction matrices. Our research advances financial forecasting methodologies with novel techniques for integrating missing values into analysts' prediction matrices combining traditional and machine learning methods. This enhances forecast reliability and aids decision-making in complex financial markets.
ING - Scuola di Ingegneria Industriale e dell'Informazione
9-apr-2024
2022/2023
La stima dei valori mancanti all'interno delle matrici di previsione degli analisti rappresenta una sfida critica nella previsione finanziaria. Questo studio presenta un'analisi empirica mirata a valutare e confrontare vari metodi per affrontare questa sfida. Attraverso un'esaminazione sistematica di approcci tradizionali, algoritmi di machine learning e modelli nuovi, valutiamo la loro efficacia nella stima dei valori mancanti in diversi set di dati derivati da rapporti finanziari trimestrali e dalle previsioni degli analisti. La nostra indagine rivela i punti di forza e le limitazioni di ciascun metodo, analizzando le loro prestazioni su diversi set di dati e rispetto a diverse metriche di previsione. In particolare, scopriamo che la stima attraverso Coupled Matrix Factorization e con la media mostrano prestazioni superiori nei dataset con meno del 99% di valori mancanti, superando costantemente gli altri metodi considerati in termini di R^2 ed MSE. Estendendo la nostra analisi per integrare i valori mancanti stimati nei framework di modellizzazione predittiva, sfruttiamo algoritmi di machine learning come LASSO, XGBoost e SVR. Le nostre conclusioni sottolineano l'importanza di metodi di stima robusti nel migliorare l'accuratezza e la affidabilità delle previsioni finanziarie. Identifichiamo la stima attraverso Coupled Matrix Factorization e con la media, integrate con la regressione LASSO, come modello ottimale per prevedere i futuri EPS. Inoltre, attingendo dalla media e dalle tecniche di Fattorizzazione, proponiamo approcci innovativi per la stima dei valori mancanti: i metodi Latent Factors Weighted Mean e Cluster Means. Attraverso valutazioni empiriche e analisi comparative, dimostriamo l'efficacia di questi metodi nel mitigare l'impatto dei valori mancanti sulle matrici di previsione degli analisti. La nostra ricerca contribuisce al campo delle metodologie di previsione finanziaria con tecniche innovative per integrare i valori mancanti nelle matrici di previsione degli analisti, combinando metodi tradizionali e di machine learning. Ciò migliora l'affidabilità delle previsioni e aiuta nel prendere decisioni nei complessi mercati finanziari.
File allegati
File Dimensione Formato  
Executive_Summary___Alice_Iamoni.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Executive summary
Dimensione 676.27 kB
Formato Adobe PDF
676.27 kB Adobe PDF   Visualizza/Apri
Master_Thesis___Alice_Iamoni.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Tesi
Dimensione 2.57 MB
Formato Adobe PDF
2.57 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/217634