The timely identification of companies facing financial distress holds crucial importance within the field of Finance. In particular, the Basel Accords require banks to estimate the probability of default of their borrowers to control the exposure at risk of the financial system. Prior studies mainly focused on American listed market due to a larger data availability. This research aims to explore the Italian market, primarily composed of small and medium enterprises, and faces the challenges of limited available data and a high imbalance rate. The goal of the work is to develop a powerful and accurate model for estimating the probability of financial distress for these companies, based on an extensive utilization of financial statement data. Several Machine Learning classification techniques are compared to find the most suitable and high-performing one using Accuracy Ratio as performance metric. The focus is on keeping the model as simple as possible, especially in terms of the number of features employed. Empirical results obtained from a dataset containing Italian financial statement data spanning from 2013 to 2022 reveal that XGBoost, when employing 12 features, is the most suitable classifier among the proposed ones. Its effectiveness is also compared with Altman’s z-score, one of the most common formulas for predicting financial distress. XGBoost scored 0.80, while Altman’s z-score was lower at 0.56 in terms of Accuracy Ratio. Considering that the Basel Accords require transparent models, the final part of the work is dedicated to explaining the functioning of the proposed XGBoost.

L'identificazione tempestiva delle aziende in difficoltà finanziarie è di fondamentale importanza nel campo della Finanza. In particolare, gli Accordi di Basilea richiedono alle banche di stimare la probabilità di default dei loro debitori per controllare l'esposizione al rischio del sistema finanziario. Studi precedenti si sono concentrati prevalentemente sul mercato azionario americano per via della maggiore disponibilità di dati. Questa ricerca mira invece ad approfondire il mercato italiano, composto principalmente da piccole e medie imprese, e affronta le difficoltà legate alla limitata disponibilità di dati e alti tassi di sbilanciamento. L'obiettivo del lavoro è quello di sviluppare un modello potente ed accurato per la stima della probabilità di difficoltà finanziarie di queste aziende, basato sull'ampio utilizzo di dati provenienti dai loro bilanci. Diverse tecniche di classificazione di Machine Learning sono state confrontate per trovare quella più adatta e accurata, utilizzando l'Accuracy Ratio (o Gini Index) come performance metric. Si è inoltre voluto mantenere il modello il più semplice possibile, specialmente in termini di numero di variabili utilizzate. I risultati empirici ottenuti da un dataset contenente i bilanci delle aziende italiane dal 2013 al 2022 rivelano che XGBoost, utilizzando 12 variabili, è il classificatore più adatto tra quelli proposti. La sua efficacia è stata anche confrontata con lo z-score di Altman, una delle formule più comuni per la previsione delle difficoltà finanziarie. In termini di Accuracy Ratio, XGBoost ha ottenuto un punteggio di 0.80 contro il valore di 0.56 ottenuto dallo z-score di Altman. Considerando che gli Accordi di Basilea richiedono modelli di Machine Learning più trasparenti possibile, l'ultima parte del lavoro è dedicata a spiegare il funzionamento del modello proposto.

Probability of Financial Distress of Italian Companies

CARRARA, ROMEO
2022/2023

Abstract

The timely identification of companies facing financial distress holds crucial importance within the field of Finance. In particular, the Basel Accords require banks to estimate the probability of default of their borrowers to control the exposure at risk of the financial system. Prior studies mainly focused on American listed market due to a larger data availability. This research aims to explore the Italian market, primarily composed of small and medium enterprises, and faces the challenges of limited available data and a high imbalance rate. The goal of the work is to develop a powerful and accurate model for estimating the probability of financial distress for these companies, based on an extensive utilization of financial statement data. Several Machine Learning classification techniques are compared to find the most suitable and high-performing one using Accuracy Ratio as performance metric. The focus is on keeping the model as simple as possible, especially in terms of the number of features employed. Empirical results obtained from a dataset containing Italian financial statement data spanning from 2013 to 2022 reveal that XGBoost, when employing 12 features, is the most suitable classifier among the proposed ones. Its effectiveness is also compared with Altman’s z-score, one of the most common formulas for predicting financial distress. XGBoost scored 0.80, while Altman’s z-score was lower at 0.56 in terms of Accuracy Ratio. Considering that the Basel Accords require transparent models, the final part of the work is dedicated to explaining the functioning of the proposed XGBoost.
ING - Scuola di Ingegneria Industriale e dell'Informazione
5-ott-2023
2022/2023
L'identificazione tempestiva delle aziende in difficoltà finanziarie è di fondamentale importanza nel campo della Finanza. In particolare, gli Accordi di Basilea richiedono alle banche di stimare la probabilità di default dei loro debitori per controllare l'esposizione al rischio del sistema finanziario. Studi precedenti si sono concentrati prevalentemente sul mercato azionario americano per via della maggiore disponibilità di dati. Questa ricerca mira invece ad approfondire il mercato italiano, composto principalmente da piccole e medie imprese, e affronta le difficoltà legate alla limitata disponibilità di dati e alti tassi di sbilanciamento. L'obiettivo del lavoro è quello di sviluppare un modello potente ed accurato per la stima della probabilità di difficoltà finanziarie di queste aziende, basato sull'ampio utilizzo di dati provenienti dai loro bilanci. Diverse tecniche di classificazione di Machine Learning sono state confrontate per trovare quella più adatta e accurata, utilizzando l'Accuracy Ratio (o Gini Index) come performance metric. Si è inoltre voluto mantenere il modello il più semplice possibile, specialmente in termini di numero di variabili utilizzate. I risultati empirici ottenuti da un dataset contenente i bilanci delle aziende italiane dal 2013 al 2022 rivelano che XGBoost, utilizzando 12 variabili, è il classificatore più adatto tra quelli proposti. La sua efficacia è stata anche confrontata con lo z-score di Altman, una delle formule più comuni per la previsione delle difficoltà finanziarie. In termini di Accuracy Ratio, XGBoost ha ottenuto un punteggio di 0.80 contro il valore di 0.56 ottenuto dallo z-score di Altman. Considerando che gli Accordi di Basilea richiedono modelli di Machine Learning più trasparenti possibile, l'ultima parte del lavoro è dedicata a spiegare il funzionamento del modello proposto.
File allegati
File Dimensione Formato  
2023_09_Carrara_Tesi_01.pdf

non accessibile

Descrizione: Thesis document
Dimensione 11.05 MB
Formato Adobe PDF
11.05 MB Adobe PDF   Visualizza/Apri
2023_09_Carrara_Executive_Summary_02.pdf

non accessibile

Descrizione: Executive Summary
Dimensione 883.54 kB
Formato Adobe PDF
883.54 kB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/210183