In this work a new model for the Private Customer (PC) behavioral ratings is developed. A Private Customer and a Small Business Customer (SBC) are distinguished by their production value or turnover (when their value is not available). In order to compute the Probability of Default (PD) of a PC we define the default as in the Basel II definition in Sectio 178 Par. 1 of the Capital Requirements Regulation (CRR). The model used so far is a logistic regression which does not take into account the dif ference between the non-revolving customers (having only Comfort credit, Loans, Real estate finance products) and the other customers. Despite having a good discriminatory power, the model has some deficiencies: indeed the model is not stable in time and does not perform well on the non-revolving segment. The issues are solved during the development of the new model where the non-revolving segment is treated differently than the rest of the segments. In particular, in order to choose the most reprentantative variables to enter in the model, the following analysis are performed for the non-revolving segment: • Data selection and data cleaning; • Calculation of derived variables with the definition of the longlist; • Split of the sample in training and testing samples; • Univariate Analysis including variable transformation, missing treatment analysis and discriminatory power analysis • Multivariate Analysis to avoid multicorrelation in the model To evaluate the PD for the beavioral module for the other segments another approach is used. Here the main issue is due to the instability over time of two of the used variables (amnt_cred_trns_lm and num_kk_days_pos_bal_lm). Since we want to replace them with 2 variables in order to keep the same information but with a better stability, we have a limited number of variables to choose from. After some seasonality tests and some qualitative considerations, two new variables are chosen. The whole new model is now complete and it solves the deficiencies of the original model since the performances on the non-revolving segment are improved and the variables stability over time is now satisfied.

In questo lavoro viene sviluppato un nuovo modello per i rating comportamentali dei clienti privati (PC). I clienti privati e le piccole imprese (SBC) si distinguono per il loro valore di produzione o per il loro fatturato (quando il loro valore non è disponibile). Per calcolare la probabilità di default (PD) di un cliente privato, definiamo il default come nella definizione del Basel II nella sezione 178, paragrafo 1, del CRR. Il modello utilizzato finora è una regressione logistica che non tiene conto della differenza tra i clienti non-revolving (che hanno solo prodotti di credito Comfort, Prestiti, Finanzi amenti immobiliari) e gli altri clienti. Pur avendo una buona significatività statistica, il modello presenta alcune carenze: infatti il modello non è stabile nel tempo e non ha buone performance sul segmento non-revolving. I problemi vengono risolti durante lo sviluppo del nuovo modello, in cui il segmento non revolving viene trattato in modo diverso rispetto agli altri segmenti. In particolare, per scegliere le variabili più rappresentative da inserire nel modello, vengono effettuate le seguenti analisi per il segmento non-revolving: • Selezione dei dati e pulizia dei dati; • Calcolo delle variabili derivate con la definizione della longlist; • Suddivisione del sample in training sample e testing sample; • Analisi univariata, che comprende trasformazione delle variabili, analisi dei dati mancanti e analisi della significatività statistica. • Analisi multivariata per evitare la multicorrelazione nel modello. Per valutare la PD del behavioral module per gli altri segmenti si utilizza un altro ap proccio. In questo caso, il problema principale è dovuto all’instabilità nel tempo di due delle variabili utilizzate (amnt_cred_trns_lm e num_kk_days_pos_bal_lm). Poiché vogliamo sostituirle con due variabili per mantenere le stesse informazioni ma con una migliore stabilità, abbiamo un numero limitato di variabili tra cui scegliere. Dopo alcuni test di seasonality e alcune considerazioni qualitative, vengono scelte due nuove variabili. Il nuovo modello è ora completo e risolve le carenze del modello originale, poiché le prestazioni sul segmento non-revolving sono migliorate e la stabilità delle variabili nel tempo è ora soddisfatta.

Challenger model for non-revolving private customers behavioral ratings

Marchi, Stefano
2022/2023

Abstract

In this work a new model for the Private Customer (PC) behavioral ratings is developed. A Private Customer and a Small Business Customer (SBC) are distinguished by their production value or turnover (when their value is not available). In order to compute the Probability of Default (PD) of a PC we define the default as in the Basel II definition in Sectio 178 Par. 1 of the Capital Requirements Regulation (CRR). The model used so far is a logistic regression which does not take into account the dif ference between the non-revolving customers (having only Comfort credit, Loans, Real estate finance products) and the other customers. Despite having a good discriminatory power, the model has some deficiencies: indeed the model is not stable in time and does not perform well on the non-revolving segment. The issues are solved during the development of the new model where the non-revolving segment is treated differently than the rest of the segments. In particular, in order to choose the most reprentantative variables to enter in the model, the following analysis are performed for the non-revolving segment: • Data selection and data cleaning; • Calculation of derived variables with the definition of the longlist; • Split of the sample in training and testing samples; • Univariate Analysis including variable transformation, missing treatment analysis and discriminatory power analysis • Multivariate Analysis to avoid multicorrelation in the model To evaluate the PD for the beavioral module for the other segments another approach is used. Here the main issue is due to the instability over time of two of the used variables (amnt_cred_trns_lm and num_kk_days_pos_bal_lm). Since we want to replace them with 2 variables in order to keep the same information but with a better stability, we have a limited number of variables to choose from. After some seasonality tests and some qualitative considerations, two new variables are chosen. The whole new model is now complete and it solves the deficiencies of the original model since the performances on the non-revolving segment are improved and the variables stability over time is now satisfied.
IVANOV STANIMIROV, ISKREN
ING - Scuola di Ingegneria Industriale e dell'Informazione
5-ott-2023
2022/2023
In questo lavoro viene sviluppato un nuovo modello per i rating comportamentali dei clienti privati (PC). I clienti privati e le piccole imprese (SBC) si distinguono per il loro valore di produzione o per il loro fatturato (quando il loro valore non è disponibile). Per calcolare la probabilità di default (PD) di un cliente privato, definiamo il default come nella definizione del Basel II nella sezione 178, paragrafo 1, del CRR. Il modello utilizzato finora è una regressione logistica che non tiene conto della differenza tra i clienti non-revolving (che hanno solo prodotti di credito Comfort, Prestiti, Finanzi amenti immobiliari) e gli altri clienti. Pur avendo una buona significatività statistica, il modello presenta alcune carenze: infatti il modello non è stabile nel tempo e non ha buone performance sul segmento non-revolving. I problemi vengono risolti durante lo sviluppo del nuovo modello, in cui il segmento non revolving viene trattato in modo diverso rispetto agli altri segmenti. In particolare, per scegliere le variabili più rappresentative da inserire nel modello, vengono effettuate le seguenti analisi per il segmento non-revolving: • Selezione dei dati e pulizia dei dati; • Calcolo delle variabili derivate con la definizione della longlist; • Suddivisione del sample in training sample e testing sample; • Analisi univariata, che comprende trasformazione delle variabili, analisi dei dati mancanti e analisi della significatività statistica. • Analisi multivariata per evitare la multicorrelazione nel modello. Per valutare la PD del behavioral module per gli altri segmenti si utilizza un altro ap proccio. In questo caso, il problema principale è dovuto all’instabilità nel tempo di due delle variabili utilizzate (amnt_cred_trns_lm e num_kk_days_pos_bal_lm). Poiché vogliamo sostituirle con due variabili per mantenere le stesse informazioni ma con una migliore stabilità, abbiamo un numero limitato di variabili tra cui scegliere. Dopo alcuni test di seasonality e alcune considerazioni qualitative, vengono scelte due nuove variabili. Il nuovo modello è ora completo e risolve le carenze del modello originale, poiché le prestazioni sul segmento non-revolving sono migliorate e la stabilità delle variabili nel tempo è ora soddisfatta.
File allegati
File Dimensione Formato  
Master_Thesis_v5.pdf

non accessibile

Descrizione: Elaborato
Dimensione 791.33 kB
Formato Adobe PDF
791.33 kB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/209889