This thesis focuses on the application of machine learning models in the field of financial literacy of high school students. The dissertation will present innovative methods, using machine learning techniques, to provide a unique perspective to the research of critical factors that affect the level of financial literacy in 15-year-old students. The purpose of this study is to obtain empirical evidence regarding the most influential factors that affect financial literacy scores among high school students based on the Program for International Student Assessment (PISA 2015). The public dataset of PISA 2015 contained the financial literacy scores of 123,041 students from the 10 participating countries where China, Canada, Belgium, and Russia outperformed students around the world. A specific aim of our study is to explore which student characteristics and school-level factors are associated with these results. In order to accomplish that, we apply an extensive feature selection phase with 7 different algorithms which reduced an initial set containing 56 contextual variables to an optimal subset of 32 top features. In the second stage, the selected predictors were used to build a model using Multiple Linear Regression and Random Forests to help identify the most important descriptors of financial literacy scores. Results suggest that the model describes financial outputs particularly well with an R^2 of 0.7 and a percentage of variance explained for the random forest of 65.63% for PISA 2015 and 83.11% for 2018. Our analysis poses a new methodology to support policy makers decisions by identifying unconventional factors affecting education quality and equity.

La presente tesi si propone di illustrare l’applicazione dei modelli di machine learning nel campo della alfabetizzazione finanziaria dedicata agli studenti delle scuole superiori. L’elaborato si sviluppa attraverso metodi innovativi nell’uso del machine learning per mezzo dei quali sarà possibile avere una prospettiva unica su quelli che sono i fattori critici che influenzano il livello di formazione degli studenti adolescenti. Lo scopo ultimo di questo studio è quello di ottenere evidenze empiriche riguardo i fattori piu decisivi capaci di influenzare i punteggi ottenuti dagli studenti sulla base del c.d. “Program for International Student Assessment” (PISA 2015). I dati pubblicati e relativi all’edizione 2015 del citato programma contengono i punteggi ottenuti da 123,041 studenti provenienti da 10 nazioni differenti, all’interno dei quali paesi come Cina, Canada, Belgio e Russia hanno dimostrato di riuscire ad ottenere i punteggi migliori a livello mondiale. Tra gli obiettivi specifici del presente lavoro vi è quello di esplorare le caratteristiche peculiari degli studenti nonché i fattori di livello scolastico che determinano siffatti esiti. Al fine di ottenere questo risultato, abbiamo applicato una fase di selezione molto estesa che ha previsto il coinvolgimento di 7 diversi algoritmi i quali, successivamente, hanno condotto alla scrematura del set di dati iniziale, contenente 56 variabili contestuali, per giungere ad un optimum di 32 caratteristiche piu rilevanti. Nella seconda fase, i fattori predittivi selezionati sono stati usati per alimentare/costruire un modello basato sulla “Multiple Linear Regression” e sul metodo “random forest” per aiutarci ad identificare i fattori descrittivi piu importanti riguardo ai punteggi ottenuti nel corso del programma PISA. I risultati rivelano come il modello applicato sia capace di descrive in modo particolarmente definito i risultati finanziari con un R^2di 0,7 ed una percentuale di varianza relativa alla random forest di 65.63% per il 2015 e 83.11% per il 2018. In ultima istanza, la nostra anlisi pone le basi per una nuova metodologia che possa supportare le politiche attuate dai soggetti con poteri decisionali attraverso l’identificazione di fattori non convenziali capaci di influenzare la qualità e l’equità della formazione scolastica.

An exploration of factors that influence students' financial literacy with machine learning approaches : results from PISA

D'Amato, Arturo
2019/2020

Abstract

This thesis focuses on the application of machine learning models in the field of financial literacy of high school students. The dissertation will present innovative methods, using machine learning techniques, to provide a unique perspective to the research of critical factors that affect the level of financial literacy in 15-year-old students. The purpose of this study is to obtain empirical evidence regarding the most influential factors that affect financial literacy scores among high school students based on the Program for International Student Assessment (PISA 2015). The public dataset of PISA 2015 contained the financial literacy scores of 123,041 students from the 10 participating countries where China, Canada, Belgium, and Russia outperformed students around the world. A specific aim of our study is to explore which student characteristics and school-level factors are associated with these results. In order to accomplish that, we apply an extensive feature selection phase with 7 different algorithms which reduced an initial set containing 56 contextual variables to an optimal subset of 32 top features. In the second stage, the selected predictors were used to build a model using Multiple Linear Regression and Random Forests to help identify the most important descriptors of financial literacy scores. Results suggest that the model describes financial outputs particularly well with an R^2 of 0.7 and a percentage of variance explained for the random forest of 65.63% for PISA 2015 and 83.11% for 2018. Our analysis poses a new methodology to support policy makers decisions by identifying unconventional factors affecting education quality and equity.
ING - Scuola di Ingegneria Industriale e dell'Informazione
2-ott-2020
2019/2020
La presente tesi si propone di illustrare l’applicazione dei modelli di machine learning nel campo della alfabetizzazione finanziaria dedicata agli studenti delle scuole superiori. L’elaborato si sviluppa attraverso metodi innovativi nell’uso del machine learning per mezzo dei quali sarà possibile avere una prospettiva unica su quelli che sono i fattori critici che influenzano il livello di formazione degli studenti adolescenti. Lo scopo ultimo di questo studio è quello di ottenere evidenze empiriche riguardo i fattori piu decisivi capaci di influenzare i punteggi ottenuti dagli studenti sulla base del c.d. “Program for International Student Assessment” (PISA 2015). I dati pubblicati e relativi all’edizione 2015 del citato programma contengono i punteggi ottenuti da 123,041 studenti provenienti da 10 nazioni differenti, all’interno dei quali paesi come Cina, Canada, Belgio e Russia hanno dimostrato di riuscire ad ottenere i punteggi migliori a livello mondiale. Tra gli obiettivi specifici del presente lavoro vi è quello di esplorare le caratteristiche peculiari degli studenti nonché i fattori di livello scolastico che determinano siffatti esiti. Al fine di ottenere questo risultato, abbiamo applicato una fase di selezione molto estesa che ha previsto il coinvolgimento di 7 diversi algoritmi i quali, successivamente, hanno condotto alla scrematura del set di dati iniziale, contenente 56 variabili contestuali, per giungere ad un optimum di 32 caratteristiche piu rilevanti. Nella seconda fase, i fattori predittivi selezionati sono stati usati per alimentare/costruire un modello basato sulla “Multiple Linear Regression” e sul metodo “random forest” per aiutarci ad identificare i fattori descrittivi piu importanti riguardo ai punteggi ottenuti nel corso del programma PISA. I risultati rivelano come il modello applicato sia capace di descrive in modo particolarmente definito i risultati finanziari con un R^2di 0,7 ed una percentuale di varianza relativa alla random forest di 65.63% per il 2015 e 83.11% per il 2018. In ultima istanza, la nostra anlisi pone le basi per una nuova metodologia che possa supportare le politiche attuate dai soggetti con poteri decisionali attraverso l’identificazione di fattori non convenziali capaci di influenzare la qualità e l’equità della formazione scolastica.
File allegati
File Dimensione Formato  
2020_10_D'amato.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Final MSc thesis Arturo D'amato
Dimensione 3.2 MB
Formato Adobe PDF
3.2 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/166446