This study illustrates the ability of Machine Learning approaches to overcome classical regression techniques in identifying nonlinear relationships and interaction effects of factors influencing the efficiency of educational systems. The efficiency scores of 4264 Italian public lower secondary schools are computed by using Data Envelopment Analysis (DEA) with a double bootstrap procedure, while Random Forest is adopted to identify the variables that are associated with higher scores and visualise their effects in an easily interpretable way. The results confirm the differences in efficiency assessed in previous studies between schools located in different areas of the country, with schools in the South and the islands performing worse than the others. School size, class size and the percentage of immigrant students are the most important factors influencing efficiency. Evaluating interaction effects, it is also possible to consider in the assessment of efficiency the years of experience of the school head, the days of absence of teachers (not due to illness or maternity) and the percentage of funds allocated to pay salaries. Policy implications are presented in the last part of the study.

Questo studio illustra la capacità degli approcci di Machine Learning di superare le classiche tecniche di regressione nell'identificare relazioni non lineari ed effetti di interazione dei fattori che influenzano l'efficienza dei sistemi educativi. I punteggi di efficienza di 4264 scuole secondarie inferiori pubbliche italiane sono calcolati utilizzando la Data Envelopment Analysis (DEA) con una procedura con doppio bootstrap, mentre un algoritmo di Random Forest è adottato per identificare le variabili che sono associate a punteggi più elevati e visualizzarne gli effetti in modo facilmente interpretabile. I risultati confermano le differenze di efficienza riscontrate in studi precedenti tra le scuole situate in diverse aree del Paese, con le scuole del Sud e delle isole che ottengono risultati peggiori rispetto alle altre. Le dimensioni della scuola, le dimensioni della classe e la percentuale di studenti immigrati sono i fattori più importanti che influenzano l'efficienza. Valutando gli effetti di interazione, è possibile includere nella valutazione dell'efficienza anche gli anni di esperienza del dirigente scolastico, i giorni di assenza dei docenti (non per malattia o maternità) e la percentuale di fondi destinati al pagamento degli stipendi. Le implicazioni politiche sono presentate nell'ultima parte dello studio.

The efficiency of Italian lower secondary schools: combination of DEA with a graphical machine learning approach

Iorio, Luigi
2022/2023

Abstract

This study illustrates the ability of Machine Learning approaches to overcome classical regression techniques in identifying nonlinear relationships and interaction effects of factors influencing the efficiency of educational systems. The efficiency scores of 4264 Italian public lower secondary schools are computed by using Data Envelopment Analysis (DEA) with a double bootstrap procedure, while Random Forest is adopted to identify the variables that are associated with higher scores and visualise their effects in an easily interpretable way. The results confirm the differences in efficiency assessed in previous studies between schools located in different areas of the country, with schools in the South and the islands performing worse than the others. School size, class size and the percentage of immigrant students are the most important factors influencing efficiency. Evaluating interaction effects, it is also possible to consider in the assessment of efficiency the years of experience of the school head, the days of absence of teachers (not due to illness or maternity) and the percentage of funds allocated to pay salaries. Policy implications are presented in the last part of the study.
SONCIN, MARA
ING - Scuola di Ingegneria Industriale e dell'Informazione
4-mag-2023
2022/2023
Questo studio illustra la capacità degli approcci di Machine Learning di superare le classiche tecniche di regressione nell'identificare relazioni non lineari ed effetti di interazione dei fattori che influenzano l'efficienza dei sistemi educativi. I punteggi di efficienza di 4264 scuole secondarie inferiori pubbliche italiane sono calcolati utilizzando la Data Envelopment Analysis (DEA) con una procedura con doppio bootstrap, mentre un algoritmo di Random Forest è adottato per identificare le variabili che sono associate a punteggi più elevati e visualizzarne gli effetti in modo facilmente interpretabile. I risultati confermano le differenze di efficienza riscontrate in studi precedenti tra le scuole situate in diverse aree del Paese, con le scuole del Sud e delle isole che ottengono risultati peggiori rispetto alle altre. Le dimensioni della scuola, le dimensioni della classe e la percentuale di studenti immigrati sono i fattori più importanti che influenzano l'efficienza. Valutando gli effetti di interazione, è possibile includere nella valutazione dell'efficienza anche gli anni di esperienza del dirigente scolastico, i giorni di assenza dei docenti (non per malattia o maternità) e la percentuale di fondi destinati al pagamento degli stipendi. Le implicazioni politiche sono presentate nell'ultima parte dello studio.
File allegati
File Dimensione Formato  
2023_5_Iorio_01.pdf

accessibile in internet per tutti

Descrizione: Tesi
Dimensione 1.74 MB
Formato Adobe PDF
1.74 MB Adobe PDF Visualizza/Apri
2023_5_Iorio_02.pdf

non accessibile

Descrizione: Executive summary
Dimensione 750.53 kB
Formato Adobe PDF
750.53 kB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/209112