This thesis investigates students dropout from university, which is a phenomenon very relevant in the Italian university system, following a survival analysis approach. Different Cox regression models are applied, with the aim of identifying the determinants of student dropout through time, to predict the time to dropout as soon as possible and to observe how the dropout phenomenon varies across degree programs. The analysis is performed on a set of students enrolled in an engineering bachelor of science at Politecnico di Milano. After the initial data preparation and presentation, a series of survival analysis procedures is applied. First, a nonparametric univariate explorative analysis, consisting in the estimation of the Kaplan-Meier curves, is performed. Then, a time-invariant Cox Proportional Hazards model is implemented, considering student static informations at the end of first semester as predictors. The model is later extended to a time-dependent Cox model with the introduction of time varying covariates, that describe students academic career tracks though time. As a final extension, Frailty Cox models, that take into account the nested structure of students within degree programs and model the induced heterogeneity, are implemented. Results are reported in the perspective of identifying both the determinants of student dropout across time and the earliest time instant in which we can accurately predict the time to dropout.

Questa tesi investiga l'abbandono precoce degli studenti universitari, che è un fenomeno molto rilevante nel sistema universitario italiano, seguendo un approccio basato sull'analisi di sopravvivenza. Vengono applicati diversi modelli di regressione di Cox, con l'obiettivo di identificare i fattori responsabili dell'abbandono precoce nel tempo, di prevedere al più presto il tempo all'abbandono e di osservare come questo fenomeno cambi fra i diversi corsi di Laurea. L'analisi è condotta su un insieme di studenti immatricolati a corsi triennali di Ingegneria, presso il Politecnico di Milano. Dopo l'iniziale preparazione e presentazione dei dati, vengono applicate una serie di tecniche dell'analisi di sopravvivenza. Per prima cosa, tramite la stima delle curve di Kaplan-Meier, viene effettuata un'analisi esplorativa non parametrica e univariata. Successivamente, viene implementato un modello di rischio proporzionale di Cox tempo-invariante, considerando come predittori le informazioni statiche dello studente al termine del primo semestre. Il modello viene quindi esteso a un modello di Cox tempo-dipendente con l'introduzione di covariate variabili nel tempo, che descrivono i risultati accademici dello studente semestre per semestre. Come estensione finale viene fittato un modello Frailty di Cox, che considera la struttura annidata degli studenti all'interno dei differenti corsi di Laurea e che modella l'eterogeneità indotta. I risultati sono riportati nella prospettiva di identificare i fattori che causano l'abbandono universitario nel tempo e il primo istante temporale in cui è possibile prevedere accuratamente il tempo all'abbandono.

Frailty cox models with time-dependent covariates for predicting university student dropout across time

Giovio, Mirko
2021/2022

Abstract

This thesis investigates students dropout from university, which is a phenomenon very relevant in the Italian university system, following a survival analysis approach. Different Cox regression models are applied, with the aim of identifying the determinants of student dropout through time, to predict the time to dropout as soon as possible and to observe how the dropout phenomenon varies across degree programs. The analysis is performed on a set of students enrolled in an engineering bachelor of science at Politecnico di Milano. After the initial data preparation and presentation, a series of survival analysis procedures is applied. First, a nonparametric univariate explorative analysis, consisting in the estimation of the Kaplan-Meier curves, is performed. Then, a time-invariant Cox Proportional Hazards model is implemented, considering student static informations at the end of first semester as predictors. The model is later extended to a time-dependent Cox model with the introduction of time varying covariates, that describe students academic career tracks though time. As a final extension, Frailty Cox models, that take into account the nested structure of students within degree programs and model the induced heterogeneity, are implemented. Results are reported in the perspective of identifying both the determinants of student dropout across time and the earliest time instant in which we can accurately predict the time to dropout.
MUSSIDA, PAOLA
ING - Scuola di Ingegneria Industriale e dell'Informazione
28-apr-2022
2021/2022
Questa tesi investiga l'abbandono precoce degli studenti universitari, che è un fenomeno molto rilevante nel sistema universitario italiano, seguendo un approccio basato sull'analisi di sopravvivenza. Vengono applicati diversi modelli di regressione di Cox, con l'obiettivo di identificare i fattori responsabili dell'abbandono precoce nel tempo, di prevedere al più presto il tempo all'abbandono e di osservare come questo fenomeno cambi fra i diversi corsi di Laurea. L'analisi è condotta su un insieme di studenti immatricolati a corsi triennali di Ingegneria, presso il Politecnico di Milano. Dopo l'iniziale preparazione e presentazione dei dati, vengono applicate una serie di tecniche dell'analisi di sopravvivenza. Per prima cosa, tramite la stima delle curve di Kaplan-Meier, viene effettuata un'analisi esplorativa non parametrica e univariata. Successivamente, viene implementato un modello di rischio proporzionale di Cox tempo-invariante, considerando come predittori le informazioni statiche dello studente al termine del primo semestre. Il modello viene quindi esteso a un modello di Cox tempo-dipendente con l'introduzione di covariate variabili nel tempo, che descrivono i risultati accademici dello studente semestre per semestre. Come estensione finale viene fittato un modello Frailty di Cox, che considera la struttura annidata degli studenti all'interno dei differenti corsi di Laurea e che modella l'eterogeneità indotta. I risultati sono riportati nella prospettiva di identificare i fattori che causano l'abbandono universitario nel tempo e il primo istante temporale in cui è possibile prevedere accuratamente il tempo all'abbandono.
File allegati
File Dimensione Formato  
Master_Thesis_Mirko_Giovio.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Master Thesis, by Mirko Giovio
Dimensione 2.01 MB
Formato Adobe PDF
2.01 MB Adobe PDF   Visualizza/Apri
Executive_Summary_Mirko_Giovio.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Executive Summary of the Master Thesis, by Mirko Giovio
Dimensione 673.47 kB
Formato Adobe PDF
673.47 kB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/186820