This thesis exploits Cox Proportional Hazard models to characterize and predict student dropout from university. Cox Proportional Hazard model is a class of regression models with a wide range of applications in the field of survival analysis. In the student dropout context, the event of interest is the student dropout time within the first three years of enrollment in a bachelor of science at Politecnico di Milano. After the model setting and adapting phases, including data choice motivation and preparation, the discussion follows an ordered sequence of techniques that are typical in survival analysis procedures. First, we follow a nonparametric approach, consisting in the estimation of Kaplan-Meier curves, to assess the single effects of predictors on the time response. Then, a time-invariant Cox Regression Model is implemented, considering students information, antecedent to the enrollment and regarding his/her early academic career, as predictors. Lastly, some variations and refinements of the model are evaluated, including time-varying coefficients and time-varying covariates. In particular, a time-dependent Cox Regression Model is implemented, considering the evolution of student careers, in terms of credits and grade point average.
Questa tesi esplora i modelli di Cox Proportional Hazard per caratterizzare e prevedere il fenomeno dell’abbandono precoce degli studenti universitari. Il modello di Cox appartiene ad una classe di modelli di regressione con una vasta gamma di applicazioni nell’ambito dell’analisi di sopravvivenza. Nel contesto dell’abbandono universitario precoce, l’evento di interesse è il tempo all’abbandono dello studente nei suoi primi tre anni dall’iscrizione ad un corso di laurea triennale, o di primo livello, in Ingegneria presso il Politecnico di Milano. Ad una fase di presentazione e analisi preliminare dei dati, segue una discussione che si sviluppa lungo una serie di tecniche tipicamente utilizzate nelle procedure di analisi di sopravvivenza. Per prima cosa, viene valutato un approccio non parametrico, tramite la stima delle curve di Kaplan-Meier, allo scopo di verificare i singoli effetti dei predittori sulla risposta temporale. In seguito, viene implementato un modello di regressione di Cox tempo-indipendente che include informazioni relative agli studenti, sia antecedenti alla carriera che riguardanti una sua prima fase iniziale, come predittori. Per concludere, vengono valutati e confrontati alcuni sviluppi e raffinamenti del modello, tra cui l’introduzione della dipendenza dal tempo di coefficienti e covariate. In particolare, viene implementato un modello di Cox contenente informazioni progressive sulla carriera degli studenti, in termini di crediti e media degli esami.
Time-invariant and time-dependent cox models for predicting student dropout at University
Pirazzini, Luca
2020/2021
Abstract
This thesis exploits Cox Proportional Hazard models to characterize and predict student dropout from university. Cox Proportional Hazard model is a class of regression models with a wide range of applications in the field of survival analysis. In the student dropout context, the event of interest is the student dropout time within the first three years of enrollment in a bachelor of science at Politecnico di Milano. After the model setting and adapting phases, including data choice motivation and preparation, the discussion follows an ordered sequence of techniques that are typical in survival analysis procedures. First, we follow a nonparametric approach, consisting in the estimation of Kaplan-Meier curves, to assess the single effects of predictors on the time response. Then, a time-invariant Cox Regression Model is implemented, considering students information, antecedent to the enrollment and regarding his/her early academic career, as predictors. Lastly, some variations and refinements of the model are evaluated, including time-varying coefficients and time-varying covariates. In particular, a time-dependent Cox Regression Model is implemented, considering the evolution of student careers, in terms of credits and grade point average.File | Dimensione | Formato | |
---|---|---|---|
Tesi_V_Finale.pdf
accessibile in internet solo dagli utenti autorizzati
Dimensione
10.49 MB
Formato
Adobe PDF
|
10.49 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/179637