This thesis work addresses the issue of students dropouts in higher education, with a specific focus on bachelor students of the engineering courses of Politecnico di Milano. We apply survival analysis techniques to explore the factors contributing to the risk of dropout, modeling heterogeneity both at the student level and in particular at the degree course level. After a preliminary analysis, we fit a standard Cox model, then gradually add complexity. A frailty term is included to model the nested structure induced by the courses, and to establish which degree courses have a greater impact on the dropout risk. Since previous studies on students dropouts demonstrated that the effect of belonging to a degree course varies over the duration of the program, we make use of time-varying frailty models. In particular, we consider two time-varying models, where one of them is relatively new and has never been employed to model student dropout. The other, on the other hand, has already been applied in this context with promising results, and will be considered as a benchmark. The novel model is chosen for its increased flexibility, compared to the benchmark. Predictive modeling techniques are then employed to assess the models’ ability to forecast the probability of dropping out, and to identify the students at the highest risk of dropout. The final purpose of the analysis is to provide actionable recommendations to policymakers to mitigate the rates of dropout.
In questo lavoro viene analizzato il fenomeno dell’abbandono universitario, in particolare studiando il caso degli studenti del Politecnico di Milano iscritti ai corsi di laurea triennale delle facoltà ingegneristiche. Tale fenomeno si presta bene all’applicazione di tecniche di analisi di sopravvivenza, tradizionalmente utilizzate in campo medico. Attraverso questi modelli studiamo i fattori che influenzano la decisione di abbandonare gli studi, sia legati a caratteristiche personali degli studenti, sia soprattutto quelli dovuti alla facoltà frequentata. Il nostro obiettivo è determinare come l’appartenenza a una facoltà influenza il rischio di abbandono, e come questo impatto varia nel tempo. In seguito a un’accurata pulizia dei dati e di analisi preliminari, introduciamo il più basilare dei modelli di sopravvivenza, il modello di regressione di Cox. Questo modello considera la variabile di interesse, il tempo all’abbandono, in funzione delle caratteristiche dello studente, mentre non considera ancora l’informazione legata all’appartenenza alle facoltà. Questa viene inclusa tramite un modello di Cox con frailty, dove la cosiddetta frailty è un fattore comune a tutti gli studenti appartenenti alla stessa facoltà. L’effetto dell’appartenenza a una facoltà agisce aumentando o diminuendo il rischio di abbandono di tutti gli studenti appartenenti a tale gruppo. Questi modelli, tradizionalmente, presuppongono che la frailty sia costante nel tempo. Tuttavia, un recente studio applicato all’abbandono universitario ha mostrato come questa ipotesi non sia realistica, in questa situazione, in quanto l’effetto dell’appartenenza alle facoltà varia nel tempo. Questo ci ha spinti a considerare il passaggio a modelli di frailty tempo-dipendente, in particolare considerandone due. Uno di essi è già stato applicato con successo nel nostro contesto, producendo risultati promettenti. In questo studio analizziamo un secondo modello, più recente e non ancora applicato all’abbandono universitario, scelto per la sua forma più flessibile rispetto al primo. Confrontiamo i due modelli, per valutare se il secondo offra un miglioramento in termini di modellizzazione della frailty tempo-dipendente. Infine, viene valutata la performance predittiva dei modelli, ovvero la loro capacità di previsione della probabilità di abbandono e di classificare correttamente gli studenti ad alto rischio di abbandono.
Time-varying Cox shared frailty models for the prediction of university students dropout
Danesi, Chiara
2023/2024
Abstract
This thesis work addresses the issue of students dropouts in higher education, with a specific focus on bachelor students of the engineering courses of Politecnico di Milano. We apply survival analysis techniques to explore the factors contributing to the risk of dropout, modeling heterogeneity both at the student level and in particular at the degree course level. After a preliminary analysis, we fit a standard Cox model, then gradually add complexity. A frailty term is included to model the nested structure induced by the courses, and to establish which degree courses have a greater impact on the dropout risk. Since previous studies on students dropouts demonstrated that the effect of belonging to a degree course varies over the duration of the program, we make use of time-varying frailty models. In particular, we consider two time-varying models, where one of them is relatively new and has never been employed to model student dropout. The other, on the other hand, has already been applied in this context with promising results, and will be considered as a benchmark. The novel model is chosen for its increased flexibility, compared to the benchmark. Predictive modeling techniques are then employed to assess the models’ ability to forecast the probability of dropping out, and to identify the students at the highest risk of dropout. The final purpose of the analysis is to provide actionable recommendations to policymakers to mitigate the rates of dropout.File | Dimensione | Formato | |
---|---|---|---|
2024_07_Danesi_Executive Summary.pdf
accessibile in internet per tutti a partire dal 28/06/2025
Dimensione
642.73 kB
Formato
Adobe PDF
|
642.73 kB | Adobe PDF | Visualizza/Apri |
2024_07_Danesi_Tesi.pdf
accessibile in internet per tutti a partire dal 28/06/2025
Dimensione
1.36 MB
Formato
Adobe PDF
|
1.36 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/223906