In questa tesi ci siamo occupati dello studio dei tempi di permanenza al Politecnico di Milano degli immatricolati puri negli anni accademici tra il 2001/02 e il 2013/14, sulla base dei dati forniti dall’Area Servizi ICT (ASICT), aggiornati al 19/06/2015. L’analisi esplorativa dei dati ha riguardato l’intero campione, invece per l’analisi inferenziale abbiamo escluso le ultime due coorti. Abbiamo implementato un modello gerarchico multistato bayesiano a rischi proporzionali di Cox, con dati censurati a destra e funzione di rischio baseline costante a tratti: la gerarchia è dovuta all’introduzione di effetti aleatori che permettono di descrivere l’eterogeneità dei tassi di rischio associati a diversi corsi di studio e anni di immatricolazione. In breve, il modello considera, per ogni immatricolato al Politecnico negli AA considerati, i seguenti possibili stati: attivo, laurea e abbandono. Lo stato di attivo rappresenta la condizione iniziale di ogni studente, mentre laurea e abbandono sono modellati come stati assorbenti del sistema. Secondo la terminologia propria della survival analysis, laurea e abbandono sono gli eventi di interesse e il tempo che intercorre tra la prima iscrizione all’università e l’occorrenza di uno dei due eventi è la durata o tempo di permanenza in ateneo. In particolare, la permanenza degli studenti ancora attivi è un tempo censurato a destra. Nel modello sono stati inglobati sia fattori di rischio locali, quali sesso, rendimento universitario al primo anno e loro interazione, sia globali, quali tipo di test di ammissione e ordinamento in vigore nell’anno di immatricolazione. Tali fattori sono invarianti nel tempo, per cui i tassi di rischio di studenti con caratteristiche diverse sono fra loro proporzionali e le relative curve di sopravvivenza non hanno intersezioni. L’analisi statistica segue un’impostazione bayesiana, secondo cui i parametri incogniti e gli effetti aleatori sono variabili casuali con una legge assegnata a priori. In particolare, abbiamo scelto per tutti i parametri incogniti prior diffuse, e quindi non informative, ma proprie. Abbiamo testato il modello soltanto su un campione casuale di 2370 unità dei 47038 immatricolati (corrispondenti al 5%), che mantenesse inalterata la composizione di studenti attivi, laureati, abbandoni e immatricolati per AA. Le procedure di stima basate sul campione ridotto hanno impiegato circa 55 ore su una macchina con CPU Intel Core i7 (3930K) a 3.20 GHz, 6 core e 12 thread, con 16 GB di RAM. I risultati ottenuti possono essere sintetizzati come segue. Sesso e rendimento universitario sono i fattori che maggiormente incidono sui rischi di laurea e abbandono: i maschi non solo hanno la tendenza a conseguire il titolo in tempi più lunghi rispetto alle femmine, ma anche a ritirarsi più tardi, mentre un buon profitto scolastico incentiva il raggiungimento del traguardo e dissuade dall’abbandono. Per contro, l’introduzione del test d’ingresso on line e il cambio di ordinamento hanno incrementato il rischio di abbandono. Infine, il modello coglie differenze significative fra i tempi di permanenza in ateneo dei vari corsi di studio: gli Ingegneri Gestionali sembrano avere la propensione a laurearsi prima, gli Edili conseguono il titolo tardi e i Biomedici hanno tempi di abbandono anticipati rispetto ad Aerospaziali, Meccanici e Civili, che tendono a stazionare a lungo al Politecnico prima di laurearsi o abbandonare.

Un modello multistato bayesiano per l'analisi dei tempi di permanenza in università degli allievi ingegneri del Politecnico di Milano

ROSSI, ELISABETTA
2014/2015

Abstract

In questa tesi ci siamo occupati dello studio dei tempi di permanenza al Politecnico di Milano degli immatricolati puri negli anni accademici tra il 2001/02 e il 2013/14, sulla base dei dati forniti dall’Area Servizi ICT (ASICT), aggiornati al 19/06/2015. L’analisi esplorativa dei dati ha riguardato l’intero campione, invece per l’analisi inferenziale abbiamo escluso le ultime due coorti. Abbiamo implementato un modello gerarchico multistato bayesiano a rischi proporzionali di Cox, con dati censurati a destra e funzione di rischio baseline costante a tratti: la gerarchia è dovuta all’introduzione di effetti aleatori che permettono di descrivere l’eterogeneità dei tassi di rischio associati a diversi corsi di studio e anni di immatricolazione. In breve, il modello considera, per ogni immatricolato al Politecnico negli AA considerati, i seguenti possibili stati: attivo, laurea e abbandono. Lo stato di attivo rappresenta la condizione iniziale di ogni studente, mentre laurea e abbandono sono modellati come stati assorbenti del sistema. Secondo la terminologia propria della survival analysis, laurea e abbandono sono gli eventi di interesse e il tempo che intercorre tra la prima iscrizione all’università e l’occorrenza di uno dei due eventi è la durata o tempo di permanenza in ateneo. In particolare, la permanenza degli studenti ancora attivi è un tempo censurato a destra. Nel modello sono stati inglobati sia fattori di rischio locali, quali sesso, rendimento universitario al primo anno e loro interazione, sia globali, quali tipo di test di ammissione e ordinamento in vigore nell’anno di immatricolazione. Tali fattori sono invarianti nel tempo, per cui i tassi di rischio di studenti con caratteristiche diverse sono fra loro proporzionali e le relative curve di sopravvivenza non hanno intersezioni. L’analisi statistica segue un’impostazione bayesiana, secondo cui i parametri incogniti e gli effetti aleatori sono variabili casuali con una legge assegnata a priori. In particolare, abbiamo scelto per tutti i parametri incogniti prior diffuse, e quindi non informative, ma proprie. Abbiamo testato il modello soltanto su un campione casuale di 2370 unità dei 47038 immatricolati (corrispondenti al 5%), che mantenesse inalterata la composizione di studenti attivi, laureati, abbandoni e immatricolati per AA. Le procedure di stima basate sul campione ridotto hanno impiegato circa 55 ore su una macchina con CPU Intel Core i7 (3930K) a 3.20 GHz, 6 core e 12 thread, con 16 GB di RAM. I risultati ottenuti possono essere sintetizzati come segue. Sesso e rendimento universitario sono i fattori che maggiormente incidono sui rischi di laurea e abbandono: i maschi non solo hanno la tendenza a conseguire il titolo in tempi più lunghi rispetto alle femmine, ma anche a ritirarsi più tardi, mentre un buon profitto scolastico incentiva il raggiungimento del traguardo e dissuade dall’abbandono. Per contro, l’introduzione del test d’ingresso on line e il cambio di ordinamento hanno incrementato il rischio di abbandono. Infine, il modello coglie differenze significative fra i tempi di permanenza in ateneo dei vari corsi di studio: gli Ingegneri Gestionali sembrano avere la propensione a laurearsi prima, gli Edili conseguono il titolo tardi e i Biomedici hanno tempi di abbandono anticipati rispetto ad Aerospaziali, Meccanici e Civili, che tendono a stazionare a lungo al Politecnico prima di laurearsi o abbandonare.
VERRI, MAURIZIO
ING - Scuola di Ingegneria Industriale e dell'Informazione
27-apr-2016
2014/2015
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Tesi_ER_786970.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 1.69 MB
Formato Adobe PDF
1.69 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/120467