In the public transport market, the most significant cost item for companies is that of drivers. This requires efficient resource management practices to optimize the profitability of the service. The absence of a driver, for unanticipated reasons, increases the cost and complexity of service management, given the crucial role that a driver plays. To limit the negative effects of absenteeism, it is essential to understand its causes and analyze possible operational levers to reduce the impact on the organization. This thesis investigates the relationship between the characteristics of the work shifts assigned to drivers and their absenteeism, with the aim of identifying factors that have yet not been thoroughly explored and on which company management can act directly. In this study, an analysis methodology based on different data analysis tools is proposed, applicable to structured data commonly censused in public transport companies. For demonstration purposes, the methodology presented was applied to a real-world scenario thanks to data provided by the company Autoguidovie S.p.A., an Italian excellence specialized in local public transport. On the data, it is proposed to apply correlation analysis using the Pearson and Spearman coefficients, which, applied to the data provided, revealed a positive correlation between absences and breaks scheduled for drivers during consecutive runs. A weak, but still significant, correlation was also identified between absences and the end of shift. Along with the correlation across the entire dataset, it is also suggested to perform a clustering to identify hidden patterns among the data. In the case study, the data were clustered with k-means algorithm. Correlation analysis was performed again within the three clusters, this time highlighting a strong correlation between absenteeism and out-of-residence time in cluster shifts 1. Cluster 0, on the contrary, did not show any significant relationship between the variables and the number of absences. A significant relationship between the duration of breaks during continuous driving time and the number of absences was found within cluster 2, confirming what was identified by the first correlation analysis. Lastly, a machine learning model of ensemble learning is proposed to investigate the relationships between multiple variables and absenteeism. The data was then classified according to the number of absences recorded with a Random Forest model, which can classify shifts into four classes with an accuracy of 67%. Such model assesses the importance attached to the different characteristics of the driving shift in order to classify work shifts successfully. This analysis recognized the importance of the start and end times of the driving shifts and estimated the impact of monetary aspects such as compensation on the estimation of absences. With this model of analysis, the impact assessment of the driving shifts on absenteeism was performed considering all the relationships of both the individual characteristics together with the relationships of sets of characteristics with absenteeism. The results do not want to be conclusive, given the complexity of the phenomenon of absenteeism. The aim of this study is to highlight the possibility of developing the analysis of this phenomenon, bringing attention to aspects that have been little considered until now. To further advance this research, analyses of the relationship between driving shifts and boundary variables such as driver demographics, social and environmental aspects should be developed. Once the complex relationships between these data are considered, it will be possible to develop predictive models that provide serious management support to decision-makers.

Nel mercato del trasporto pubblico, la voce di costo più significativa per le aziende è quella relativa ai conducenti dei mezzi. Questo richiede l’adozione di pratiche efficienti nella gestione delle risorse, in modo da ottimizzare la redditività del servizio. L’assenza di un conducente, per motivi non preventivati, incrementa il costo e il livello di complessità della gestione del servizio, dato il ruolo cruciale che un autista ricopre. Per poter limitare gli effetti negativi dell’assenteismo, è fondamentale capirne le cause e analizzare le possibili leve operative per ridurre l’impatto sull’organizzazione. Questa tesi indaga la relazione tra le caratteristiche dei turni di lavoro assegnati agli autisti e il loro assenteismo, con l’obiettivo di identificare fattori fino ad ora poco considerati e sui quali il management delle aziende può agire in modo diretto. In questo studio viene proposta una metodologia di analisi basata su diversi strumenti di data analysis, applicabile a dati strutturati facilmente censibili da compagnie di trasporto pubblico. A scopo dimostrativo, la metodologia presentata è stata applicata ad un caso reale grazie ai dati forniti dalla società Autoguidovie S.p.A., eccellenza italiana specializzata nel trasporto pubblico locale. Sui dati è proposta l’applicazione dell’analisi di correlazione tramite i coefficienti di Pearson e Spearman, che, applicata ai dati forniti, ha rivelato una correlazione positiva tra le assenze e le pause concesse ai conducenti durante corse consecutive. Una correlazione debole, ma comunque significativa, è stata identificata anche tra le assenze e l’ora di fine turno. Insieme alla correlazione sull’intero dataset, è suggerito anche eseguire una clusterizzazione per poter identificare pattern nascosti tra i dati. Nel caso real, i dati sono stati clusterizzati attraverso l’algoritmo k-means. All’interno dei tre cluster è stata nuovamente eseguita l’analisi di correlazione, che questa volta ha sottolineato una forte correlazione tra l’assenteismo e il tempo fuori residenza nei turni interni al cluster 1. Il cluster 0, al contrario non ha evidenziato nessuna relazione significativa tra le variabili e il numero di assenze. Una relazione significativa tra la durata delle pause durante il tempo di guida continuativa e il numero di assenze è stata rilevata all’interno del cluster 2, confermando quanto identificato dalla prima analisi delle correlazioni. Infine, viene suggerito un modello di machine learning di apprendimento di insieme per indagare le relazioni tra più variabili e l’assenteismo. I dati sono quindi stati classificati in base al numero di assenze registrate con un modello Random Forest, in grado di classificare i turni in quattro classi con una accuratezza del 67%. Ciò ha permesso di valutare l’importanza attribuita alle diverse caratteristiche dei turni guida per classificare con successo i turni di lavoro. Da questa analisi è stata riconosciuta l’importanza dell’ora di inizio e di fine dei turni guida, ed è stato stimato l’impatto di aspetti monetari, come la compensazione, nella stima delle assenze. Con questo modello di analisi, la valutazione impatto dei turni guida sull’assenteismo è stata eseguita considerando tutte le relazioni sia delle singole caratteristiche sia di insiemi di aspetti dei turni guida con l’assenteismo. I risultati non vogliono essere conclusivi, data la complessità del fenomeno dell’assenteismo. L’obiettivo dello studio è evidenziare la possibilità di sviluppare l’analisi di questo fenomeno, portando all’attenzione degli aspetti fino ad ora poco considerati. Per avanzare ulteriormente questa ricerca, dovrebbero essere sviluppate analisi sul rapporto tra i turni guida e variabili di contorno, come analisi demografiche dei conducenti, aspetti sociali e ambientali. Una volta considerate le complesse relazioni tra questi dati sarà possibile sviluppare modelli predittivi che forniscano serio supporto gestionale ai decisori.

Absenteeism of public transport drivers: impact analysis of driving shifts

VILLELLA, SIMONE
2023/2024

Abstract

In the public transport market, the most significant cost item for companies is that of drivers. This requires efficient resource management practices to optimize the profitability of the service. The absence of a driver, for unanticipated reasons, increases the cost and complexity of service management, given the crucial role that a driver plays. To limit the negative effects of absenteeism, it is essential to understand its causes and analyze possible operational levers to reduce the impact on the organization. This thesis investigates the relationship between the characteristics of the work shifts assigned to drivers and their absenteeism, with the aim of identifying factors that have yet not been thoroughly explored and on which company management can act directly. In this study, an analysis methodology based on different data analysis tools is proposed, applicable to structured data commonly censused in public transport companies. For demonstration purposes, the methodology presented was applied to a real-world scenario thanks to data provided by the company Autoguidovie S.p.A., an Italian excellence specialized in local public transport. On the data, it is proposed to apply correlation analysis using the Pearson and Spearman coefficients, which, applied to the data provided, revealed a positive correlation between absences and breaks scheduled for drivers during consecutive runs. A weak, but still significant, correlation was also identified between absences and the end of shift. Along with the correlation across the entire dataset, it is also suggested to perform a clustering to identify hidden patterns among the data. In the case study, the data were clustered with k-means algorithm. Correlation analysis was performed again within the three clusters, this time highlighting a strong correlation between absenteeism and out-of-residence time in cluster shifts 1. Cluster 0, on the contrary, did not show any significant relationship between the variables and the number of absences. A significant relationship between the duration of breaks during continuous driving time and the number of absences was found within cluster 2, confirming what was identified by the first correlation analysis. Lastly, a machine learning model of ensemble learning is proposed to investigate the relationships between multiple variables and absenteeism. The data was then classified according to the number of absences recorded with a Random Forest model, which can classify shifts into four classes with an accuracy of 67%. Such model assesses the importance attached to the different characteristics of the driving shift in order to classify work shifts successfully. This analysis recognized the importance of the start and end times of the driving shifts and estimated the impact of monetary aspects such as compensation on the estimation of absences. With this model of analysis, the impact assessment of the driving shifts on absenteeism was performed considering all the relationships of both the individual characteristics together with the relationships of sets of characteristics with absenteeism. The results do not want to be conclusive, given the complexity of the phenomenon of absenteeism. The aim of this study is to highlight the possibility of developing the analysis of this phenomenon, bringing attention to aspects that have been little considered until now. To further advance this research, analyses of the relationship between driving shifts and boundary variables such as driver demographics, social and environmental aspects should be developed. Once the complex relationships between these data are considered, it will be possible to develop predictive models that provide serious management support to decision-makers.
BAZZONI, FILIPPO
ING - Scuola di Ingegneria Industriale e dell'Informazione
11-dic-2024
2023/2024
Nel mercato del trasporto pubblico, la voce di costo più significativa per le aziende è quella relativa ai conducenti dei mezzi. Questo richiede l’adozione di pratiche efficienti nella gestione delle risorse, in modo da ottimizzare la redditività del servizio. L’assenza di un conducente, per motivi non preventivati, incrementa il costo e il livello di complessità della gestione del servizio, dato il ruolo cruciale che un autista ricopre. Per poter limitare gli effetti negativi dell’assenteismo, è fondamentale capirne le cause e analizzare le possibili leve operative per ridurre l’impatto sull’organizzazione. Questa tesi indaga la relazione tra le caratteristiche dei turni di lavoro assegnati agli autisti e il loro assenteismo, con l’obiettivo di identificare fattori fino ad ora poco considerati e sui quali il management delle aziende può agire in modo diretto. In questo studio viene proposta una metodologia di analisi basata su diversi strumenti di data analysis, applicabile a dati strutturati facilmente censibili da compagnie di trasporto pubblico. A scopo dimostrativo, la metodologia presentata è stata applicata ad un caso reale grazie ai dati forniti dalla società Autoguidovie S.p.A., eccellenza italiana specializzata nel trasporto pubblico locale. Sui dati è proposta l’applicazione dell’analisi di correlazione tramite i coefficienti di Pearson e Spearman, che, applicata ai dati forniti, ha rivelato una correlazione positiva tra le assenze e le pause concesse ai conducenti durante corse consecutive. Una correlazione debole, ma comunque significativa, è stata identificata anche tra le assenze e l’ora di fine turno. Insieme alla correlazione sull’intero dataset, è suggerito anche eseguire una clusterizzazione per poter identificare pattern nascosti tra i dati. Nel caso real, i dati sono stati clusterizzati attraverso l’algoritmo k-means. All’interno dei tre cluster è stata nuovamente eseguita l’analisi di correlazione, che questa volta ha sottolineato una forte correlazione tra l’assenteismo e il tempo fuori residenza nei turni interni al cluster 1. Il cluster 0, al contrario non ha evidenziato nessuna relazione significativa tra le variabili e il numero di assenze. Una relazione significativa tra la durata delle pause durante il tempo di guida continuativa e il numero di assenze è stata rilevata all’interno del cluster 2, confermando quanto identificato dalla prima analisi delle correlazioni. Infine, viene suggerito un modello di machine learning di apprendimento di insieme per indagare le relazioni tra più variabili e l’assenteismo. I dati sono quindi stati classificati in base al numero di assenze registrate con un modello Random Forest, in grado di classificare i turni in quattro classi con una accuratezza del 67%. Ciò ha permesso di valutare l’importanza attribuita alle diverse caratteristiche dei turni guida per classificare con successo i turni di lavoro. Da questa analisi è stata riconosciuta l’importanza dell’ora di inizio e di fine dei turni guida, ed è stato stimato l’impatto di aspetti monetari, come la compensazione, nella stima delle assenze. Con questo modello di analisi, la valutazione impatto dei turni guida sull’assenteismo è stata eseguita considerando tutte le relazioni sia delle singole caratteristiche sia di insiemi di aspetti dei turni guida con l’assenteismo. I risultati non vogliono essere conclusivi, data la complessità del fenomeno dell’assenteismo. L’obiettivo dello studio è evidenziare la possibilità di sviluppare l’analisi di questo fenomeno, portando all’attenzione degli aspetti fino ad ora poco considerati. Per avanzare ulteriormente questa ricerca, dovrebbero essere sviluppate analisi sul rapporto tra i turni guida e variabili di contorno, come analisi demografiche dei conducenti, aspetti sociali e ambientali. Una volta considerate le complesse relazioni tra questi dati sarà possibile sviluppare modelli predittivi che forniscano serio supporto gestionale ai decisori.
File allegati
File Dimensione Formato  
2024_12_Villella_Tesi.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Tesi
Dimensione 2.85 MB
Formato Adobe PDF
2.85 MB Adobe PDF   Visualizza/Apri
2024_12_Villella_Executive_Summary.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Executive Summary
Dimensione 734.62 kB
Formato Adobe PDF
734.62 kB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/230906