Developer disengagement represents a critical threat to the sustainability and continu ity of open-source software ecosystems. This study presents a comprehensive empirical investigation of disengagement patterns through systematic analysis of over 60 diverse GitHub repositories, tracking longitudinal behavioral trajectories among more than 4,000 active contributors. We conceptualize disengagement as a multidimensional phenomenon encompassing temporal variations across process-level activities (commit frequency, re sponse latency, bug resolution duration), product-level contributions (code churn pat terns, pull request success rates, bug-to-feature ratios), and communication-behavioral indicators (social network centrality, sentiment evolution trajectories). Employing an integrated analytical framework incorporating time-series trend analy sis, non-parametric statistical testing (Mann–Whitney U-tests), unsupervised clustering methodologies, and Granger causality modeling, we identify convergent patterns of be havioral deterioration across multiple analytical dimensions. Specifically, disengaging de velopers demonstrate statistically significant degradation in technical responsiveness and social integration during the months preceding formal inactivity. Our synthesis of these empirical findings supports a sequential disengagement model wherein early signals from communication sentiment and network positioning frequently precede observable declines in productivity and task reactivity. These insights establish theoretical foundations for predictive disengagement monitoring systems and advance conceptual understanding of contributor lifecycle dynamics within collaborative software development contexts. We conclude by examining implications for project maintainers and delineating future methodological enhancements to strengthen the predictive modeling of developer attrition risks in open-source environments

L’abbandono dei contributori rappresenta una minaccia critica per la sostenibilità e la continuità degli ecosistemi di software open-source. Questo studio presenta un’indagine empirica approfondita sui modelli di disimpegno, attraverso un’analisi sistematica di oltre 60 repository GitHub eterogenei, tracciando le traiettorie comportamentali longitudinali di oltre 4.000 sviluppatori attivi. Il disimpegno viene concettualizzato come un fenomeno multidimensionale che coinvolge variazioni temporali nelle attività a livello di processo (frequenza dei commit, latenza di risposta, durata della risoluzione dei bug), nei con tributi a livello di prodotto (pattern di churn del codice, tasso di successo delle pull request, rapporto bug/funzionalità), e negli indicatori comportamentali di comunicazione (centralità nelle reti sociali, evoluzione del sentimento nei messaggi). Attraverso un framework analitico integrato che comprende analisi di tendenze tempo rali, test statistici non parametrici (test di Mann–Whitney), metodologie di clustering non supervisionato e modellizzazione della causalità di Granger, identifichiamo pattern con vergenti di deterioramento comportamentale su più dimensioni analitiche. In particolare, gli sviluppatori che si disimpegnano mostrano un degrado statisticamente significativo nella reattività tecnica e nell’integrazione sociale nei mesi precedenti all’inattività. La nostra sintesi empirica supporta un modello sequenziale di disimpegno, secondo cui seg nali precoci legati al sentimento comunicativo e alla posizione nella rete sociale spesso precedono il calo osservabile nella produttività e nella reattività ai compiti. Queste intuizioni stabiliscono una base teorica per sistemi predittivi di monitoraggio del disimpegno e avanzano la comprensione concettuale delle dinamiche di ciclo di vita dei collaboratori all’interno dei contesti di sviluppo software collaborativo. Concludiamo esaminando le implicazioni per i manutentori dei progetti e delineando potenziali miglio ramenti metodologici per rafforzare la modellizzazione predittiva del rischio di abbandono da parte degli sviluppatori in ambienti open-source.

Multidimensional analysis of developer disengagement in open source projects

Zhao, Chenyu
2024/2025

Abstract

Developer disengagement represents a critical threat to the sustainability and continu ity of open-source software ecosystems. This study presents a comprehensive empirical investigation of disengagement patterns through systematic analysis of over 60 diverse GitHub repositories, tracking longitudinal behavioral trajectories among more than 4,000 active contributors. We conceptualize disengagement as a multidimensional phenomenon encompassing temporal variations across process-level activities (commit frequency, re sponse latency, bug resolution duration), product-level contributions (code churn pat terns, pull request success rates, bug-to-feature ratios), and communication-behavioral indicators (social network centrality, sentiment evolution trajectories). Employing an integrated analytical framework incorporating time-series trend analy sis, non-parametric statistical testing (Mann–Whitney U-tests), unsupervised clustering methodologies, and Granger causality modeling, we identify convergent patterns of be havioral deterioration across multiple analytical dimensions. Specifically, disengaging de velopers demonstrate statistically significant degradation in technical responsiveness and social integration during the months preceding formal inactivity. Our synthesis of these empirical findings supports a sequential disengagement model wherein early signals from communication sentiment and network positioning frequently precede observable declines in productivity and task reactivity. These insights establish theoretical foundations for predictive disengagement monitoring systems and advance conceptual understanding of contributor lifecycle dynamics within collaborative software development contexts. We conclude by examining implications for project maintainers and delineating future methodological enhancements to strengthen the predictive modeling of developer attrition risks in open-source environments
Tamburri, Damian Andrew
Kazman, Rick
ING - Scuola di Ingegneria Industriale e dell'Informazione
22-lug-2025
2024/2025
L’abbandono dei contributori rappresenta una minaccia critica per la sostenibilità e la continuità degli ecosistemi di software open-source. Questo studio presenta un’indagine empirica approfondita sui modelli di disimpegno, attraverso un’analisi sistematica di oltre 60 repository GitHub eterogenei, tracciando le traiettorie comportamentali longitudinali di oltre 4.000 sviluppatori attivi. Il disimpegno viene concettualizzato come un fenomeno multidimensionale che coinvolge variazioni temporali nelle attività a livello di processo (frequenza dei commit, latenza di risposta, durata della risoluzione dei bug), nei con tributi a livello di prodotto (pattern di churn del codice, tasso di successo delle pull request, rapporto bug/funzionalità), e negli indicatori comportamentali di comunicazione (centralità nelle reti sociali, evoluzione del sentimento nei messaggi). Attraverso un framework analitico integrato che comprende analisi di tendenze tempo rali, test statistici non parametrici (test di Mann–Whitney), metodologie di clustering non supervisionato e modellizzazione della causalità di Granger, identifichiamo pattern con vergenti di deterioramento comportamentale su più dimensioni analitiche. In particolare, gli sviluppatori che si disimpegnano mostrano un degrado statisticamente significativo nella reattività tecnica e nell’integrazione sociale nei mesi precedenti all’inattività. La nostra sintesi empirica supporta un modello sequenziale di disimpegno, secondo cui seg nali precoci legati al sentimento comunicativo e alla posizione nella rete sociale spesso precedono il calo osservabile nella produttività e nella reattività ai compiti. Queste intuizioni stabiliscono una base teorica per sistemi predittivi di monitoraggio del disimpegno e avanzano la comprensione concettuale delle dinamiche di ciclo di vita dei collaboratori all’interno dei contesti di sviluppo software collaborativo. Concludiamo esaminando le implicazioni per i manutentori dei progetti e delineando potenziali miglio ramenti metodologici per rafforzare la modellizzazione predittiva del rischio di abbandono da parte degli sviluppatori in ambienti open-source.
File allegati
File Dimensione Formato  
2025_07_Chenyu_Zhao_Tesi.pdf

accessibile in internet per tutti a partire dal 25/06/2026

Dimensione 3.95 MB
Formato Adobe PDF
3.95 MB Adobe PDF   Visualizza/Apri
2025_07_Chenyu_Executive Summary.pdf.pdf

accessibile in internet per tutti a partire dal 02/07/2026

Dimensione 1.41 MB
Formato Adobe PDF
1.41 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/240079