A data-driven condition monitoring (CM) methodology alternative to track recording vehicles (TRVs) is presented, using frequent acceleration measurements from commercial trains. It estimates synthetic defect features relevant to maintenance from aggregated vehicle-motion statistics, trading profile fidelity for higher temporal sampling and lower cost. Commercial train data were matched to TRV geometry; a position (PK) definition synchronisation algorithm was produced, and per-PK averaging reduced random noise. An initial set of 34 predictors was reduced by ANOVA to obtain efficient, interpretable regression models. Models were trained on designated training sets and evaluated on held-out test sets defined through K-fold algorithm; final generalisation was confirmed on an independent external dataset. Four methods were compared: multivariable linear regression (with and without log transforms), Gaussian process, and neural network regressions; empirical prediction intervals (PI) were derived by the bootstrap method. A well-specified linear model matched nonlinear alternatives at much lower computational cost. Best results concerned the longitudinal-level index in the D1 (3–25 m) band; crosslevel and twist were promising, while alignment was not predictable with current data and sensors. Wide prediction intervals motivate larger datasets through extended instrumentation and an improved positioning algorithm. The external validation confirmed robust classification versus EN 13484 thresholds and PI coverage consistent with nominal confidence; temporal analysis demonstrated good model sensitivity and specificity. The work, overall, establishes a solid basis for fleet-scale CM.
Un’alternativa data-driven al monitoraggio (condition monitoring, CM) basata su veicoli commerciali strumentati è proposta in sostituzione ai veicoli di misura della linea (Track Recording Vehicle, TRV). Il metodo stima caratteristiche sintetiche dei difetti rilevanti per la manutenzione a partire da statistiche aggregate del movimento del veicolo ferroviario, a scapito della fedeltà geometrica, ma con maggior frequenza di campionamento e costi ridotti. I dati di moto del treno commerciale sono stati allineati alla geometria del TRV tramite un algoritmo per la sincronizzazione della posizione (PK) dei due treni; la media per PK ha ridotto il rumore random delle misure. Un set iniziale di 34 predittori è stato selezionato tramite ANOVA per ottenere modelli efficienti e interpretabili. I modelli sono stati addestrati su set di training e valutati su set di test ottenuti tramite logica K-fold e infine testati su un dataset esterno indipendente per confermare la generalizzazione. Sono stati confrontati quattro approcci: regressione multivariata lineare (con e senza trasformazione logaritmica), regressioni mediante processi gaussiani e con reti neurali; gli intervalli di predizione (PI) sono stati ottenuti mediante il metodo bootstrap. Un modello lineare ben specificato ha raggiunto prestazioni comparabili ai metodi non lineari con costi computazionali notevolmente inferiori. I risultati migliori si sono ottenuti per l’indice di livello longitudinale nella banda D1 (3–25,m); anche il dislivello trasversale e lo sghembo hanno mostrato buone potenzialità predittive, mentre l’allineamento non è risultato prevedibile con i dati e i sensori attuali. L’ampiezza spesso elevata dei PI indica la necessità di dataset più estesi tramite maggiore strumentazione e di un algoritmo di posizionamento migliorato. La validazione esterna ha confermato una solida classificazione rispetto alle soglie EN 13484 e una copertura dei PI coerente con la confidenza nominale; l’analisi temporale ha dimostrato buona sensibilità e specificità del modello. Complessivamente, il lavoro stabilisce una base solida per un CM su scala di flotta commerciale.
Data-driven condition monitoring of railway lines via statistical analysis of commercial train data
Belardo, Atuan Amedeo Alberto
2024/2025
Abstract
A data-driven condition monitoring (CM) methodology alternative to track recording vehicles (TRVs) is presented, using frequent acceleration measurements from commercial trains. It estimates synthetic defect features relevant to maintenance from aggregated vehicle-motion statistics, trading profile fidelity for higher temporal sampling and lower cost. Commercial train data were matched to TRV geometry; a position (PK) definition synchronisation algorithm was produced, and per-PK averaging reduced random noise. An initial set of 34 predictors was reduced by ANOVA to obtain efficient, interpretable regression models. Models were trained on designated training sets and evaluated on held-out test sets defined through K-fold algorithm; final generalisation was confirmed on an independent external dataset. Four methods were compared: multivariable linear regression (with and without log transforms), Gaussian process, and neural network regressions; empirical prediction intervals (PI) were derived by the bootstrap method. A well-specified linear model matched nonlinear alternatives at much lower computational cost. Best results concerned the longitudinal-level index in the D1 (3–25 m) band; crosslevel and twist were promising, while alignment was not predictable with current data and sensors. Wide prediction intervals motivate larger datasets through extended instrumentation and an improved positioning algorithm. The external validation confirmed robust classification versus EN 13484 thresholds and PI coverage consistent with nominal confidence; temporal analysis demonstrated good model sensitivity and specificity. The work, overall, establishes a solid basis for fleet-scale CM.| File | Dimensione | Formato | |
|---|---|---|---|
|
2025_12_Belardo_Executive Summary.pdf
non accessibile
Descrizione: testo dell'executive summary
Dimensione
1.44 MB
Formato
Adobe PDF
|
1.44 MB | Adobe PDF | Visualizza/Apri |
|
2025_12_Belardo_Tesi.pdf
non accessibile
Descrizione: testo della tesi
Dimensione
12.77 MB
Formato
Adobe PDF
|
12.77 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/246584