With the rapid industrialization of intelligent monitoring systems, deep learning (DL) has become a novel technology for diagnosing faults in rotating machinery. This thesis provides a structured review of the recent progress in DL-based Fault Detection & Fault Diagnosis (FD&F) published between 2020 and 2025. It includes systematization of some significant architectures such as Convolutional Neural Networks (CNNs), Autoencoders (AEs), Recurrent Neural Network (RNNs), Generative Adversarial Networks (GANs), Graph Neural Networks (GNNs), Transformers, and Reinforcement Learning (RL) based on structure design, evaluation criteria, and application scenario in bearings, gears, rotors, turbines, and pumps. It can be observed from the overview that CNNs are the most common framework for vibration-based diagnosis due to their ability to extract features in space better than others. Autoencoders and GANs also improved data-driven diagnosis with unsupervised learning and generative learning, respectively. Long Short-Term Memory (LSTM) and RNNs possess strong temporal modeling capabilities, enabling them to detect the evolution of faults accurately. More recently, GNNs and Transformers have revived the state of the art in augmenting cross-domain adaptability, interpretability, and multimodal data fusion. Hybrid models that are learned from these models perform more accurate diagnosis, stability, and generality for different operating conditions. The limiting factors that have been identified are the lack of labeled data, class imbalance, explainability, and computational cost of deployment on real-world applications. These types of problems propel the emergence of new research areas, including data-efficient learning, federated learning, self-supervised learning, physics-informed models, and digital twins for learning and training. Such advancements make DL-driven maintenance systems more explainable and sustainable. Empirical comparisons on standard data sets have shown that new DL models are achieving accuracies of over 95%, much higher than old machine learning methods. To validate the reviewed theoretical frameworks, a practical implementation was conducted using experimental data acquired from a test rig. Two deep learning approaches were developed and comparatively evaluated. The first employed transfer learning using the SqueezeNet architecture applied to scalogram image representations generated via Continuous Wavelet Transform (CWT). This approach achieved 95.59% classification accuracy in binary fault detection (Normal vs. Faulty), with 97.68% recall for faulty conditions. The second approach implemented a custom one-dimensional convolutional neural network (1D CNN) operating directly on raw vibration signals, eliminating intermediate signal-to-image transformations. The 1D CNN achieved a significantly higher classification accuracy of 99.74%, with only one missed fault (0.07%) and four false alarms (0.70%) out of 1,950 test samples. Despite containing approximately six times fewer parameters than the transfer learning model, the 1D CNN demonstrated superior performance, indicating that domain-specific architectures operating on raw signals can outperform pre-trained image-based networks for vibration-based fault diagnosis tasks. Complementary envelope spectrum analysis confirmed the presence of inner race defect signatures at the Ball Pass Frequency Inner Race (BPFI) and its harmonics, providing physical validation of the deep learning classification results. The findings demonstrate the practical feasibility of deploying computationally efficient deep learning models for automated bearing condition monitoring in railway traction applications. The thesis concludes that future development will rely on the marriage of physics-based models with data-driven model forms, expanding open-access industrial data sets, and energy-efficient deployment of DL systems on edge-cloud frameworks. These trends are indicative of achieving sustainable, autonomous, and ultimately explainable diagnostic models, which form the foundation of intelligent manufacturing within Industry 4.0 and are similarly expected in Industry 5.0 and beyond.

Con la rapida industrializzazione dei sistemi di monitoraggio intelligente, il deep learning (DL) è diventato una tecnologia innovativa per la diagnostica dei guasti nelle macchine rotanti. Questa tesi fornisce una rassegna strutturata dei recenti progressi nella rilevazione e diagnosi dei guasti (FD&F) basata su DL pubblicata tra il 2020 e il 2025. Include la sistematizzazione di alcune architetture significative come le Reti Neurali Convoluzionali (CNN), gli Autoencoder (AE), le Reti Neurali Ricorrenti (RNN), le Reti Generative Avversarie (GAN), le Reti Neurali Graph (GNN), i Transformer e l'Apprendimento per Rinforzo (RL), basata sul design strutturale, i criteri di valutazione e lo scenario applicativo in cuscinetti, ingranaggi, rotori, turbine e pompe. Dalla panoramica si può osservare che le CNN rappresentano il framework più comune per la diagnosi basata sulle vibrazioni, grazie alla loro capacità di estrarre caratteristiche nello spazio meglio di altre. Anche gli Autoencoder e le GAN hanno migliorato la diagnosi basata sui dati, rispettivamente con l'apprendimento non supervisionato e l'apprendimento generativo. La Long Short-Term Memory (LSTM) e le RNN possiedono forti capacità di modellazione temporale, consentendo loro di rilevare accuratamente l'evoluzione dei guasti. Più recentemente, le GNN e i Transformer hanno rinnovato lo stato dell'arte nel potenziare l'adattabilità cross-domain, l'interpretabilità e la fusione di dati multimodali. I modelli ibridi derivati da questi modelli offrono una diagnosi più accurata, stabilità e generalità per diverse condizioni operative. I fattori limitanti identificati sono la mancanza di dati etichettati, lo sbilanciamento delle classi, la spiegabilità e il costo computazionale dell'implementazione in applicazioni reali. Questi tipi di problemi stimolano l'emergere di nuove aree di ricerca, tra cui l'apprendimento efficiente dei dati (data-efficient learning), il federated learning, l'apprendimento auto-supervisionato, i modelli physics-informed e i gemelli digitali (digital twins) per l'apprendimento e l'addestramento. Tali progressi rendono i sistemi di manutenzione guidati dal DL più spiegabili e sostenibili. Confronti empirici su set di dati standard hanno dimostrato che i nuovi modelli di DL stanno raggiungendo precisioni superiori al 95%, molto più elevate rispetto ai vecchi metodi di machine learning. Per convalidare i framework teorici esaminati, è stata condotta un'implementazione pratica utilizzando dati sperimentali acquisiti da un banco di prova. Sono stati sviluppati e valutati comparativamente due approcci di deep learning. Il primo ha utilizzato il transfer learning impiegando l'architettura SqueezeNet applicata a rappresentazioni di immagini scalogramma generate tramite la Trasformata Wavelet Continua (CWT). Questo approccio ha ottenuto un'accuratezza di classificazione del 95,59% nella rilevazione binaria dei guasti (Normale vs. Difettoso), con un recall del 97,68% per le condizioni di guasto. Il secondo approccio ha implementato una rete neurale convoluzionale unidimensionale personalizzata (1D CNN) che opera direttamente sui segnali di vibrazione grezzi, eliminando le trasformazioni intermedie segnale-immagine. La 1D CNN ha ottenuto un'accuratezza di classificazione significativamente superiore, pari al 99,74%, con un solo guasto mancato (0,07%) e quattro falsi allarmi (0,70%) su 1.950 campioni di test. Nonostante contenga circa sei volte meno parametri rispetto al modello di transfer learning, la 1D CNN ha dimostrato prestazioni superiori, indicando che le architetture specifiche per il dominio che operano su segnali grezzi possono superare le reti basate su immagini pre-addestrate per i compiti di diagnosi dei guasti basata sulle vibrazioni. L'analisi complementare dello spettro d'inviluppo ha confermato la presenza di firme di difetti sull'anello interno alla frequenza di passaggio delle sfere sull'anello interno (BPFI) e alle sue armoniche, fornendo una convalida fisica dei risultati della classificazione del deep learning. I risultati dimostrano la fattibilità pratica dell'impiego di modelli di deep learning computazionalmente efficienti per il monitoraggio automatizzato dello stato dei cuscinetti nelle applicazioni di trazione ferroviaria. La tesi conclude che lo sviluppo futuro si baserà sul connubio tra modelli basati sulla fisica e forme di modelli guidati dai dati, sull'espansione di set di dati industriali ad accesso aperto e sull'implementazione a basso consumo energetico di sistemi DL su framework edge-cloud. Queste tendenze sono indicative del raggiungimento di modelli diagnostici sostenibili, autonomi e, in definitiva, spiegabili, che costituiscono la base della produzione intelligente all'interno di Industria 4.0 e sono analogamente attesi in Industria 5.0 e oltre.

Recent advances in deep learning for fault diagnosis in rotating machinery

ALABDULLATIF, MOHAMMED ABDULLATIF A
2025/2026

Abstract

With the rapid industrialization of intelligent monitoring systems, deep learning (DL) has become a novel technology for diagnosing faults in rotating machinery. This thesis provides a structured review of the recent progress in DL-based Fault Detection & Fault Diagnosis (FD&F) published between 2020 and 2025. It includes systematization of some significant architectures such as Convolutional Neural Networks (CNNs), Autoencoders (AEs), Recurrent Neural Network (RNNs), Generative Adversarial Networks (GANs), Graph Neural Networks (GNNs), Transformers, and Reinforcement Learning (RL) based on structure design, evaluation criteria, and application scenario in bearings, gears, rotors, turbines, and pumps. It can be observed from the overview that CNNs are the most common framework for vibration-based diagnosis due to their ability to extract features in space better than others. Autoencoders and GANs also improved data-driven diagnosis with unsupervised learning and generative learning, respectively. Long Short-Term Memory (LSTM) and RNNs possess strong temporal modeling capabilities, enabling them to detect the evolution of faults accurately. More recently, GNNs and Transformers have revived the state of the art in augmenting cross-domain adaptability, interpretability, and multimodal data fusion. Hybrid models that are learned from these models perform more accurate diagnosis, stability, and generality for different operating conditions. The limiting factors that have been identified are the lack of labeled data, class imbalance, explainability, and computational cost of deployment on real-world applications. These types of problems propel the emergence of new research areas, including data-efficient learning, federated learning, self-supervised learning, physics-informed models, and digital twins for learning and training. Such advancements make DL-driven maintenance systems more explainable and sustainable. Empirical comparisons on standard data sets have shown that new DL models are achieving accuracies of over 95%, much higher than old machine learning methods. To validate the reviewed theoretical frameworks, a practical implementation was conducted using experimental data acquired from a test rig. Two deep learning approaches were developed and comparatively evaluated. The first employed transfer learning using the SqueezeNet architecture applied to scalogram image representations generated via Continuous Wavelet Transform (CWT). This approach achieved 95.59% classification accuracy in binary fault detection (Normal vs. Faulty), with 97.68% recall for faulty conditions. The second approach implemented a custom one-dimensional convolutional neural network (1D CNN) operating directly on raw vibration signals, eliminating intermediate signal-to-image transformations. The 1D CNN achieved a significantly higher classification accuracy of 99.74%, with only one missed fault (0.07%) and four false alarms (0.70%) out of 1,950 test samples. Despite containing approximately six times fewer parameters than the transfer learning model, the 1D CNN demonstrated superior performance, indicating that domain-specific architectures operating on raw signals can outperform pre-trained image-based networks for vibration-based fault diagnosis tasks. Complementary envelope spectrum analysis confirmed the presence of inner race defect signatures at the Ball Pass Frequency Inner Race (BPFI) and its harmonics, providing physical validation of the deep learning classification results. The findings demonstrate the practical feasibility of deploying computationally efficient deep learning models for automated bearing condition monitoring in railway traction applications. The thesis concludes that future development will rely on the marriage of physics-based models with data-driven model forms, expanding open-access industrial data sets, and energy-efficient deployment of DL systems on edge-cloud frameworks. These trends are indicative of achieving sustainable, autonomous, and ultimately explainable diagnostic models, which form the foundation of intelligent manufacturing within Industry 4.0 and are similarly expected in Industry 5.0 and beyond.
ING - Scuola di Ingegneria Industriale e dell'Informazione
26-mar-2026
2025/2026
Con la rapida industrializzazione dei sistemi di monitoraggio intelligente, il deep learning (DL) è diventato una tecnologia innovativa per la diagnostica dei guasti nelle macchine rotanti. Questa tesi fornisce una rassegna strutturata dei recenti progressi nella rilevazione e diagnosi dei guasti (FD&F) basata su DL pubblicata tra il 2020 e il 2025. Include la sistematizzazione di alcune architetture significative come le Reti Neurali Convoluzionali (CNN), gli Autoencoder (AE), le Reti Neurali Ricorrenti (RNN), le Reti Generative Avversarie (GAN), le Reti Neurali Graph (GNN), i Transformer e l'Apprendimento per Rinforzo (RL), basata sul design strutturale, i criteri di valutazione e lo scenario applicativo in cuscinetti, ingranaggi, rotori, turbine e pompe. Dalla panoramica si può osservare che le CNN rappresentano il framework più comune per la diagnosi basata sulle vibrazioni, grazie alla loro capacità di estrarre caratteristiche nello spazio meglio di altre. Anche gli Autoencoder e le GAN hanno migliorato la diagnosi basata sui dati, rispettivamente con l'apprendimento non supervisionato e l'apprendimento generativo. La Long Short-Term Memory (LSTM) e le RNN possiedono forti capacità di modellazione temporale, consentendo loro di rilevare accuratamente l'evoluzione dei guasti. Più recentemente, le GNN e i Transformer hanno rinnovato lo stato dell'arte nel potenziare l'adattabilità cross-domain, l'interpretabilità e la fusione di dati multimodali. I modelli ibridi derivati da questi modelli offrono una diagnosi più accurata, stabilità e generalità per diverse condizioni operative. I fattori limitanti identificati sono la mancanza di dati etichettati, lo sbilanciamento delle classi, la spiegabilità e il costo computazionale dell'implementazione in applicazioni reali. Questi tipi di problemi stimolano l'emergere di nuove aree di ricerca, tra cui l'apprendimento efficiente dei dati (data-efficient learning), il federated learning, l'apprendimento auto-supervisionato, i modelli physics-informed e i gemelli digitali (digital twins) per l'apprendimento e l'addestramento. Tali progressi rendono i sistemi di manutenzione guidati dal DL più spiegabili e sostenibili. Confronti empirici su set di dati standard hanno dimostrato che i nuovi modelli di DL stanno raggiungendo precisioni superiori al 95%, molto più elevate rispetto ai vecchi metodi di machine learning. Per convalidare i framework teorici esaminati, è stata condotta un'implementazione pratica utilizzando dati sperimentali acquisiti da un banco di prova. Sono stati sviluppati e valutati comparativamente due approcci di deep learning. Il primo ha utilizzato il transfer learning impiegando l'architettura SqueezeNet applicata a rappresentazioni di immagini scalogramma generate tramite la Trasformata Wavelet Continua (CWT). Questo approccio ha ottenuto un'accuratezza di classificazione del 95,59% nella rilevazione binaria dei guasti (Normale vs. Difettoso), con un recall del 97,68% per le condizioni di guasto. Il secondo approccio ha implementato una rete neurale convoluzionale unidimensionale personalizzata (1D CNN) che opera direttamente sui segnali di vibrazione grezzi, eliminando le trasformazioni intermedie segnale-immagine. La 1D CNN ha ottenuto un'accuratezza di classificazione significativamente superiore, pari al 99,74%, con un solo guasto mancato (0,07%) e quattro falsi allarmi (0,70%) su 1.950 campioni di test. Nonostante contenga circa sei volte meno parametri rispetto al modello di transfer learning, la 1D CNN ha dimostrato prestazioni superiori, indicando che le architetture specifiche per il dominio che operano su segnali grezzi possono superare le reti basate su immagini pre-addestrate per i compiti di diagnosi dei guasti basata sulle vibrazioni. L'analisi complementare dello spettro d'inviluppo ha confermato la presenza di firme di difetti sull'anello interno alla frequenza di passaggio delle sfere sull'anello interno (BPFI) e alle sue armoniche, fornendo una convalida fisica dei risultati della classificazione del deep learning. I risultati dimostrano la fattibilità pratica dell'impiego di modelli di deep learning computazionalmente efficienti per il monitoraggio automatizzato dello stato dei cuscinetti nelle applicazioni di trazione ferroviaria. La tesi conclude che lo sviluppo futuro si baserà sul connubio tra modelli basati sulla fisica e forme di modelli guidati dai dati, sull'espansione di set di dati industriali ad accesso aperto e sull'implementazione a basso consumo energetico di sistemi DL su framework edge-cloud. Queste tendenze sono indicative del raggiungimento di modelli diagnostici sostenibili, autonomi e, in definitiva, spiegabili, che costituiscono la base della produzione intelligente all'interno di Industria 4.0 e sono analogamente attesi in Industria 5.0 e oltre.
File allegati
File Dimensione Formato  
2026_03_Thesis_01.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Thesis
Dimensione 5.11 MB
Formato Adobe PDF
5.11 MB Adobe PDF   Visualizza/Apri
2026_03_Exective Summary_02.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Executive Summary
Dimensione 1.1 MB
Formato Adobe PDF
1.1 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/250822