Rotating machinery is a key component in many complex mechanical systems, such as vehicles, trains, wind turbines, etc. In the rotating machinery system, gears and bearings are the main components, which would lead to serious accidents if they malfunctioned. Hence, how to quickly and reliably detect the fault states of the bearings and gears in the rotating machinery system is a very challenging topic in modern industry. On the one hand, numerous researchers have employed many signal-processing techniques to extract notable fault features, enabling the identification of potential malfunctions. On the other hand, with the development of artificial intelligence, a growing number of algorithms are being applied to the fault diagnosis of rotating machinery, including shallow learning (such as SVM, ANNs, and etc), deep learning (for instance CNNs, RNNs, GANs and etc) and reinforcement learning (model-based reinforcement learning, model-free reinforcement learning and etc). Diagnosis techniques based on signal processing are both interpretable and trustworthy, as their effective utilization demands specialized knowledge in signal processing and rotating machinery. The fault features could be obtained directly with the signal processing techniques, while the artificial intelligence algorithms are different. Artificial intelligence algorithms have the capability to discern distinctions without requiring the specific expertise associated with signal processing techniques. However, the application of these algorithms entails inherent risks due to their black-box nature, even though they often provide highly accurate models. Fault identification using raw vibration signals, particularly in the time domain, is a complex endeavor when it comes to rotating machinery. Consequently, numerous frameworks have emerged that exhibit increasingly accurate properties in fault identification, leveraging various signal processing techniques like Fourier transform, wavelet transform, and others. However, the presence of significant background noise in signals can pose challenges to effective feature extraction. Additionally, it is crucial for a highly accurate deep-learning model to be trained on a sufficient number of samples. Hence, a novel fault identification model was proposed to address the above problems, RWKDCAE. In this proposed framework, a residual convolutional auto-encoder module was used to pre-train the parameters under the unsupervised learning process, which could improve the performance with limited samples and avoid over-fitting problems. Meanwhile, the wide kernel of the first convolutional layer was applied to improve the feature extraction capability. Consequently, the proposed framework demonstrates exceptional accuracy on both the bearing dataset and gearbox dataset, surpassing the performance of existing state-of-the-art models, particularly in scenarios involving noise and limited sample sizes. In scenarios where high precision is paramount, prioritizing the enhancement of fault identification accuracy becomes imperative. It is important to recognize that diverse signal types encompass distinct information, such as time-domain or frequency-domain characteristics, and pose varying challenges in extracting meaningful features. Furthermore, within a conventional CNN framework, certain components such as the ReLU activation function, MaxPool layer, and AveragePool layer have inherent drawbacks. For instance, ReLU results in the loss of gradient information by zeroing out negative inputs, while MaxPool only retains the maximum value within each pooling region, leading to information loss. Therefore, a novel decision-level fuzzy fusion framework has been introduced to enhance the accuracy of fault identification. This framework utilizes multiple enhanced CNN models, incorporating the MISH activation function and SoftPool with four distinct input signals, to improve the performance of the CNN framework. Furthermore, the fusion performance is enhanced using the Choquet fuzzy integral, which outperforms conventional methods such as majority voting and average voting. Moreover, to effectively identify vibration signals amidst high levels of noise, it becomes essential to devise a framework capable of decomposing noisy signals and enhancing identification performance. Consequently, a combination of multi-resolution analysis, multi-scale convolutional neural network (CNN), and information bottleneck techniques has been employed to handle this challenge. The multi-resolution analysis enables the decomposition of noisy signals into distinct frequency-level signals, preserving crucial frequency information. Leveraging multi-scale CNN facilitates the simultaneous extraction of features at various frequency levels. Finally, the information bottleneck method is employed to compress the mutual information between features and inputs, thereby bolstering the framework's anti-noise capabilities. Due to the inherent black-box nature of deep learning models, their internal workings often remain opaque, making it challenging to ascertain whether fault identification models have effectively learned crucial input features and based their decisions on them. To address this issue, an explainable intelligence fault diagnosis framework has been developed, leveraging convolutional neural networks (CNNs). The framework employs the smoothed score-CAM method to evaluate the learned features within the model. Additionally, Average Drop and Average Increase measures are utilized to demonstrate the importance of the learned features. The experimental results illustrate that the proposed framework achieves a testing accuracy of 100% while providing visualizations and interpretability through the Average Drop and Average Increase obtained from a classification activation mappings method. In the domain of rotating machinery fault identification, dealing with unbalanced samples poses an additional challenge. This is primarily due to the scarcity and difficulty in obtaining failure data, which makes it challenging to have a balanced representation of different fault classes. Consequently, in real-world scenarios, the majority class during training often consists of healthy state samples, while the minority class represents the fault states. This class imbalance results in biased predictions by the fault recognition model towards the majority class (healthy state), ultimately affecting the accuracy of the machine learning model's fault recognition capabilities. In addition, general classifications are usually based on supervised learning methods, in which the parameters optimization step is strongly based on the input and output that is different from humans. Hence, a human-like intelligence fault identification framework has been proposed based on transfer learning and reinforcement learning framework. The proposed framework offers advantages on two fronts. Firstly, it exhibits a faster convergence speed compared to certain existing reinforcement learning frameworks. This attribute enables the model to reach optimal performance more quickly, saving computational resources and time. Secondly, the framework demonstrates superior performance when faced with imbalanced samples, effectively addressing the challenges associated with skewed class distributions. By mitigating the impact of class imbalance, the model can provide more accurate and reliable predictions even in scenarios where fault samples are limited compared to healthy samples. In addition, the hyperparameters in the deep reinforcement learning framework are also analyzed in detail. The experiment results show that the proposed framework could efficiently extract the fault features from raw time-domain data and have higher accuracy than other deep learning models with balanced samples and better performance with imbalanced samples.

La macchinaria rotante è un componente chiave in molti complessi sistemi meccanici, come veicoli, treni, turbine eoliche, ecc. Nel sistema di macchinaria rotante, ingranaggi e cuscinetti sono i principali componenti, il cui malfunzionamento potrebbe causare gravi incidenti. Pertanto, come rilevare rapidamente e in modo affidabile gli stati di guasto dei cuscinetti e degli ingranaggi nel sistema di macchinaria rotante è un argomento molto sfidante nell'industria moderna. Da un lato, numerosi ricercatori hanno impiegato molte tecniche di elaborazione del segnale per estrarre notevoli caratteristiche di guasto, consentendo l'identificazione di potenziali malfunzionamenti. D'altra parte, con lo sviluppo dell'intelligenza artificiale, un numero crescente di algoritmi viene applicato alla diagnosi di guasto della macchinaria rotante, compreso l'apprendimento superficiale (come SVM, reti neurali artificiali, ecc.), l'apprendimento profondo (ad esempio, CNN, RNN, GAN, ecc.) e l'apprendimento per rinforzo (apprendimento per rinforzo basato su modello, apprendimento per rinforzo senza modello, ecc.). Le tecniche di diagnosi basate sull'elaborazione del segnale sono interpretabili e affidabili, poiché la loro utilizzazione efficace richiede conoscenze specializzate nell'elaborazione del segnale e nella macchinaria rotante. Le caratteristiche di guasto potrebbero essere ottenute direttamente con le tecniche di elaborazione del segnale, mentre gli algoritmi di intelligenza artificiale sono diversi. Gli algoritmi di intelligenza artificiale hanno la capacità di discernere differenze senza richiedere l'esperienza specifica associata alle tecniche di elaborazione del segnale. Tuttavia, l'applicazione di questi algoritmi comporta rischi intrinseci dovuti alla loro natura di "scatola nera", anche se spesso forniscono modelli molto accurati. L'identificazione dei guasti utilizzando segnali di vibrazione grezzi, in particolare nel dominio temporale, è un compito complesso per quanto riguarda la macchinaria rotante. Di conseguenza, sono emerse numerose strutture che presentano proprietà di identificazione dei guasti sempre più accurate, sfruttando varie tecniche di elaborazione del segnale come la trasformata di Fourier, la trasformata wavelet e altre. Tuttavia, la presenza di rumore di fondo significativo nei segnali può rappresentare sfide per l'estrazione efficace delle caratteristiche. Inoltre, è cruciale che un modello di apprendimento profondo altamente accurato sia addestrato su un numero sufficiente di campioni. Pertanto, è stato proposto un nuovo modello di identificazione dei guasti per affrontare i problemi sopra citati, RWKDCAE. In questo framework proposto, è stato utilizzato un modulo di autoencoder convoluzionale residuo per pre-addestrare i parametri nel processo di apprendimento non supervisionato, il che potrebbe migliorare le prestazioni con campioni limitati ed evitare problemi di sovradattamento. Nel frattempo, è stata applicata una vasta finestra del primo strato convoluzionale per migliorare la capacità di estrazione delle caratteristiche. Di conseguenza, il framework proposto dimostra un'eccezionale accuratezza sia nell'insieme di dati dei cuscinetti che nell'insieme di dati degli ingranaggi, superando le prestazioni dei modelli esistenti all'avanguardia, in particolare in scenari che coinvolgono rumore e dimensioni di campione limitate. In scenari in cui l'alta precisione è fondamentale, diventa imprescindibile dare priorità al miglioramento dell'accuratezza dell'identificazione dei guasti. È importante riconoscere che diversi tipi di segnale includono informazioni diverse, come caratteristiche nel dominio temporale o nel dominio delle frequenze, e presentano sfide diverse nell'estrazione di caratteristiche significative. Inoltre, all'interno di un framework CNN convenzionale, alcuni componenti come la funzione di attivazione ReLU, lo strato MaxPool e lo strato AveragePool presentano svantaggi intrinseci. Ad esempio, la ReLU comporta la perdita di informazioni sul gradiente azzerando gli input negativi, mentre il MaxPool conserva solo il valore massimo all'interno di ciascuna regione di pooling, portando alla perdita di informazioni. Pertanto, è stato introdotto un nuovo framework di fusione fuzzy a livello di decisione per migliorare l'accuratezza dell'identificazione dei guasti. Questo framework utilizza più modelli CNN potenziati, incorporando la funzione di attivazione MISH e SoftPool con quattro segnali di ingresso distinti, per migliorare le prestazioni del framework CNN. Inoltre, le prestazioni di fusione vengono potenziate utilizzando l'integrale fuzzy di Choquet, che supera i metodi convenzionali come il voto della maggioranza e il voto medio. Inoltre, per identificare efficacemente i segnali di vibrazione in mezzo a livelli elevati di rumore, diventa essenziale ideare un framework in grado di scomporre i segnali rumorosi e migliorare le prestazioni di identificazione. Di conseguenza, è stata impiegata una combinazione di analisi a multi-risoluzione, rete neurale convoluzionale (CNN) a multi-scala e tecniche di bottleneck dell'informazione per affrontare questa sfida. L'analisi a multi-risoluzione consente la scomposizione dei segnali rumorosi in segnali distinti a diversi livelli di frequenza, preservando informazioni cruciali sulla frequenza. Sfruttando la CNN a multi-scala si facilita l'estrazione simultanea di caratteristiche a vari livelli di frequenza. Infine, il metodo del bottleneck dell'informazione viene utilizzato per comprimere le informazioni reciproche tra le caratteristiche e gli ingressi, rafforzando così le capacità anti-rumore del framework. A causa della natura intrinsecamente "scatola nera" dei modelli di apprendimento profondo, il loro funzionamento inter no spesso rimane oscuro, rendendo difficile accertare se i modelli di identificazione dei guasti abbiano effettivamente appreso importanti caratteristiche di input e basato su di esse le loro decisioni. Per affrontare questo problema, è stato sviluppato un framework diagnostico di guasto intelligente ed esplicabile, che utilizza reti neurali convoluzionali (CNN). Il framework impiega il metodo smoothed score-CAM per valutare le caratteristiche apprese all'interno del modello. Inoltre, vengono utilizzate misure di Average Drop e Average Increase per dimostrare l'importanza delle caratteristiche apprese. I risultati sperimentali illustrano che il framework proposto raggiunge un'accuratezza del 100% durante i test, fornendo allo stesso tempo visualizzazioni e interpretabilità attraverso Average Drop e Average Increase ottenuti da un metodo di mappatura delle attivazioni di classificazione. Nel campo dell'identificazione dei guasti delle macchine rotanti, affrontare campioni sbilanciati costituisce una sfida aggiuntiva. Ciò è dovuto principalmente alla scarsità e alla difficoltà nel reperire dati di guasto, il che rende difficile avere una rappresentazione equilibrata delle diverse classi di guasto. Di conseguenza, in scenari del mondo reale, la classe di maggioranza durante l'addestramento è spesso costituita da campioni in stato di salute, mentre la classe di minoranza rappresenta gli stati di guasto. Questo squilibrio di classe porta a previsioni tendenzialmente sbilanciate da parte del modello di riconoscimento del guasto verso la classe di maggioranza (stato di salute), influenzando alla fine l'accuratezza delle capacità di riconoscimento del guasto del modello di apprendimento automatico. Inoltre, le classificazioni generali sono solitamente basate su metodi di apprendimento supervisionato, in cui la fase di ottimizzazione dei parametri si basa fortemente sull'input e l'output che sono diversi da quelli umani. Pertanto, è stato proposto un framework di identificazione del guasto con intelligenza simile a quella umana, basato sul trasferimento di apprendimento e sul framework di apprendimento per rinforzo. Il framework proposto offre vantaggi su due fronti. In primo luogo, presenta una velocità di convergenza più rapida rispetto a certi framework di apprendimento per rinforzo esistenti. Questa caratteristica consente al modello di raggiungere più velocemente prestazioni ottimali, risparmiando risorse computazionali e tempo. In secondo luogo, il framework dimostra prestazioni superiori di fronte a campioni sbilanciati, affrontando efficacemente le sfide legate alle distribuzioni di classe asimmetriche. Mitigando l'impatto dello squilibrio di classe, il modello può fornire previsioni più accurate e affidabili anche in scenari in cui i campioni di guasto sono limitati rispetto ai campioni di salute. Inoltre, i parametri iperattivi nel framework di apprendimento profondo per rinforzo sono analizzati anche in dettaglio. I risultati sperimentali mostrano che il framework proposto potrebbe estrarre efficientemente le caratteristiche di guasto dai dati grezzi nel dominio temporale e avere un'accuratezza superiore rispetto ad altri modelli di apprendimento profondo con campioni bilanciati e prestazioni migliori con campioni sbilanciati.

Deep learning algorithms for rotating machinery fault diagnosis

Yang, Daoguang
2022/2023

Abstract

Rotating machinery is a key component in many complex mechanical systems, such as vehicles, trains, wind turbines, etc. In the rotating machinery system, gears and bearings are the main components, which would lead to serious accidents if they malfunctioned. Hence, how to quickly and reliably detect the fault states of the bearings and gears in the rotating machinery system is a very challenging topic in modern industry. On the one hand, numerous researchers have employed many signal-processing techniques to extract notable fault features, enabling the identification of potential malfunctions. On the other hand, with the development of artificial intelligence, a growing number of algorithms are being applied to the fault diagnosis of rotating machinery, including shallow learning (such as SVM, ANNs, and etc), deep learning (for instance CNNs, RNNs, GANs and etc) and reinforcement learning (model-based reinforcement learning, model-free reinforcement learning and etc). Diagnosis techniques based on signal processing are both interpretable and trustworthy, as their effective utilization demands specialized knowledge in signal processing and rotating machinery. The fault features could be obtained directly with the signal processing techniques, while the artificial intelligence algorithms are different. Artificial intelligence algorithms have the capability to discern distinctions without requiring the specific expertise associated with signal processing techniques. However, the application of these algorithms entails inherent risks due to their black-box nature, even though they often provide highly accurate models. Fault identification using raw vibration signals, particularly in the time domain, is a complex endeavor when it comes to rotating machinery. Consequently, numerous frameworks have emerged that exhibit increasingly accurate properties in fault identification, leveraging various signal processing techniques like Fourier transform, wavelet transform, and others. However, the presence of significant background noise in signals can pose challenges to effective feature extraction. Additionally, it is crucial for a highly accurate deep-learning model to be trained on a sufficient number of samples. Hence, a novel fault identification model was proposed to address the above problems, RWKDCAE. In this proposed framework, a residual convolutional auto-encoder module was used to pre-train the parameters under the unsupervised learning process, which could improve the performance with limited samples and avoid over-fitting problems. Meanwhile, the wide kernel of the first convolutional layer was applied to improve the feature extraction capability. Consequently, the proposed framework demonstrates exceptional accuracy on both the bearing dataset and gearbox dataset, surpassing the performance of existing state-of-the-art models, particularly in scenarios involving noise and limited sample sizes. In scenarios where high precision is paramount, prioritizing the enhancement of fault identification accuracy becomes imperative. It is important to recognize that diverse signal types encompass distinct information, such as time-domain or frequency-domain characteristics, and pose varying challenges in extracting meaningful features. Furthermore, within a conventional CNN framework, certain components such as the ReLU activation function, MaxPool layer, and AveragePool layer have inherent drawbacks. For instance, ReLU results in the loss of gradient information by zeroing out negative inputs, while MaxPool only retains the maximum value within each pooling region, leading to information loss. Therefore, a novel decision-level fuzzy fusion framework has been introduced to enhance the accuracy of fault identification. This framework utilizes multiple enhanced CNN models, incorporating the MISH activation function and SoftPool with four distinct input signals, to improve the performance of the CNN framework. Furthermore, the fusion performance is enhanced using the Choquet fuzzy integral, which outperforms conventional methods such as majority voting and average voting. Moreover, to effectively identify vibration signals amidst high levels of noise, it becomes essential to devise a framework capable of decomposing noisy signals and enhancing identification performance. Consequently, a combination of multi-resolution analysis, multi-scale convolutional neural network (CNN), and information bottleneck techniques has been employed to handle this challenge. The multi-resolution analysis enables the decomposition of noisy signals into distinct frequency-level signals, preserving crucial frequency information. Leveraging multi-scale CNN facilitates the simultaneous extraction of features at various frequency levels. Finally, the information bottleneck method is employed to compress the mutual information between features and inputs, thereby bolstering the framework's anti-noise capabilities. Due to the inherent black-box nature of deep learning models, their internal workings often remain opaque, making it challenging to ascertain whether fault identification models have effectively learned crucial input features and based their decisions on them. To address this issue, an explainable intelligence fault diagnosis framework has been developed, leveraging convolutional neural networks (CNNs). The framework employs the smoothed score-CAM method to evaluate the learned features within the model. Additionally, Average Drop and Average Increase measures are utilized to demonstrate the importance of the learned features. The experimental results illustrate that the proposed framework achieves a testing accuracy of 100% while providing visualizations and interpretability through the Average Drop and Average Increase obtained from a classification activation mappings method. In the domain of rotating machinery fault identification, dealing with unbalanced samples poses an additional challenge. This is primarily due to the scarcity and difficulty in obtaining failure data, which makes it challenging to have a balanced representation of different fault classes. Consequently, in real-world scenarios, the majority class during training often consists of healthy state samples, while the minority class represents the fault states. This class imbalance results in biased predictions by the fault recognition model towards the majority class (healthy state), ultimately affecting the accuracy of the machine learning model's fault recognition capabilities. In addition, general classifications are usually based on supervised learning methods, in which the parameters optimization step is strongly based on the input and output that is different from humans. Hence, a human-like intelligence fault identification framework has been proposed based on transfer learning and reinforcement learning framework. The proposed framework offers advantages on two fronts. Firstly, it exhibits a faster convergence speed compared to certain existing reinforcement learning frameworks. This attribute enables the model to reach optimal performance more quickly, saving computational resources and time. Secondly, the framework demonstrates superior performance when faced with imbalanced samples, effectively addressing the challenges associated with skewed class distributions. By mitigating the impact of class imbalance, the model can provide more accurate and reliable predictions even in scenarios where fault samples are limited compared to healthy samples. In addition, the hyperparameters in the deep reinforcement learning framework are also analyzed in detail. The experiment results show that the proposed framework could efficiently extract the fault features from raw time-domain data and have higher accuracy than other deep learning models with balanced samples and better performance with imbalanced samples.
BERNASCONI, ANDREA
CIGADA, ALFREDO
30-ago-2023
Deep learning algorithms for rotating machinery fault diagnosis
La macchinaria rotante è un componente chiave in molti complessi sistemi meccanici, come veicoli, treni, turbine eoliche, ecc. Nel sistema di macchinaria rotante, ingranaggi e cuscinetti sono i principali componenti, il cui malfunzionamento potrebbe causare gravi incidenti. Pertanto, come rilevare rapidamente e in modo affidabile gli stati di guasto dei cuscinetti e degli ingranaggi nel sistema di macchinaria rotante è un argomento molto sfidante nell'industria moderna. Da un lato, numerosi ricercatori hanno impiegato molte tecniche di elaborazione del segnale per estrarre notevoli caratteristiche di guasto, consentendo l'identificazione di potenziali malfunzionamenti. D'altra parte, con lo sviluppo dell'intelligenza artificiale, un numero crescente di algoritmi viene applicato alla diagnosi di guasto della macchinaria rotante, compreso l'apprendimento superficiale (come SVM, reti neurali artificiali, ecc.), l'apprendimento profondo (ad esempio, CNN, RNN, GAN, ecc.) e l'apprendimento per rinforzo (apprendimento per rinforzo basato su modello, apprendimento per rinforzo senza modello, ecc.). Le tecniche di diagnosi basate sull'elaborazione del segnale sono interpretabili e affidabili, poiché la loro utilizzazione efficace richiede conoscenze specializzate nell'elaborazione del segnale e nella macchinaria rotante. Le caratteristiche di guasto potrebbero essere ottenute direttamente con le tecniche di elaborazione del segnale, mentre gli algoritmi di intelligenza artificiale sono diversi. Gli algoritmi di intelligenza artificiale hanno la capacità di discernere differenze senza richiedere l'esperienza specifica associata alle tecniche di elaborazione del segnale. Tuttavia, l'applicazione di questi algoritmi comporta rischi intrinseci dovuti alla loro natura di "scatola nera", anche se spesso forniscono modelli molto accurati. L'identificazione dei guasti utilizzando segnali di vibrazione grezzi, in particolare nel dominio temporale, è un compito complesso per quanto riguarda la macchinaria rotante. Di conseguenza, sono emerse numerose strutture che presentano proprietà di identificazione dei guasti sempre più accurate, sfruttando varie tecniche di elaborazione del segnale come la trasformata di Fourier, la trasformata wavelet e altre. Tuttavia, la presenza di rumore di fondo significativo nei segnali può rappresentare sfide per l'estrazione efficace delle caratteristiche. Inoltre, è cruciale che un modello di apprendimento profondo altamente accurato sia addestrato su un numero sufficiente di campioni. Pertanto, è stato proposto un nuovo modello di identificazione dei guasti per affrontare i problemi sopra citati, RWKDCAE. In questo framework proposto, è stato utilizzato un modulo di autoencoder convoluzionale residuo per pre-addestrare i parametri nel processo di apprendimento non supervisionato, il che potrebbe migliorare le prestazioni con campioni limitati ed evitare problemi di sovradattamento. Nel frattempo, è stata applicata una vasta finestra del primo strato convoluzionale per migliorare la capacità di estrazione delle caratteristiche. Di conseguenza, il framework proposto dimostra un'eccezionale accuratezza sia nell'insieme di dati dei cuscinetti che nell'insieme di dati degli ingranaggi, superando le prestazioni dei modelli esistenti all'avanguardia, in particolare in scenari che coinvolgono rumore e dimensioni di campione limitate. In scenari in cui l'alta precisione è fondamentale, diventa imprescindibile dare priorità al miglioramento dell'accuratezza dell'identificazione dei guasti. È importante riconoscere che diversi tipi di segnale includono informazioni diverse, come caratteristiche nel dominio temporale o nel dominio delle frequenze, e presentano sfide diverse nell'estrazione di caratteristiche significative. Inoltre, all'interno di un framework CNN convenzionale, alcuni componenti come la funzione di attivazione ReLU, lo strato MaxPool e lo strato AveragePool presentano svantaggi intrinseci. Ad esempio, la ReLU comporta la perdita di informazioni sul gradiente azzerando gli input negativi, mentre il MaxPool conserva solo il valore massimo all'interno di ciascuna regione di pooling, portando alla perdita di informazioni. Pertanto, è stato introdotto un nuovo framework di fusione fuzzy a livello di decisione per migliorare l'accuratezza dell'identificazione dei guasti. Questo framework utilizza più modelli CNN potenziati, incorporando la funzione di attivazione MISH e SoftPool con quattro segnali di ingresso distinti, per migliorare le prestazioni del framework CNN. Inoltre, le prestazioni di fusione vengono potenziate utilizzando l'integrale fuzzy di Choquet, che supera i metodi convenzionali come il voto della maggioranza e il voto medio. Inoltre, per identificare efficacemente i segnali di vibrazione in mezzo a livelli elevati di rumore, diventa essenziale ideare un framework in grado di scomporre i segnali rumorosi e migliorare le prestazioni di identificazione. Di conseguenza, è stata impiegata una combinazione di analisi a multi-risoluzione, rete neurale convoluzionale (CNN) a multi-scala e tecniche di bottleneck dell'informazione per affrontare questa sfida. L'analisi a multi-risoluzione consente la scomposizione dei segnali rumorosi in segnali distinti a diversi livelli di frequenza, preservando informazioni cruciali sulla frequenza. Sfruttando la CNN a multi-scala si facilita l'estrazione simultanea di caratteristiche a vari livelli di frequenza. Infine, il metodo del bottleneck dell'informazione viene utilizzato per comprimere le informazioni reciproche tra le caratteristiche e gli ingressi, rafforzando così le capacità anti-rumore del framework. A causa della natura intrinsecamente "scatola nera" dei modelli di apprendimento profondo, il loro funzionamento inter no spesso rimane oscuro, rendendo difficile accertare se i modelli di identificazione dei guasti abbiano effettivamente appreso importanti caratteristiche di input e basato su di esse le loro decisioni. Per affrontare questo problema, è stato sviluppato un framework diagnostico di guasto intelligente ed esplicabile, che utilizza reti neurali convoluzionali (CNN). Il framework impiega il metodo smoothed score-CAM per valutare le caratteristiche apprese all'interno del modello. Inoltre, vengono utilizzate misure di Average Drop e Average Increase per dimostrare l'importanza delle caratteristiche apprese. I risultati sperimentali illustrano che il framework proposto raggiunge un'accuratezza del 100% durante i test, fornendo allo stesso tempo visualizzazioni e interpretabilità attraverso Average Drop e Average Increase ottenuti da un metodo di mappatura delle attivazioni di classificazione. Nel campo dell'identificazione dei guasti delle macchine rotanti, affrontare campioni sbilanciati costituisce una sfida aggiuntiva. Ciò è dovuto principalmente alla scarsità e alla difficoltà nel reperire dati di guasto, il che rende difficile avere una rappresentazione equilibrata delle diverse classi di guasto. Di conseguenza, in scenari del mondo reale, la classe di maggioranza durante l'addestramento è spesso costituita da campioni in stato di salute, mentre la classe di minoranza rappresenta gli stati di guasto. Questo squilibrio di classe porta a previsioni tendenzialmente sbilanciate da parte del modello di riconoscimento del guasto verso la classe di maggioranza (stato di salute), influenzando alla fine l'accuratezza delle capacità di riconoscimento del guasto del modello di apprendimento automatico. Inoltre, le classificazioni generali sono solitamente basate su metodi di apprendimento supervisionato, in cui la fase di ottimizzazione dei parametri si basa fortemente sull'input e l'output che sono diversi da quelli umani. Pertanto, è stato proposto un framework di identificazione del guasto con intelligenza simile a quella umana, basato sul trasferimento di apprendimento e sul framework di apprendimento per rinforzo. Il framework proposto offre vantaggi su due fronti. In primo luogo, presenta una velocità di convergenza più rapida rispetto a certi framework di apprendimento per rinforzo esistenti. Questa caratteristica consente al modello di raggiungere più velocemente prestazioni ottimali, risparmiando risorse computazionali e tempo. In secondo luogo, il framework dimostra prestazioni superiori di fronte a campioni sbilanciati, affrontando efficacemente le sfide legate alle distribuzioni di classe asimmetriche. Mitigando l'impatto dello squilibrio di classe, il modello può fornire previsioni più accurate e affidabili anche in scenari in cui i campioni di guasto sono limitati rispetto ai campioni di salute. Inoltre, i parametri iperattivi nel framework di apprendimento profondo per rinforzo sono analizzati anche in dettaglio. I risultati sperimentali mostrano che il framework proposto potrebbe estrarre efficientemente le caratteristiche di guasto dai dati grezzi nel dominio temporale e avere un'accuratezza superiore rispetto ad altri modelli di apprendimento profondo con campioni bilanciati e prestazioni migliori con campioni sbilanciati.
File allegati
File Dimensione Formato  
PhD_Thesis_V4.pdf

accessibile in internet solo dagli utenti autorizzati

Dimensione 77.12 MB
Formato Adobe PDF
77.12 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/207792