Prognostics and Health Management (PHM) aims at analyzing past, present (recorded) and future (predicted) data and information on the condition of components and systems to detect functional and process anomalies, diagnose degraded and faulty states, and predict the Remaining Useful Life (RUL) of components and systems, i.e., the time left during which the components and the systems will continue to perform their functions. Two practical challenges are limiting the deployment of data-driven PHM methods in the field: a) the data used to develop the model (source domain) are collected from run-to-failure experiments performed in labs, whereas the data which the model is applied to (target domain) are acquired during in-field operation; b) the data of the source and target domains are collected from different systems of the same fleet. In both cases, there is a discrepancy between the distributions of the data of the source and target domains, due to the different operating and environmental conditions in which they are collected. Then, traditional data-driven methods, which require that training and test data originate from the same distribution, cannot be successfully applied. In this context, the objective of the PhD research presented in this thesis is to develop data-driven models for PHM in a way to overcome these practical difficulties. To this aim, methods based on Transfer Learning (TL) and Domain Adaptation (DA) are developed for transferring knowledge and information across different (source and target) data domains, mitigating the effects of domain discrepancies on the accuracy of the models. Furthermore, in practical applications there are other characteristics of the data, which need to be considered: indeed, data are typically 1) multi-dimensional raw time series of sensor measurements; 2) unlabeled, since the ground-truth degradation state is typically unknown; 3) imbalanced, since failures are rare. To deal with issues 1), 2) and 3) above, in this PhD thesis TL and DA methods are combined with deep learning methods, such as Auto-Encoders (AE), Convolutional Neural Networks (CNN), Long-Short Term Memory (LSTM) neural networks, and adversarial learning techniques. The proposed methods have been successfully verified considering data collected from various PHM international benchmarks, such as the Aramis Data Challenge, the CWRU and IMS bearing datasets, and the MIT-Stanford battery repository. Finally, the methods have been applied to real industrial data collected from locomotive and railway systems. The obtained results show the superior performance of the proposed methods with respect to state-of-the-art methods.

Prognostics and Health Management (PHM) mira ad analizzare dati e informazioni passate, presenti (registrati) e future (previsti) sulle condizioni di componenti e sistemi al fine di rilevare anomalie funzionali e di processo, diagnosticare stati degradati e difettosi, e predire la Remaining Useful Life (RUL) dei componenti e dei sistemi, ovvero il tempo rimanente durante il quale i componenti e i sistemi continueranno a svolgere le proprie funzioni. Due sfide pratiche limitano l'implementazione dei metodi PHM basati sui dati sul campo: a) i dati utilizzati per sviluppare il modello (dominio di origine) sono raccolti da esperimenti di esecuzione fino al guasto effettuati in laboratorio, mentre i dati a cui il modello viene applicato (dominio di destinazione) sono acquisiti durante l'operazione sul campo; b) i dati dei domini di origine e destinazione sono raccolti da sistemi diversi della stessa flotta. In entrambi i casi, vi è una discrepanza tra le distribuzioni dei dati dei domini di origine e destinazione, a causa delle diverse condizioni operative ed ambientali in cui vengono raccolti. Di conseguenza, i metodi tradizionali basati sui dati, che richiedono che i dati di addestramento e test provengano dalla stessa distribuzione, non possono essere applicati con successo. In questo contesto, l'obiettivo della ricerca di dottorato presentata in questa tesi è quello di sviluppare modelli basati sui dati per PHM in modo da superare queste difficoltà pratiche. A tal fine, sono stati sviluppati metodi basati su Transfer Learning (TL) e Domain Adaptation (DA) per il trasferimento di conoscenze e informazioni tra diversi domini di dati (dominio di origine e destinazione), mitigando gli effetti delle discrepanze di dominio sull'accuratezza dei modelli. Inoltre, nelle applicazioni pratiche ci sono altre caratteristiche dei dati che devono essere prese in considerazione: infatti, i dati sono tipicamente 1) serie temporali grezze multidimensionali di misurazioni dei sensori; 2) non etichettati, poiché lo stato di degrado reale di solito è sconosciuto; 3) sbilanciati, poiché i guasti sono rari. Per affrontare le questioni 1), 2) e 3) sopra menzionate, in questa tesi di dottorato i metodi di TL e DA vengono combinati con metodi di deep learning, come reti neurali Auto-Encoders (AE), Convolutional Neural Network (CNN), Long Short-Term Memory (LSTM) e tecniche di apprendimento avversariale. I metodi proposti sono stati verificati con successo utilizzando dati raccolti da vari benchmark internazionali di PHM, come i dataset di cuscinetti Aramis Data Challenge, CWRU e IMS e il repository di batterie MIT-Stanford. Infine, i metodi sono stati applicati a dati industriali reali provenienti da sistemi ferroviari e locomotive. I risultati ottenuti mostrano le prestazioni superiori dei metodi proposti rispetto ai metodi di ultima generazione.

Transfer learning and domain adaptation for the deployment in practice of prognostics and health management of industrial components and systems

Wang, Bingsen
2022/2023

Abstract

Prognostics and Health Management (PHM) aims at analyzing past, present (recorded) and future (predicted) data and information on the condition of components and systems to detect functional and process anomalies, diagnose degraded and faulty states, and predict the Remaining Useful Life (RUL) of components and systems, i.e., the time left during which the components and the systems will continue to perform their functions. Two practical challenges are limiting the deployment of data-driven PHM methods in the field: a) the data used to develop the model (source domain) are collected from run-to-failure experiments performed in labs, whereas the data which the model is applied to (target domain) are acquired during in-field operation; b) the data of the source and target domains are collected from different systems of the same fleet. In both cases, there is a discrepancy between the distributions of the data of the source and target domains, due to the different operating and environmental conditions in which they are collected. Then, traditional data-driven methods, which require that training and test data originate from the same distribution, cannot be successfully applied. In this context, the objective of the PhD research presented in this thesis is to develop data-driven models for PHM in a way to overcome these practical difficulties. To this aim, methods based on Transfer Learning (TL) and Domain Adaptation (DA) are developed for transferring knowledge and information across different (source and target) data domains, mitigating the effects of domain discrepancies on the accuracy of the models. Furthermore, in practical applications there are other characteristics of the data, which need to be considered: indeed, data are typically 1) multi-dimensional raw time series of sensor measurements; 2) unlabeled, since the ground-truth degradation state is typically unknown; 3) imbalanced, since failures are rare. To deal with issues 1), 2) and 3) above, in this PhD thesis TL and DA methods are combined with deep learning methods, such as Auto-Encoders (AE), Convolutional Neural Networks (CNN), Long-Short Term Memory (LSTM) neural networks, and adversarial learning techniques. The proposed methods have been successfully verified considering data collected from various PHM international benchmarks, such as the Aramis Data Challenge, the CWRU and IMS bearing datasets, and the MIT-Stanford battery repository. Finally, the methods have been applied to real industrial data collected from locomotive and railway systems. The obtained results show the superior performance of the proposed methods with respect to state-of-the-art methods.
DOSSENA, VINCENZO
DI MAIO, FRANCESCO
BARALDI, PIERO
25-mag-2023
Prognostics and Health Management (PHM) mira ad analizzare dati e informazioni passate, presenti (registrati) e future (previsti) sulle condizioni di componenti e sistemi al fine di rilevare anomalie funzionali e di processo, diagnosticare stati degradati e difettosi, e predire la Remaining Useful Life (RUL) dei componenti e dei sistemi, ovvero il tempo rimanente durante il quale i componenti e i sistemi continueranno a svolgere le proprie funzioni. Due sfide pratiche limitano l'implementazione dei metodi PHM basati sui dati sul campo: a) i dati utilizzati per sviluppare il modello (dominio di origine) sono raccolti da esperimenti di esecuzione fino al guasto effettuati in laboratorio, mentre i dati a cui il modello viene applicato (dominio di destinazione) sono acquisiti durante l'operazione sul campo; b) i dati dei domini di origine e destinazione sono raccolti da sistemi diversi della stessa flotta. In entrambi i casi, vi è una discrepanza tra le distribuzioni dei dati dei domini di origine e destinazione, a causa delle diverse condizioni operative ed ambientali in cui vengono raccolti. Di conseguenza, i metodi tradizionali basati sui dati, che richiedono che i dati di addestramento e test provengano dalla stessa distribuzione, non possono essere applicati con successo. In questo contesto, l'obiettivo della ricerca di dottorato presentata in questa tesi è quello di sviluppare modelli basati sui dati per PHM in modo da superare queste difficoltà pratiche. A tal fine, sono stati sviluppati metodi basati su Transfer Learning (TL) e Domain Adaptation (DA) per il trasferimento di conoscenze e informazioni tra diversi domini di dati (dominio di origine e destinazione), mitigando gli effetti delle discrepanze di dominio sull'accuratezza dei modelli. Inoltre, nelle applicazioni pratiche ci sono altre caratteristiche dei dati che devono essere prese in considerazione: infatti, i dati sono tipicamente 1) serie temporali grezze multidimensionali di misurazioni dei sensori; 2) non etichettati, poiché lo stato di degrado reale di solito è sconosciuto; 3) sbilanciati, poiché i guasti sono rari. Per affrontare le questioni 1), 2) e 3) sopra menzionate, in questa tesi di dottorato i metodi di TL e DA vengono combinati con metodi di deep learning, come reti neurali Auto-Encoders (AE), Convolutional Neural Network (CNN), Long Short-Term Memory (LSTM) e tecniche di apprendimento avversariale. I metodi proposti sono stati verificati con successo utilizzando dati raccolti da vari benchmark internazionali di PHM, come i dataset di cuscinetti Aramis Data Challenge, CWRU e IMS e il repository di batterie MIT-Stanford. Infine, i metodi sono stati applicati a dati industriali reali provenienti da sistemi ferroviari e locomotive. I risultati ottenuti mostrano le prestazioni superiori dei metodi proposti rispetto ai metodi di ultima generazione.
File allegati
File Dimensione Formato  
PhD Thesis-Bingsen Wang-final.pdf

accessibile in internet solo dagli utenti autorizzati

Dimensione 14.92 MB
Formato Adobe PDF
14.92 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/204592