Chemical production plays an essential role in industrial production, and its products involve all aspects of people's lives. With the rapid development of science and technology, especially computer technology, the scale of chemical process production equipment is getting larger and larger, the process is more and more complex, the investment is getting bigger and the automation level is getting higher and higher, so the safety of the chemical process and reliability are especially important. It is an effective and important method to improve the safety and reliability of the chemical process by using fault detection technologies. It has an extremely important practical value for fault detection of chemical processes. The issue in this thesis we trying to solve is finding a new reliable Machine Learning algorithm for anomaly/fault detection in the chemical process. For the most widely used algorithm, PCA (Principal Component Analysis) has been used in actual chemical plants for several years. But it has some disadvantages like after reduction of dimensions, it may lose some important features of the data, also, the time consumption is rather high when dealing with huge datasets. iForest (Isolation Forest) is a new unsupervised Machine Learning algorithm that has been used in some fields like fraud detection in bank system and attack detection on website and services etc. The approach we adopt to solve the issue is using both PCA and iForest on Tennessee Eastman Process as the study case for testing the performances of those two algorithms to check if iForest is good enough for fault detection compared with PCA in the chemical process. And trying to find what are the advantages and disadvantages of using those algorithms. The results we obtained in this research include that by using the Isolation Forest for fault detection on the Tennessee Eastman process, the reliability was increased and the computational time decreased a lot compared with the time consumption of using PCA. It indicates that iForest is suitable for fault detection of chemical processes. The impacts of our obtained results are that PCA could not be used in some situations for fault detection but using iForest can cover the shortage. Also, it demonstrated that Isolation Forest has a huge potential for fault detection on the actual chemical processes and plants

La produzione chimica ha un ruolo fondamentale nella produzione industriale, e i suoi prodotti riguardano tutti gli aspetti della vita delle persone.Con il rapido sviluppo della scienza e della tecnologia, soprattutto della tecnologia informatica, la dimensione dell’attrezzatura di processo di produzione chimica sta diventando sempre più grande,il processo più complicato, gli investimenti più corposi e il livello di automazione più avanzato,così la sicurezza del processo chimico e l’affidabilità sono estremamente importanti. Un effettivo e importante metodo per migliorare la sicurezza e l’affidabilità del processo è usando le tecnologie di individuazione degli errori. Il problema che stiamo cercando di risolvere in questa tesi è quello di trovare un algoritmo di machine learning affidabile per la rilevazione di anomalie/errori nel processo chimico. Tra gli algoritmi più diffusi, PCA è stato negli impianti chimici per alcuni anni. Ma alcuni svantaggi, come il fatto che riducendo le dimensioni si possono perdere alcuni dettagli dei dati o che il tempo impiegato è piuttosto elevato lavorando con set di dati enormi.iForest (Isolation Forest) è un nuovo algoritmo non testato, che è stato utilizzato in alcuni campi quali l’individuazione di frodi nel sistema bancario e la rilevazione di attacchi a siti web e servizi etc.. . L’approccio che abbiamo utilizzato per risolvere il problema è stato quello di utilizzare entrambi gli algoritmi PCA & iForest sul processo Tennessee Eastman come caso di studio per testare le prestazioni di entrambi gli algoritmi, e validare che iForest è abbastanza affidabile per l’individuazione degli errori rispetto a PCA. Provando a trovare quali sono gli svantaggi e vantaggi di utilizzare questi due algoritmi. I risultati ottenuti in questa tesi mostrano che utilizzando iForest per la rilevazione di errori sul processo Tennessee Eastman, l’affidabilità è aumentata e il costo computazionale è diminuito di molto rispetto a quello di PCA. Indicando che iForest è ottimale nella rilevazione di errori di processi chimici. L’ impatto dei risultati ottenuti è che PCA potrebbe non essere utilizzato in alcune situazioni per la rilevazione di errori, ma usando iForest possiamo colmare questa lacuna. È stato anche dimostrato che iForest ha un enorme potenzialità per la rilevazione di errori su processi chimici e impianti reali.

Machine learning techniques for fault detection in chemical processes. The Tennessee Eastman Process case study

XU, SHENG
2018/2019

Abstract

Chemical production plays an essential role in industrial production, and its products involve all aspects of people's lives. With the rapid development of science and technology, especially computer technology, the scale of chemical process production equipment is getting larger and larger, the process is more and more complex, the investment is getting bigger and the automation level is getting higher and higher, so the safety of the chemical process and reliability are especially important. It is an effective and important method to improve the safety and reliability of the chemical process by using fault detection technologies. It has an extremely important practical value for fault detection of chemical processes. The issue in this thesis we trying to solve is finding a new reliable Machine Learning algorithm for anomaly/fault detection in the chemical process. For the most widely used algorithm, PCA (Principal Component Analysis) has been used in actual chemical plants for several years. But it has some disadvantages like after reduction of dimensions, it may lose some important features of the data, also, the time consumption is rather high when dealing with huge datasets. iForest (Isolation Forest) is a new unsupervised Machine Learning algorithm that has been used in some fields like fraud detection in bank system and attack detection on website and services etc. The approach we adopt to solve the issue is using both PCA and iForest on Tennessee Eastman Process as the study case for testing the performances of those two algorithms to check if iForest is good enough for fault detection compared with PCA in the chemical process. And trying to find what are the advantages and disadvantages of using those algorithms. The results we obtained in this research include that by using the Isolation Forest for fault detection on the Tennessee Eastman process, the reliability was increased and the computational time decreased a lot compared with the time consumption of using PCA. It indicates that iForest is suitable for fault detection of chemical processes. The impacts of our obtained results are that PCA could not be used in some situations for fault detection but using iForest can cover the shortage. Also, it demonstrated that Isolation Forest has a huge potential for fault detection on the actual chemical processes and plants
ING - Scuola di Ingegneria Industriale e dell'Informazione
18-dic-2019
2018/2019
La produzione chimica ha un ruolo fondamentale nella produzione industriale, e i suoi prodotti riguardano tutti gli aspetti della vita delle persone.Con il rapido sviluppo della scienza e della tecnologia, soprattutto della tecnologia informatica, la dimensione dell’attrezzatura di processo di produzione chimica sta diventando sempre più grande,il processo più complicato, gli investimenti più corposi e il livello di automazione più avanzato,così la sicurezza del processo chimico e l’affidabilità sono estremamente importanti. Un effettivo e importante metodo per migliorare la sicurezza e l’affidabilità del processo è usando le tecnologie di individuazione degli errori. Il problema che stiamo cercando di risolvere in questa tesi è quello di trovare un algoritmo di machine learning affidabile per la rilevazione di anomalie/errori nel processo chimico. Tra gli algoritmi più diffusi, PCA è stato negli impianti chimici per alcuni anni. Ma alcuni svantaggi, come il fatto che riducendo le dimensioni si possono perdere alcuni dettagli dei dati o che il tempo impiegato è piuttosto elevato lavorando con set di dati enormi.iForest (Isolation Forest) è un nuovo algoritmo non testato, che è stato utilizzato in alcuni campi quali l’individuazione di frodi nel sistema bancario e la rilevazione di attacchi a siti web e servizi etc.. . L’approccio che abbiamo utilizzato per risolvere il problema è stato quello di utilizzare entrambi gli algoritmi PCA & iForest sul processo Tennessee Eastman come caso di studio per testare le prestazioni di entrambi gli algoritmi, e validare che iForest è abbastanza affidabile per l’individuazione degli errori rispetto a PCA. Provando a trovare quali sono gli svantaggi e vantaggi di utilizzare questi due algoritmi. I risultati ottenuti in questa tesi mostrano che utilizzando iForest per la rilevazione di errori sul processo Tennessee Eastman, l’affidabilità è aumentata e il costo computazionale è diminuito di molto rispetto a quello di PCA. Indicando che iForest è ottimale nella rilevazione di errori di processi chimici. L’ impatto dei risultati ottenuti è che PCA potrebbe non essere utilizzato in alcune situazioni per la rilevazione di errori, ma usando iForest possiamo colmare questa lacuna. È stato anche dimostrato che iForest ha un enorme potenzialità per la rilevazione di errori su processi chimici e impianti reali.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Machine Learning Techniques for Fault Detection in Chemical Processes.pdf

accessibile in internet per tutti

Descrizione: Thesis
Dimensione 2.73 MB
Formato Adobe PDF
2.73 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/151257