This work presents the estimation methodology of data-driven models for the gas-abatement process in a waste-to-energy plant. The proposed model construction involves a systematic review of previous phenomenological steady-state and dynamic data-driven models estimated for the same process. The input variables of the data-driven model are the inlet concentration of hydrogen chloride and the delivery rate of sodium bicarbonate and the output variable is the outlet concentration of hydrogen chloride, thus constituting a MISO system in which sodium bicarbonate acts as a sorbent and neutralizes the acid. The available data is preprocessed following heuristics that allow the discarding of non-optimal data for system identification. The design variables of ARX, ARMAX, and Nonlinear ARX models are discussed, and different models are evaluated to test the performance of each model structure. The evaluation includes applying techniques such as residual analysis, cross-validation method, and metrics useful in system identification. In the end, nonlinear ARX models are the structure with the best performance at predicting values from new datasets while simultaneously avoiding overfitting the training dataset. Some models achieve fit to estimation data higher than 80%, and their structure might be extensible to continue the work towards constructing a digital twin of the plant. An equilibrium between model complexity and overfitting is achieved for nonlinear ARX models with parameters na=[3] nb=[4 3] and nc=[1 1].

Questo lavoro presenta la stima di modelli data-driven per il processo di abbattimento dei gas negli impianti di termovalorizzazione. La costruzione del modello proposto prevede una revisione sistematica dei precedenti modelli fenomenologici allo stato stazionario e quelli dinamici basati sui dati per lo stesso processo. Le variabili di input del modello data-driven sono la concentrazione di cloruro di idrogeno in ingresso e la portata di bicarbonato di sodio, che agisce come sorbente e neutralizza l’acido. La variabile di uscita del modello è la concentrazione finale di cloruro di idrogeno. I dati disponibili vengono preprocessati seguendo un’euristica che consente di scartare i dati non ottimali per l’identificazione del sistema. Vengono discusse le variabili di impostazione dei modelli ARX, ARMAX e ARX non lineare e vengono valutati diversi modelli per verificare le prestazioni di ciascuna struttura di modello. La valutazione comprende l’applicazione di tecniche quali l’analisi dei residui, il metodo della convalida incrociata e le metriche utili per l’identificazione dei sistemi. Alla fine, i modelli ARX non lineari sono la struttura con le migliori prestazioni nel prevedere i valori di nuovi set di dati, evitando al contempo l’overfitting del set di dati di addestramento. Alcuni modelli raggiungono un adattamento ai dati di stima superiore all’80% e la loro struttura potrebbe essere estensibile per continuare il lavoro di costruzione di un gemello digitale dell’impianto. Si raggiunge un equilibrio tra complessità del modello e overfitting per modelli ARX non lineari con parametri na=[3] nb=[4 3] e nc=[1 1].

Data-driven model comparison for the acid gas abatement process in a waste-to-energy plant

Leon Baez, Miguel Andres
2022/2023

Abstract

This work presents the estimation methodology of data-driven models for the gas-abatement process in a waste-to-energy plant. The proposed model construction involves a systematic review of previous phenomenological steady-state and dynamic data-driven models estimated for the same process. The input variables of the data-driven model are the inlet concentration of hydrogen chloride and the delivery rate of sodium bicarbonate and the output variable is the outlet concentration of hydrogen chloride, thus constituting a MISO system in which sodium bicarbonate acts as a sorbent and neutralizes the acid. The available data is preprocessed following heuristics that allow the discarding of non-optimal data for system identification. The design variables of ARX, ARMAX, and Nonlinear ARX models are discussed, and different models are evaluated to test the performance of each model structure. The evaluation includes applying techniques such as residual analysis, cross-validation method, and metrics useful in system identification. In the end, nonlinear ARX models are the structure with the best performance at predicting values from new datasets while simultaneously avoiding overfitting the training dataset. Some models achieve fit to estimation data higher than 80%, and their structure might be extensible to continue the work towards constructing a digital twin of the plant. An equilibrium between model complexity and overfitting is achieved for nonlinear ARX models with parameters na=[3] nb=[4 3] and nc=[1 1].
Senem, Ozgen Mueyyet
ING - Scuola di Ingegneria Industriale e dell'Informazione
4-mag-2023
2022/2023
Questo lavoro presenta la stima di modelli data-driven per il processo di abbattimento dei gas negli impianti di termovalorizzazione. La costruzione del modello proposto prevede una revisione sistematica dei precedenti modelli fenomenologici allo stato stazionario e quelli dinamici basati sui dati per lo stesso processo. Le variabili di input del modello data-driven sono la concentrazione di cloruro di idrogeno in ingresso e la portata di bicarbonato di sodio, che agisce come sorbente e neutralizza l’acido. La variabile di uscita del modello è la concentrazione finale di cloruro di idrogeno. I dati disponibili vengono preprocessati seguendo un’euristica che consente di scartare i dati non ottimali per l’identificazione del sistema. Vengono discusse le variabili di impostazione dei modelli ARX, ARMAX e ARX non lineare e vengono valutati diversi modelli per verificare le prestazioni di ciascuna struttura di modello. La valutazione comprende l’applicazione di tecniche quali l’analisi dei residui, il metodo della convalida incrociata e le metriche utili per l’identificazione dei sistemi. Alla fine, i modelli ARX non lineari sono la struttura con le migliori prestazioni nel prevedere i valori di nuovi set di dati, evitando al contempo l’overfitting del set di dati di addestramento. Alcuni modelli raggiungono un adattamento ai dati di stima superiore all’80% e la loro struttura potrebbe essere estensibile per continuare il lavoro di costruzione di un gemello digitale dell’impianto. Si raggiunge un equilibrio tra complessità del modello e overfitting per modelli ARX non lineari con parametri na=[3] nb=[4 3] e nc=[1 1].
File allegati
File Dimensione Formato  
Thesis_Miguel_Andres_Leon__Automation_and_Control_Engineering.pdf

accessibile in internet solo dagli utenti autorizzati

Dimensione 2.32 MB
Formato Adobe PDF
2.32 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/210749