In the last years, interest in Machine Learning (ML) has increased exponentially. Together with the improvements in computation, ML applications in different fields have multiplied. Regarding the chemical process industry, surrogate modeling has been the most studied ML application given its capacity to reduce computation times significantly. With the idea of automatizing the surrogate modeling process, Tiresias: a framework for the automatic generation of surrogate models, is presented. The framework gathers Excel, HYSYS, and Python, while working with a black-box approach. It includes tools for the Design of Experiments, dimensionality analysis and reduction, surrogate model training, testing, evaluation, and optimization. The Normalized Root Mean Squared Error is proposed as the evaluation metric in the cross-validation to determine the best overall surrogate model. Tiresias was implemented to obtain the optimum surrogate models of four case studies: a simple initial simulation, the simulation of the amine washing section of a plant property of Itelyum Regeneration SpA, the sensor data from the same plant, and the BigSquid exttrademark process simulation, developed by the Politecnico di Milano. The results obtained from the framework presented a high accuracy. The most overall accurate surrogate models were the second and third-order polynomial regressions, while the best model found for extrapolation was the linear regression. Regardless of the data source, Tiresias accuracy and flexibility were confirmed. Additionally, several improvement opportunities were found, in case a new version of the framework is considered.
Negli ultimi anni, l'interesse per il Machine Learning (ML) è aumentato in modo esponenziale. Insieme ai miglioramenti nel calcolo, si sono moltiplicate le applicazioni ML in diversi campi. Per quanto riguarda l'industria dei processi chimici, la modellazione surrogata è stata l'applicazione ML più studiata data la sua capacità di ridurre significativamente i tempi di calcolo. Con l'idea di automatizzare il processo di modellazione dei surrogati, viene presentato Tiresias: un framework per la generazione automatica di modelli surrogati. Il framework riunisce Excel, HYSYS e Python, mentre lavora con un approccio black-box. Include strumenti per la progettazione di esperimenti, analisi e riduzione della dimensionalità, addestramento di modelli surrogati, test, valutazione e ottimizzazione. L'errore quadratico medio normalizzato viene proposto come metrica di valutazione nella convalida incrociata per determinare il miglior modello surrogato complessivo. Tiresias è stato implementato per ottenere i modelli surrogati ottimali di quattro casi studio: una semplice simulazione iniziale, la simulazione della sezione di lavaggio amminico di un impianto di proprietà di Itelyum Regeneration SpA, i dati dei sensori dello stesso impianto e il processo BigSquid exttrademark simulazione, sviluppata dal Politecnico di Milano. I risultati ottenuti dal framework hanno presentato un'elevata accuratezza. I modelli surrogati complessivamente più accurati sono stati le regressioni polinomiali di secondo e terzo ordine, mentre il miglior modello trovato per l'estrapolazione è stata la regressione lineare. Indipendentemente dalla fonte dei dati, l'accuratezza e la flessibilità di Tiresias sono state confermate. Inoltre, sono state individuate diverse opportunità di miglioramento, nel caso in cui si consideri una nuova versione del framework.
Tiresias: a machine learning automated metamodeling framework of chemical process simulations
Sánchez Martínez, Luis Felipe
2021/2022
Abstract
In the last years, interest in Machine Learning (ML) has increased exponentially. Together with the improvements in computation, ML applications in different fields have multiplied. Regarding the chemical process industry, surrogate modeling has been the most studied ML application given its capacity to reduce computation times significantly. With the idea of automatizing the surrogate modeling process, Tiresias: a framework for the automatic generation of surrogate models, is presented. The framework gathers Excel, HYSYS, and Python, while working with a black-box approach. It includes tools for the Design of Experiments, dimensionality analysis and reduction, surrogate model training, testing, evaluation, and optimization. The Normalized Root Mean Squared Error is proposed as the evaluation metric in the cross-validation to determine the best overall surrogate model. Tiresias was implemented to obtain the optimum surrogate models of four case studies: a simple initial simulation, the simulation of the amine washing section of a plant property of Itelyum Regeneration SpA, the sensor data from the same plant, and the BigSquid exttrademark process simulation, developed by the Politecnico di Milano. The results obtained from the framework presented a high accuracy. The most overall accurate surrogate models were the second and third-order polynomial regressions, while the best model found for extrapolation was the linear regression. Regardless of the data source, Tiresias accuracy and flexibility were confirmed. Additionally, several improvement opportunities were found, in case a new version of the framework is considered.File | Dimensione | Formato | |
---|---|---|---|
Tiresias_Executive_Summary.pdf
accessibile in internet per tutti
Descrizione: Tiresias Executive Summary
Dimensione
1.18 MB
Formato
Adobe PDF
|
1.18 MB | Adobe PDF | Visualizza/Apri |
Tiresias.pdf
accessibile in internet solo dagli utenti autorizzati
Descrizione: Tiresias Thesis
Dimensione
12.04 MB
Formato
Adobe PDF
|
12.04 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/198477