The chemical and pharmaceutical industries are in continuous evolution, driven by changing customer needs, market dynamics, and global shifts. In line with this evolution, Computer-Aided applications have become ubiquitous due to their numerous advantages. Key areas such as molecular synthesis and discovery have greatly benefited from automation. This work focuses on advancing reaction optimization and experimental procedures, laying the groundwork for future technological developments in these and related fields. Particular emphasis is placed on addressing the challenges related to the speed and cost of experimental trials, which are crucial for model creation and predictive analysis but remain complex, time-consuming, and expensive. In this context, Machine Learning (ML) techniques have been successfully applied. This work proposes a novel experimental procedure for optimizing reactive systems, based on a technique developed by the Jensen Research Group. This technique is demonstrated through a proof of concept that involves creating a kinetic model of a studied reactive system, simulating experimentally observed data, and detailing how the novel experimental procedure works. The novelty of the approach lies in the combination of two key concepts: a shift in the traditional experimental paradigm of synthetic chemistry via dynamic operation of flow reactors, and data processing using ML. The experimental innovation is evident in both the setup and execution of experiments. It is shown that, under specific conditions, a dynamically operated plug flow reactor (PFR) can be treated as a series of batch reactors (BRs), generating significantly more experimental data than manual operations. Furthermore, ML is deployed in data processing, utilizing an algorithm capable of optimizing up to two objective functions typically describing the reactive system. Additionally, ML is used to guide the experimental campaign; the algorithm uses Bayesian optimization to suggest the experimental trajectory to impose, maximizing the information extracted from the operation while intensifying the use of available resources.

L’industria chimicha e farmaceutia sono in continua evoluzione, a causa delle mutevoli esigenze dei clienti, nonchè delle dinamiche di mercato. Perciò, le applicazioni assistite dal computer sono diventate onnipresenti grazie ai numerosi vantaggi che offrono. Settori chiave come “molecular discovery” e “molecular synthesis” ne hanno tratto grandi benefici. Questa tesi si concentra sul miglioramento delle procedure di ottimizzazione delle reazioni tramite esperimenti, gettando le basi per futuri sviluppi tecnologici in questi ed altri campi. Particolare enfasi viene posta sull'affrontare le sfide relative alla velocità e ai costi delle campagne sperimentali, cruciali per creare modelli predittivi, ma che restano complesse, lunghe e costose. In questo contesto, tecniche Machine Learning (ML) sono state applicate profittevolmente. Questo lavoro propone una nuova procedura sperimentale per ottimizzare i sistemi reattivi, basata sul precedente lavoro dello Jensen Research Group. Essa è dimostrata attraverso una “proof of concept” che prevede la creazione di un modello cinetico di un sistema che abbiamo analizzato, la simulazione dei dati osservati e la descrizione del funzionamento della nuova modalità sperimentale. La novità risiede nella combinazione di due concetti: il cambiamento del paradigma sperimentale tradizionale, tramite l'operazione dinamica di reattori a flusso, e l'elaborazione dei dati tramite ML. L'innovazione risiede sia nell'esecuzione degli esperimenti che nel trattamento dei dati. Viene dimostrato che, in determinate condizioni, un reattore tubolare, operato dinamicamente, può essere trattato come una serie di batch, generando quindi molti più dati sperimentali rispetto a quelli che potrebbe raccogliere manualmente un operatore. Quindi, il ML viene impiegato nell'elaborazione dei dati, tramite delle classi Python capaci di ottimizzare fino a due funzioni obiettivo (tipicamente di interesse in sistemi reattivi). Infine, viene utilizzato soprattutto per guidare la campagna sperimentale; l'impiego dell'ottimizzazione Bayesiana permette il suggerimento delle traiettorie sperimentali da imporre, massimizzando le informazioni estratte ed intensificando l'uso delle risorse.

Reactive Systems Modeling through Machine Learning Techniques and High-Throughput Experimental Approaches

Baracaia, Matteo
2023/2024

Abstract

The chemical and pharmaceutical industries are in continuous evolution, driven by changing customer needs, market dynamics, and global shifts. In line with this evolution, Computer-Aided applications have become ubiquitous due to their numerous advantages. Key areas such as molecular synthesis and discovery have greatly benefited from automation. This work focuses on advancing reaction optimization and experimental procedures, laying the groundwork for future technological developments in these and related fields. Particular emphasis is placed on addressing the challenges related to the speed and cost of experimental trials, which are crucial for model creation and predictive analysis but remain complex, time-consuming, and expensive. In this context, Machine Learning (ML) techniques have been successfully applied. This work proposes a novel experimental procedure for optimizing reactive systems, based on a technique developed by the Jensen Research Group. This technique is demonstrated through a proof of concept that involves creating a kinetic model of a studied reactive system, simulating experimentally observed data, and detailing how the novel experimental procedure works. The novelty of the approach lies in the combination of two key concepts: a shift in the traditional experimental paradigm of synthetic chemistry via dynamic operation of flow reactors, and data processing using ML. The experimental innovation is evident in both the setup and execution of experiments. It is shown that, under specific conditions, a dynamically operated plug flow reactor (PFR) can be treated as a series of batch reactors (BRs), generating significantly more experimental data than manual operations. Furthermore, ML is deployed in data processing, utilizing an algorithm capable of optimizing up to two objective functions typically describing the reactive system. Additionally, ML is used to guide the experimental campaign; the algorithm uses Bayesian optimization to suggest the experimental trajectory to impose, maximizing the information extracted from the operation while intensifying the use of available resources.
FLORIT, FEDERICO
JENSEN, KLAVS FLEMING
ING - Scuola di Ingegneria Industriale e dell'Informazione
10-ott-2024
2023/2024
L’industria chimicha e farmaceutia sono in continua evoluzione, a causa delle mutevoli esigenze dei clienti, nonchè delle dinamiche di mercato. Perciò, le applicazioni assistite dal computer sono diventate onnipresenti grazie ai numerosi vantaggi che offrono. Settori chiave come “molecular discovery” e “molecular synthesis” ne hanno tratto grandi benefici. Questa tesi si concentra sul miglioramento delle procedure di ottimizzazione delle reazioni tramite esperimenti, gettando le basi per futuri sviluppi tecnologici in questi ed altri campi. Particolare enfasi viene posta sull'affrontare le sfide relative alla velocità e ai costi delle campagne sperimentali, cruciali per creare modelli predittivi, ma che restano complesse, lunghe e costose. In questo contesto, tecniche Machine Learning (ML) sono state applicate profittevolmente. Questo lavoro propone una nuova procedura sperimentale per ottimizzare i sistemi reattivi, basata sul precedente lavoro dello Jensen Research Group. Essa è dimostrata attraverso una “proof of concept” che prevede la creazione di un modello cinetico di un sistema che abbiamo analizzato, la simulazione dei dati osservati e la descrizione del funzionamento della nuova modalità sperimentale. La novità risiede nella combinazione di due concetti: il cambiamento del paradigma sperimentale tradizionale, tramite l'operazione dinamica di reattori a flusso, e l'elaborazione dei dati tramite ML. L'innovazione risiede sia nell'esecuzione degli esperimenti che nel trattamento dei dati. Viene dimostrato che, in determinate condizioni, un reattore tubolare, operato dinamicamente, può essere trattato come una serie di batch, generando quindi molti più dati sperimentali rispetto a quelli che potrebbe raccogliere manualmente un operatore. Quindi, il ML viene impiegato nell'elaborazione dei dati, tramite delle classi Python capaci di ottimizzare fino a due funzioni obiettivo (tipicamente di interesse in sistemi reattivi). Infine, viene utilizzato soprattutto per guidare la campagna sperimentale; l'impiego dell'ottimizzazione Bayesiana permette il suggerimento delle traiettorie sperimentali da imporre, massimizzando le informazioni estratte ed intensificando l'uso delle risorse.
File allegati
File Dimensione Formato  
2024_10_Baracaia_Tesi.pdf

accessibile in internet per tutti a partire dal 18/09/2025

Descrizione: Tesi Magistrale
Dimensione 2.95 MB
Formato Adobe PDF
2.95 MB Adobe PDF   Visualizza/Apri
2024_10_Baracaia_ES.pdf

accessibile in internet per tutti a partire dal 18/09/2025

Descrizione: Executive Summary
Dimensione 1.07 MB
Formato Adobe PDF
1.07 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/227300