Recently there has been an increasing interest in the adoption of data analysis techniques to support research in scientific disciplines. In particular, scientific research is undergoing a transition from a purely theoretical approach to a data-driven approach. In this context, SciExpeM stands as a framework that includes a repository of scientific experiments and features a micro-services architecture that provides functionalities related to the development and analysis of simulation models. Simulation models are generally used because cost, time, or other constraints prohibit experimentation with real systems. Due to the stochastic and complex nature of most real-world systems, simulation models are themselves difficult to build and time consuming to construct and can take a long time to execute due to excessive computational demand. One feasible alternative is to build simpler approximations of these simulators as “models of the model”, usually called metamodels or surrogate models, which are deterministic approximating functions of the real process that are inexpensive to compute. In particular, the scientific challenge of surrogate modelling is the development of a surrogate that is as accurate as possible, using as few simulation evaluations as possible. Starting from these assumptions, in this thesis the main obstacles to the creation of a data-driven predictive model, built exclusively on the basis of experimental data, are addressed and, alternatively, the application of machine learning techniques aimed at creating a surrogate model of the original simulation model is illustrated. In addition, the advantages that this surrogate model can bring are illustrated, and an analysis is conducted aimed at identifying and deepening the key issues of its realization. Next, the optimization of the surrogate model creation process is addressed, illustrating the validity of the main adaptive sampling techniques used to obtain the surrogate effectively and efficiently. Finally, an innovative adaptive sampling algorithm is also illustrated, proposed as an original contribution of this thesis.

Recentemente c'è stato un crescente interesse per l'adozione di tecniche di analisi dei dati a supporto della ricerca nelle discipline scientifiche. In particolare, la ricerca scientifica sta subendo una transizione da un approccio puramente teorico a un approccio basato sui dati. In questo contesto, SciExpeM si pone come un framework che include un repository di esperimenti scientifici e presenta un'architettura di micro-servizi che fornisce funzionalità relative allo sviluppo e all'analisi di modelli di simulazione. I modelli di simulazione vengono generalmente utilizzati perché costi, tempi o altri vincoli vietano la sperimentazione con i sistemi reali. A causa della natura stocastica e complessa della maggior parte dei sistemi reali, i modelli di simulazione sono di per sé difficili da costruire e possono richiedere molto tempo per essere eseguiti per via dell'eccessiva richiesta computazionale. Un'alternativa consiste nel costruire approssimazioni più semplici di questi simulatori come "modelli del modello", solitamente chiamati metamodelli o modelli surrogati, che sono funzioni di approssimazione deterministiche del processo reale poco costose da eseguire. In particolare, la sfida scientifica della creazione dei modelli surrogati è lo sviluppo di un surrogato il più accurato possibile, utilizzando il minor numero possibile di valutazioni del simulatore. Partendo da questi presupposti, in questa tesi vengono affrontati i principali ostacoli alla creazione di un modello predittivo data-driven costruito esclusivamente sulla base di dati sperimentali e, in alternativa, viene illustrata l'applicazione di tecniche di machine learning finalizzate alla creazione di un modello surrogato del modello di simulazione originale. Inoltre, vengono illustrati i vantaggi che questo modello surrogato può apportare, e viene condotta una analisi volta a identificare ed approfondire le questioni chiave della sua realizzazione. Successivamente viene affrontata l'ottimizzazione del processo di creazione del modello surrogato, illustrando la validità delle principali tecniche di campionamento adattativo utilizzate per ottenere il surrogato in modo efficace ed efficiente. Infine, viene illustrato anche un innovativo algoritmo di campionamento adattativo, proposto come contributo originale di questa tesi.

Adaptive sampling for the optimization of surrogate models

Dilettis, Marco
2021/2022

Abstract

Recently there has been an increasing interest in the adoption of data analysis techniques to support research in scientific disciplines. In particular, scientific research is undergoing a transition from a purely theoretical approach to a data-driven approach. In this context, SciExpeM stands as a framework that includes a repository of scientific experiments and features a micro-services architecture that provides functionalities related to the development and analysis of simulation models. Simulation models are generally used because cost, time, or other constraints prohibit experimentation with real systems. Due to the stochastic and complex nature of most real-world systems, simulation models are themselves difficult to build and time consuming to construct and can take a long time to execute due to excessive computational demand. One feasible alternative is to build simpler approximations of these simulators as “models of the model”, usually called metamodels or surrogate models, which are deterministic approximating functions of the real process that are inexpensive to compute. In particular, the scientific challenge of surrogate modelling is the development of a surrogate that is as accurate as possible, using as few simulation evaluations as possible. Starting from these assumptions, in this thesis the main obstacles to the creation of a data-driven predictive model, built exclusively on the basis of experimental data, are addressed and, alternatively, the application of machine learning techniques aimed at creating a surrogate model of the original simulation model is illustrated. In addition, the advantages that this surrogate model can bring are illustrated, and an analysis is conducted aimed at identifying and deepening the key issues of its realization. Next, the optimization of the surrogate model creation process is addressed, illustrating the validity of the main adaptive sampling techniques used to obtain the surrogate effectively and efficiently. Finally, an innovative adaptive sampling algorithm is also illustrated, proposed as an original contribution of this thesis.
RAMALLI, EDOARDO
ING - Scuola di Ingegneria Industriale e dell'Informazione
6-ott-2022
2021/2022
Recentemente c'è stato un crescente interesse per l'adozione di tecniche di analisi dei dati a supporto della ricerca nelle discipline scientifiche. In particolare, la ricerca scientifica sta subendo una transizione da un approccio puramente teorico a un approccio basato sui dati. In questo contesto, SciExpeM si pone come un framework che include un repository di esperimenti scientifici e presenta un'architettura di micro-servizi che fornisce funzionalità relative allo sviluppo e all'analisi di modelli di simulazione. I modelli di simulazione vengono generalmente utilizzati perché costi, tempi o altri vincoli vietano la sperimentazione con i sistemi reali. A causa della natura stocastica e complessa della maggior parte dei sistemi reali, i modelli di simulazione sono di per sé difficili da costruire e possono richiedere molto tempo per essere eseguiti per via dell'eccessiva richiesta computazionale. Un'alternativa consiste nel costruire approssimazioni più semplici di questi simulatori come "modelli del modello", solitamente chiamati metamodelli o modelli surrogati, che sono funzioni di approssimazione deterministiche del processo reale poco costose da eseguire. In particolare, la sfida scientifica della creazione dei modelli surrogati è lo sviluppo di un surrogato il più accurato possibile, utilizzando il minor numero possibile di valutazioni del simulatore. Partendo da questi presupposti, in questa tesi vengono affrontati i principali ostacoli alla creazione di un modello predittivo data-driven costruito esclusivamente sulla base di dati sperimentali e, in alternativa, viene illustrata l'applicazione di tecniche di machine learning finalizzate alla creazione di un modello surrogato del modello di simulazione originale. Inoltre, vengono illustrati i vantaggi che questo modello surrogato può apportare, e viene condotta una analisi volta a identificare ed approfondire le questioni chiave della sua realizzazione. Successivamente viene affrontata l'ottimizzazione del processo di creazione del modello surrogato, illustrando la validità delle principali tecniche di campionamento adattativo utilizzate per ottenere il surrogato in modo efficace ed efficiente. Infine, viene illustrato anche un innovativo algoritmo di campionamento adattativo, proposto come contributo originale di questa tesi.
File allegati
File Dimensione Formato  
2022_10_Dilettis_01.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Thesis
Dimensione 42.47 MB
Formato Adobe PDF
42.47 MB Adobe PDF   Visualizza/Apri
2022_10_Dilettis_02.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Executive Summary
Dimensione 887.37 kB
Formato Adobe PDF
887.37 kB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/195559