Mathematical models, while essential in many diverse areas of science and engineering, are often highly complex to achieve with traditional techniques. This has motivated the search for a new, data-driven paradigm of mathematical modeling. Model Discovery (MD) is a branch of Data Science focused on the process of automatic identification of mathematical models from observed data. In other words, following a common trend nowadays, MD exploits the vast computational power and data availability to support the process of mathematical modeling. Despite MD significance, the existing techniques in this field are yet not sufficient to meet all the needs of the scientific community, often being impractical, requiring several assumptions to work, or relying on excessively user-dependent procedures. In this work, we introduce Symbolic-SINDy, a novel method that combines Symbolic Regression (SR) and Sparse Identification of Nonlinear Dynamics (SINDy) — two of the main MD approaches. Balancing strengths and limitations of SR and SINDy, Symbolic-SINDy emerges as the right compromise among the existing techniques, featuring a potentially unrestricted range of application, a practical, fast procedure and a substantial independence from human interaction. The effectiveness of the proposed method is first demonstrated on a set of classic benchmark examples in the MD field. Then, Symbolic-SINDy is used to extend MD scope in two challenging contexts: Online Model Discovery and Reduced Order Modeling.
I modelli matematici, pur essendo essenziali in molte aree della scienza e dell’ingegneria, sono spesso estremamente complessi da ottenere con le tecniche tradizionali. Questo è il motivo alla base della ricerca di un nuovo paradigma di modellizzazione matematica basato sui dati. La Model Discovery (MD) è un ramo della Scienza dei Dati focalizzato sul processo di identificazione automatica di modelli matematici a partire dai dati osservati. In altre parole, seguendo una tendenza comune al giorno d’oggi, la MD sfrutta la grande potenza computazionale e disponibilità di dati per supportare il processo di modellizzazione matematica. Nonostante l’importanza della MD, le tecniche esistenti non riescono ancora a soddisfare le esigenze della comunità scientifica, risultando spesso poco pratiche, eccessivamente dipendenti dalle interazioni con l’utente o limitate a campi applicativi ristretti. In questo lavoro introduciamo Symbolic-SINDy, un metodo innovativo che combina la Regressione Simbolica (SR) e l’Identificazione Sparsa di Dinamiche Non Lineari (SINDy) — due dei principali approcci di MD. Bilanciando i punti di forza e le limitazioni di SR e SINDy, Symbolic-SINDy si presenta come il giusto compromesso tra le due tecniche, caratterizzandosi per un potenziale ambito di applicazione illimitato, una procedura pratica e veloce, e una sostanziale indipendenza dall’interazione umana. L’efficacia dell’algoritmo proposto è dimostrata attraverso una serie di esempi classici nel campo della MD, così come in due scenari molto significativi e complessi, nei contesti dell’Apprendimento Online e della Modellizzazione a Ordine Ridotto.
Model Discovery integrating Symbolic Regression into Sparse Identification of Nonlinear Dynamics
ROMANO, GIORGIO
2023/2024
Abstract
Mathematical models, while essential in many diverse areas of science and engineering, are often highly complex to achieve with traditional techniques. This has motivated the search for a new, data-driven paradigm of mathematical modeling. Model Discovery (MD) is a branch of Data Science focused on the process of automatic identification of mathematical models from observed data. In other words, following a common trend nowadays, MD exploits the vast computational power and data availability to support the process of mathematical modeling. Despite MD significance, the existing techniques in this field are yet not sufficient to meet all the needs of the scientific community, often being impractical, requiring several assumptions to work, or relying on excessively user-dependent procedures. In this work, we introduce Symbolic-SINDy, a novel method that combines Symbolic Regression (SR) and Sparse Identification of Nonlinear Dynamics (SINDy) — two of the main MD approaches. Balancing strengths and limitations of SR and SINDy, Symbolic-SINDy emerges as the right compromise among the existing techniques, featuring a potentially unrestricted range of application, a practical, fast procedure and a substantial independence from human interaction. The effectiveness of the proposed method is first demonstrated on a set of classic benchmark examples in the MD field. Then, Symbolic-SINDy is used to extend MD scope in two challenging contexts: Online Model Discovery and Reduced Order Modeling.File | Dimensione | Formato | |
---|---|---|---|
2024_10_Romano_Thesis.pdf
accessibile in internet per tutti
Descrizione: testo della tesi
Dimensione
2.23 MB
Formato
Adobe PDF
|
2.23 MB | Adobe PDF | Visualizza/Apri |
2024_10_Romano_Executive_Summary.pdf
accessibile in internet per tutti
Descrizione: executive summary della tesi
Dimensione
737.34 kB
Formato
Adobe PDF
|
737.34 kB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/227268