Supercontinuum generation creates broadband spectra from the propagation of short light pulses emitted by a laser pump into optical fibres. The characteristics of the pulses determine the profile of the generated spectrum. Therefore, scientists can choose the parameters to control the laser light pulses. However, determining the parameters of desired spectrum profiles is complicated, due to the nonlinearity of the process. It is also possible to simulate this process by forwarding the parameters to computationally-intensive numerical solvers. Therefore, machine learning models can leverage simulated samples to learn the inverse process. However, the training procedures can not invoke the costly simulation. We propose two neural networks, fully-connected and convolutional, to estimate the parameters that generate spectra as close as possible to desired ones. We train the models via our proposed weighted loss function. The weighted loss function approximates the ideal loss over the spectra space. The method is generic and potentially transferable to other inverse problems that necessitate computational-expensive simulations. We show that the loss function improves the quality of the predictions, and it can help achieve spectra closer to the desired ones. We discuss issues in adopting the proposed solution to arbitrary spectra, i.e. not produced by the supercontinuum process.

La generazione supercontinua crea spettri a banda larga dalla propagazione di brevi impulsi di luce emessi dai laser in fibre ottiche. Le caratteristiche degli impulsi determinano la forma dello spettro generato. Di conseguenza, gli scienzati possono scegliere i parametri per modificare gli impulsi di luce del laser. Tuttavia, trovare i parametri dello spettro desiderato è complicato, data la nonlinearità del processo. Comunque, è possibile simulare questo processo fornendo i parametri a risolutori numerici dall’alto costo computazionale. Quindi, modelli di apprendimento automatico possono imparare il processo inverso dai dati simulati. Ciononostante, il processo di allenamento non potrebbe mai invocare le costose simulazioni al suo interno. Proponiamo due reti neurali, interconnesse e convoluzionali, per stimare i parametri che generano spettri il più vicini ai desiderati. Alleniamo entrambi i modelli con una nuova funzione di costo pesata che proponiamo. La funzione di costo approssima quella ideale definita sullo spazio degli spettri. Il nostro metodo è generale e potenzialmente trasferibile ad altri problemi inversi, i quali simulatori sono computazionalmente costosi. Nella tesi, mostriamo che la nostra funzione di costo migliora la qualità delle predizioni. Inoltre, può aiutare a generare spettri che siano ancora più vicini ai desiderati. Discutiamo anche di problemi nell’applicare la soluzione a spettri arbitrari, cioè non prodotti dalla generazione supercontinua.

Deep learning methods for inverse supercontinuum generation

Corsini, Andrea
2020/2021

Abstract

Supercontinuum generation creates broadband spectra from the propagation of short light pulses emitted by a laser pump into optical fibres. The characteristics of the pulses determine the profile of the generated spectrum. Therefore, scientists can choose the parameters to control the laser light pulses. However, determining the parameters of desired spectrum profiles is complicated, due to the nonlinearity of the process. It is also possible to simulate this process by forwarding the parameters to computationally-intensive numerical solvers. Therefore, machine learning models can leverage simulated samples to learn the inverse process. However, the training procedures can not invoke the costly simulation. We propose two neural networks, fully-connected and convolutional, to estimate the parameters that generate spectra as close as possible to desired ones. We train the models via our proposed weighted loss function. The weighted loss function approximates the ideal loss over the spectra space. The method is generic and potentially transferable to other inverse problems that necessitate computational-expensive simulations. We show that the loss function improves the quality of the predictions, and it can help achieve spectra closer to the desired ones. We discuss issues in adopting the proposed solution to arbitrary spectra, i.e. not produced by the supercontinuum process.
FOI, ALESSANDRO
STUCCHI, DIEGO
ING - Scuola di Ingegneria Industriale e dell'Informazione
21-dic-2021
2020/2021
La generazione supercontinua crea spettri a banda larga dalla propagazione di brevi impulsi di luce emessi dai laser in fibre ottiche. Le caratteristiche degli impulsi determinano la forma dello spettro generato. Di conseguenza, gli scienzati possono scegliere i parametri per modificare gli impulsi di luce del laser. Tuttavia, trovare i parametri dello spettro desiderato è complicato, data la nonlinearità del processo. Comunque, è possibile simulare questo processo fornendo i parametri a risolutori numerici dall’alto costo computazionale. Quindi, modelli di apprendimento automatico possono imparare il processo inverso dai dati simulati. Ciononostante, il processo di allenamento non potrebbe mai invocare le costose simulazioni al suo interno. Proponiamo due reti neurali, interconnesse e convoluzionali, per stimare i parametri che generano spettri il più vicini ai desiderati. Alleniamo entrambi i modelli con una nuova funzione di costo pesata che proponiamo. La funzione di costo approssima quella ideale definita sullo spazio degli spettri. Il nostro metodo è generale e potenzialmente trasferibile ad altri problemi inversi, i quali simulatori sono computazionalmente costosi. Nella tesi, mostriamo che la nostra funzione di costo migliora la qualità delle predizioni. Inoltre, può aiutare a generare spettri che siano ancora più vicini ai desiderati. Discutiamo anche di problemi nell’applicare la soluzione a spettri arbitrari, cioè non prodotti dalla generazione supercontinua.
File allegati
File Dimensione Formato  
2021_12_Corsini.pdf

accessibile in internet per tutti

Descrizione: Executive summary and thesis
Dimensione 16.78 MB
Formato Adobe PDF
16.78 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/183786