Programmable optical processors offer a rapid and efficient means of implementing linear algebra operations, such as matrix-vector multiplication, directly in the optical analog domain. They find applications in analog computing, hardware accelerators, and machine learning. These processors are often constructed using networks, or meshes, of Mach- Zehnder interferometers (MZI) that can be reconfigured by adjusting the values of phase shifters within each interferometer. While these architectures can realize arbitrary transformations between input and output, configuring them is a complex task, particularly when dealing with fabrication tolerances leading to unknown biases in MZI phases and when employing thermal phase shifters prone to mutual thermal cross-talk. These challenges currently hinder the scalability of these architectures to large port counts, despite various proposed techniques for implementing control and calibration procedures. This study introduces a calibration technique based on an artificial neural network (ANN) to configure a MZI-based programmable optical processor. The proposed ANN model aims to estimate the values of the programmable actuators that determine the desired input-output relationship, controlling the Mach-Zehnder interferometer mesh implementing arbitrary beam splitting. The approach is applicable to MZI meshes of arbitrary topologies, even in the presence of non-idealities and thermal cross-talk. Demonstrations were conducted by numerical simulations on mesh configurations with up to 5×5 ports, showcasing a predicted fidelity to the desired input-output relationships of 0.9 with a probability exceeding 99%. The training dataset is designed to align with the tuning speed of conventional phase shifters, facilitating the acquisition of training data within a few seconds.
I processori ottici programmabili si offrono come soluzioni rapide ed efficienti per l’implementazione di acceleratori hardware analogici che possano risolvere operazioni algebriche come la moltiplicazione matriciale. Circuiti così realizzati possono essere impiegati per la creazione di chip photonici in computer analogici e acceleratori hardware specifici per l’appredimento automatizzato di intelligenze artificiali. I processori ottici sfruttano maglie di Mach-Zehnder, interferometri riconfigurabili tramite l’impostazione dello sfasamento imposto, per implementare una qualsiasi relazione unitaria tra ingresso e uscita. Ciononostante, la loro calibrazione è un processo complicato dalla presenza di errori di fabbricazione che possono causare sfasamenti indesiderati negli interferometri e dal cross-talk dovuto all’uso di attuatori termici. Nonostante numerosi sistemi di compensazione siano stati ideati per creare procedure di regolazione affidabili, le difficoltà nel controllo degli attuatori impediscono la scalabilità dei circuiti a numeri elevati di ingressi e di uscite. Questa tesi propone una procedura di calibrazione basata su un modello di rete neurale artificiale per la configurazione di processori ottici di interferometri Mach-Zehnder. La rete neurale si offre di controllare divisori fotonici costituiti da maglie di interferometri Mach-Zehnder, la cui trasmissione dei segnali in ingresso verso le uscite desiderate avviene tramite l’impostazione del valore stimato degli attuatori negli interferometri. L’approccio descritto può essere applicato a una qualsiasi disposizione degli interferometri, anche in preseneza di non idealità come il cross-talk termico. I risultati prodotti da simulatori numerici dimostrano una probabilità di realizzazione di trasformazioni tra ingresso e uscita che hanno una probabilità superiore al 99% di ottenere fedeltà di 0.9 o migliore, anche su mesh aventi 5×5 porte. Il dataset di addestramento delle reti neurali è dimensionato per poter essere acquisito in tempi ragionevoli, compatibili con il tempo di transizione degli sfasatori termici.
Control of programmable optical processors by using a neural network model
Sances, Francesco Maria
2022/2023
Abstract
Programmable optical processors offer a rapid and efficient means of implementing linear algebra operations, such as matrix-vector multiplication, directly in the optical analog domain. They find applications in analog computing, hardware accelerators, and machine learning. These processors are often constructed using networks, or meshes, of Mach- Zehnder interferometers (MZI) that can be reconfigured by adjusting the values of phase shifters within each interferometer. While these architectures can realize arbitrary transformations between input and output, configuring them is a complex task, particularly when dealing with fabrication tolerances leading to unknown biases in MZI phases and when employing thermal phase shifters prone to mutual thermal cross-talk. These challenges currently hinder the scalability of these architectures to large port counts, despite various proposed techniques for implementing control and calibration procedures. This study introduces a calibration technique based on an artificial neural network (ANN) to configure a MZI-based programmable optical processor. The proposed ANN model aims to estimate the values of the programmable actuators that determine the desired input-output relationship, controlling the Mach-Zehnder interferometer mesh implementing arbitrary beam splitting. The approach is applicable to MZI meshes of arbitrary topologies, even in the presence of non-idealities and thermal cross-talk. Demonstrations were conducted by numerical simulations on mesh configurations with up to 5×5 ports, showcasing a predicted fidelity to the desired input-output relationships of 0.9 with a probability exceeding 99%. The training dataset is designed to align with the tuning speed of conventional phase shifters, facilitating the acquisition of training data within a few seconds.File | Dimensione | Formato | |
---|---|---|---|
Sances_Master_Thesis.pdf
accessibile in internet solo dagli utenti autorizzati
Descrizione: Master Thesis
Dimensione
10.32 MB
Formato
Adobe PDF
|
10.32 MB | Adobe PDF | Visualizza/Apri |
Sances_Exec_Summary.pdf
accessibile in internet solo dagli utenti autorizzati
Descrizione: Executive summary
Dimensione
1.34 MB
Formato
Adobe PDF
|
1.34 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/214091