Programmable optical processors offer a rapid and efficient means of implementing linear algebra operations, such as matrix-vector multiplication, directly in the optical analog domain. They find applications in analog computing, hardware accelerators, and machine learning. These processors are often constructed using networks, or meshes, of Mach- Zehnder interferometers (MZI) that can be reconfigured by adjusting the values of phase shifters within each interferometer. While these architectures can realize arbitrary transformations between input and output, configuring them is a complex task, particularly when dealing with fabrication tolerances leading to unknown biases in MZI phases and when employing thermal phase shifters prone to mutual thermal cross-talk. These challenges currently hinder the scalability of these architectures to large port counts, despite various proposed techniques for implementing control and calibration procedures. This study introduces a calibration technique based on an artificial neural network (ANN) to configure a MZI-based programmable optical processor. The proposed ANN model aims to estimate the values of the programmable actuators that determine the desired input-output relationship, controlling the Mach-Zehnder interferometer mesh implementing arbitrary beam splitting. The approach is applicable to MZI meshes of arbitrary topologies, even in the presence of non-idealities and thermal cross-talk. Demonstrations were conducted by numerical simulations on mesh configurations with up to 5×5 ports, showcasing a predicted fidelity to the desired input-output relationships of 0.9 with a probability exceeding 99%. The training dataset is designed to align with the tuning speed of conventional phase shifters, facilitating the acquisition of training data within a few seconds.

I processori ottici programmabili si offrono come soluzioni rapide ed efficienti per l’implementazione di acceleratori hardware analogici che possano risolvere operazioni algebriche come la moltiplicazione matriciale. Circuiti così realizzati possono essere impiegati per la creazione di chip photonici in computer analogici e acceleratori hardware specifici per l’appredimento automatizzato di intelligenze artificiali. I processori ottici sfruttano maglie di Mach-Zehnder, interferometri riconfigurabili tramite l’impostazione dello sfasamento imposto, per implementare una qualsiasi relazione unitaria tra ingresso e uscita. Ciononostante, la loro calibrazione è un processo complicato dalla presenza di errori di fabbricazione che possono causare sfasamenti indesiderati negli interferometri e dal cross-talk dovuto all’uso di attuatori termici. Nonostante numerosi sistemi di compensazione siano stati ideati per creare procedure di regolazione affidabili, le difficoltà nel controllo degli attuatori impediscono la scalabilità dei circuiti a numeri elevati di ingressi e di uscite. Questa tesi propone una procedura di calibrazione basata su un modello di rete neurale artificiale per la configurazione di processori ottici di interferometri Mach-Zehnder. La rete neurale si offre di controllare divisori fotonici costituiti da maglie di interferometri Mach-Zehnder, la cui trasmissione dei segnali in ingresso verso le uscite desiderate avviene tramite l’impostazione del valore stimato degli attuatori negli interferometri. L’approccio descritto può essere applicato a una qualsiasi disposizione degli interferometri, anche in preseneza di non idealità come il cross-talk termico. I risultati prodotti da simulatori numerici dimostrano una probabilità di realizzazione di trasformazioni tra ingresso e uscita che hanno una probabilità superiore al 99% di ottenere fedeltà di 0.9 o migliore, anche su mesh aventi 5×5 porte. Il dataset di addestramento delle reti neurali è dimensionato per poter essere acquisito in tempi ragionevoli, compatibili con il tempo di transizione degli sfasatori termici.

Control of programmable optical processors by using a neural network model

Sances, Francesco Maria
2022/2023

Abstract

Programmable optical processors offer a rapid and efficient means of implementing linear algebra operations, such as matrix-vector multiplication, directly in the optical analog domain. They find applications in analog computing, hardware accelerators, and machine learning. These processors are often constructed using networks, or meshes, of Mach- Zehnder interferometers (MZI) that can be reconfigured by adjusting the values of phase shifters within each interferometer. While these architectures can realize arbitrary transformations between input and output, configuring them is a complex task, particularly when dealing with fabrication tolerances leading to unknown biases in MZI phases and when employing thermal phase shifters prone to mutual thermal cross-talk. These challenges currently hinder the scalability of these architectures to large port counts, despite various proposed techniques for implementing control and calibration procedures. This study introduces a calibration technique based on an artificial neural network (ANN) to configure a MZI-based programmable optical processor. The proposed ANN model aims to estimate the values of the programmable actuators that determine the desired input-output relationship, controlling the Mach-Zehnder interferometer mesh implementing arbitrary beam splitting. The approach is applicable to MZI meshes of arbitrary topologies, even in the presence of non-idealities and thermal cross-talk. Demonstrations were conducted by numerical simulations on mesh configurations with up to 5×5 ports, showcasing a predicted fidelity to the desired input-output relationships of 0.9 with a probability exceeding 99%. The training dataset is designed to align with the tuning speed of conventional phase shifters, facilitating the acquisition of training data within a few seconds.
CAVICCHIOLI, GABRIELE
ING - Scuola di Ingegneria Industriale e dell'Informazione
19-dic-2023
2022/2023
I processori ottici programmabili si offrono come soluzioni rapide ed efficienti per l’implementazione di acceleratori hardware analogici che possano risolvere operazioni algebriche come la moltiplicazione matriciale. Circuiti così realizzati possono essere impiegati per la creazione di chip photonici in computer analogici e acceleratori hardware specifici per l’appredimento automatizzato di intelligenze artificiali. I processori ottici sfruttano maglie di Mach-Zehnder, interferometri riconfigurabili tramite l’impostazione dello sfasamento imposto, per implementare una qualsiasi relazione unitaria tra ingresso e uscita. Ciononostante, la loro calibrazione è un processo complicato dalla presenza di errori di fabbricazione che possono causare sfasamenti indesiderati negli interferometri e dal cross-talk dovuto all’uso di attuatori termici. Nonostante numerosi sistemi di compensazione siano stati ideati per creare procedure di regolazione affidabili, le difficoltà nel controllo degli attuatori impediscono la scalabilità dei circuiti a numeri elevati di ingressi e di uscite. Questa tesi propone una procedura di calibrazione basata su un modello di rete neurale artificiale per la configurazione di processori ottici di interferometri Mach-Zehnder. La rete neurale si offre di controllare divisori fotonici costituiti da maglie di interferometri Mach-Zehnder, la cui trasmissione dei segnali in ingresso verso le uscite desiderate avviene tramite l’impostazione del valore stimato degli attuatori negli interferometri. L’approccio descritto può essere applicato a una qualsiasi disposizione degli interferometri, anche in preseneza di non idealità come il cross-talk termico. I risultati prodotti da simulatori numerici dimostrano una probabilità di realizzazione di trasformazioni tra ingresso e uscita che hanno una probabilità superiore al 99% di ottenere fedeltà di 0.9 o migliore, anche su mesh aventi 5×5 porte. Il dataset di addestramento delle reti neurali è dimensionato per poter essere acquisito in tempi ragionevoli, compatibili con il tempo di transizione degli sfasatori termici.
File allegati
File Dimensione Formato  
Sances_Master_Thesis.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Master Thesis
Dimensione 10.32 MB
Formato Adobe PDF
10.32 MB Adobe PDF   Visualizza/Apri
Sances_Exec_Summary.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Executive summary
Dimensione 1.34 MB
Formato Adobe PDF
1.34 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/214091