Parametric virtual microphone synthesis with spatial coherence constraints for sound field reconstruction

A significant challenge in spatial audio applications is the reconstruction of sound fields at arbitrary positions using a limited number of microphones. This task necessitates a rapid and adaptable approach to accurately recreate the sound field and its spatial characteristics. One promising solution is the technique of virtual miking, which enables the synthesis of multiple virtual microphones within an acoustic scene. This thesis introduces a parametric approach to virtual miking. In this method, we assume that the sound field can be decomposed into two primary components: direct and diffuse. This subdivision allows for the independent processing of each component. The proposed approach is based on a model characterized by physical parameters such as source position and exterior sound field coefficients. These parameters are estimated from the microphone signals and are utilized to model the direct and diffuse components of the sound field over the acoustic scene. The primary contribution of this work lies in incorporating spatial coherence constraints, which refine the modeling of the diffuse component by defining the phase relationships among pairs of virtual microphones. The effectiveness of this method is validated through simulations that compare the reconstructed signals to reference data using objective metrics. The results indicate that the proposed reconstruction technique and the spatial coherence design process are effective for this task, resulting in a significant improvement in the accuracy of the reconstructed sound field.

Una sfida fondamentale nelle applicazioni di audio spaziale è la ricostruzione dei campi sonori in posizioni arbitrarie utilizzando un numero limitato di microfoni. Questo compito richiede un approccio rapido e malleabile per ricreare accuratamente il campo sonoro e le sue caratteristiche spaziali. Una soluzione promettente è la tecnica del virtual miking, che consente la sintesi di più microfoni virtuali all'interno di una scena acustica. Questa tesi introduce un approccio parametrico al virtual miking. In questo metodo, si assume che il campo sonoro possa essere scomposto in due componenti principali: diretta e diffusa. Questa suddivisione permette l'elaborazione indipendente di ciascuna componente. L'approccio proposto si basa su un modello caratterizzato da parametri fisici, come la posizione delle sorgenti e i coefficienti del campo sonoro esterno. Questi parametri vengono stimati dai segnali dei microfoni e utilizzati per modellare le componenti diretta e diffusa del campo sonoro sull'intera scena acustica. Il principale contributo di questo lavoro risiede nell'incorporazione di vincoli sulla coerenza spaziale, che affinano la modellazione della componente diffusa definendo le relazioni di fase tra coppie di microfoni virtuali. L'efficacia di questo metodo è validata tramite simulazioni che confrontano i segnali ricostruiti con i dati di riferimento utilizzando metriche oggettive. I risultati indicano che la tecnica di ricostruzione proposta e il processo di progettazione della coerenza spaziale sono efficaci per questo compito, portando a un significativo miglioramento nella precisione della ricostruzione del campo sonoro.