Soundfield reconstruction methods aim at estimating the pressure field in arbitrary positions in space, given a finite set of acoustic measurements carried out using an array of microphones. The methods proposed in the literature are either based on a parametric or a non-parametric description of the soundfield. In the former case, the reconstruction is achieved by using some knowledge on the acoustic scene and environment geometry, while in the latter all the needed information is estimated from the microphone signals. This thesis aims at developing a methodology for soundfield reconstruction that can be considered as a hybrid between the parametric and the non-parametric approaches. Such a methodology is based on the use of Compressive Sensing for the analysis of the acoustic scene. This framework enables to perform the reconstruction of undersampled spatial sound signals, by solving an optimization problem that promotes the sparsity of the solution. We use this framework in order to reconstruct the soundfield in close reverberant environments, in the presence of sources with arbitrary directivity patterns. In order to do so, we exploit a physical model of the soundfield, assumed to be produced by a sparse distribution of sources. This model is designed using an overcomplete dictionary of Green's functions to describe both the direct pressure field and the early reflections, while late reverberations are described under the far field assumption by employing a dictionary of plane waves. The proposed soundfield reconstruction method therefore aims at fitting the microphone measurements to the soundfield model. This is done by solving a sparse optimization problem in order to find the weights of the Green’s functions and the plane waves that compose the soundfield. Explicitly modeling the early reflections by using secondary sources characterized by Green’s functions allows us to achieve good results also in presence of strong reverberation. Directional sources are taken into account by introducing additional directional Green’s functions in the dictionary. After the estimation of the weights, the soundfield can be reconstructed at arbitrary positions by solving a direct problem. We validated the effectiveness of the proposed method by performing simulations and experiments with real acoustic measurements. The limited number of required microphones and the flexibility of our approach makes it suitable to applications in the fields of virtual reality and telepresence.

I metodi di ricostruzione del campo acustico mirano a stimare la pressione sonora in posizioni arbitrarie dello spazio, a partire da un insieme di registrazioni effettuate con un array di microfoni. I metodi proposti in letteratura sono basati su una descrizione parametrica o non parametrica del campo acustico. Nel primo caso il procedimento sfrutta una conoscenza a priori riguardo alla scena sonora e alla geometria dell’ambiente, nel secondo tutte le informazioni necessarie sono ricavate dai segnali registrati. L'obiettivo di questa tesi è quello di sviluppare una metodologia per la ricostruzione del campo acustico che si configuri come un ibrido tra gli approcci parametrici e non parametrici. Il metodo proposto è basato sull’utilizzo del Compressive Sensing per l’analisi della scena sonora. Questo paradigma permette di ricostruire segnali audio spaziali sotto-campionati, tramite la risoluzione di un problema di ottimizzazione in cui viene promossa la sparsità della soluzione. Questa tesi sfrutta il Compressive Sensing per ricostruire il campo acustico generato da sorgenti con direzionalità arbitraria, in ambienti chiusi riverberanti. A tal fine viene utilizzato un modello fisico del campo sonoro, assumendo che la distribuzione di sorgenti acustiche sia sparsa. Il modello sfrutta un dizionario di funzioni di Green per descrivere sia il campo diretto sia le prime riflessioni; la coda di riverbero viene invece descritta con un dizionario di onde piane. Il metodo di ricostruzione opera un'interpolazione dei segnali registrati sfruttando tale modello, tramite la risoluzione di un problema di ottimizzazione sparsa la cui soluzione rappresenta i pesi delle funzioni di Green e delle onde piane che generano il campo. La modellazione esplicita delle prime riflessioni, basata su sorgenti secondarie descritte con funzioni di Green, garantisce buoni risultati anche in presenza di un forte riverbero. Con l'aggiunta nel dizionario di funzioni di Green direzionali, il modello contempla sorgenti con direttività arbitraria. In seguito alla valutazione dei pesi di funzioni di Green e onde piane, il campo sonoro può essere ricostruito in posizioni arbitrarie risolvendo un problema diretto. Abbiamo verificato l’efficacia del metodo proposto tramite simulazioni ed esperimenti con misurazioni acustiche reali. Il numero limitato di microfoni richiesti e la flessibilità del nostro approccio lo rendono utilizzabile in applicazioni nell’ambito della realtà virtuale e della telepresenza.

A compressive sensing approach to soundfield reconstruction in reverberant environments

Damiano, Stefano
2019/2020

Abstract

Soundfield reconstruction methods aim at estimating the pressure field in arbitrary positions in space, given a finite set of acoustic measurements carried out using an array of microphones. The methods proposed in the literature are either based on a parametric or a non-parametric description of the soundfield. In the former case, the reconstruction is achieved by using some knowledge on the acoustic scene and environment geometry, while in the latter all the needed information is estimated from the microphone signals. This thesis aims at developing a methodology for soundfield reconstruction that can be considered as a hybrid between the parametric and the non-parametric approaches. Such a methodology is based on the use of Compressive Sensing for the analysis of the acoustic scene. This framework enables to perform the reconstruction of undersampled spatial sound signals, by solving an optimization problem that promotes the sparsity of the solution. We use this framework in order to reconstruct the soundfield in close reverberant environments, in the presence of sources with arbitrary directivity patterns. In order to do so, we exploit a physical model of the soundfield, assumed to be produced by a sparse distribution of sources. This model is designed using an overcomplete dictionary of Green's functions to describe both the direct pressure field and the early reflections, while late reverberations are described under the far field assumption by employing a dictionary of plane waves. The proposed soundfield reconstruction method therefore aims at fitting the microphone measurements to the soundfield model. This is done by solving a sparse optimization problem in order to find the weights of the Green’s functions and the plane waves that compose the soundfield. Explicitly modeling the early reflections by using secondary sources characterized by Green’s functions allows us to achieve good results also in presence of strong reverberation. Directional sources are taken into account by introducing additional directional Green’s functions in the dictionary. After the estimation of the weights, the soundfield can be reconstructed at arbitrary positions by solving a direct problem. We validated the effectiveness of the proposed method by performing simulations and experiments with real acoustic measurements. The limited number of required microphones and the flexibility of our approach makes it suitable to applications in the fields of virtual reality and telepresence.
BERNARDINI, ALBERTO
BORRA, FEDERICO
ING - Scuola di Ingegneria Industriale e dell'Informazione
27-apr-2021
2019/2020
I metodi di ricostruzione del campo acustico mirano a stimare la pressione sonora in posizioni arbitrarie dello spazio, a partire da un insieme di registrazioni effettuate con un array di microfoni. I metodi proposti in letteratura sono basati su una descrizione parametrica o non parametrica del campo acustico. Nel primo caso il procedimento sfrutta una conoscenza a priori riguardo alla scena sonora e alla geometria dell’ambiente, nel secondo tutte le informazioni necessarie sono ricavate dai segnali registrati. L'obiettivo di questa tesi è quello di sviluppare una metodologia per la ricostruzione del campo acustico che si configuri come un ibrido tra gli approcci parametrici e non parametrici. Il metodo proposto è basato sull’utilizzo del Compressive Sensing per l’analisi della scena sonora. Questo paradigma permette di ricostruire segnali audio spaziali sotto-campionati, tramite la risoluzione di un problema di ottimizzazione in cui viene promossa la sparsità della soluzione. Questa tesi sfrutta il Compressive Sensing per ricostruire il campo acustico generato da sorgenti con direzionalità arbitraria, in ambienti chiusi riverberanti. A tal fine viene utilizzato un modello fisico del campo sonoro, assumendo che la distribuzione di sorgenti acustiche sia sparsa. Il modello sfrutta un dizionario di funzioni di Green per descrivere sia il campo diretto sia le prime riflessioni; la coda di riverbero viene invece descritta con un dizionario di onde piane. Il metodo di ricostruzione opera un'interpolazione dei segnali registrati sfruttando tale modello, tramite la risoluzione di un problema di ottimizzazione sparsa la cui soluzione rappresenta i pesi delle funzioni di Green e delle onde piane che generano il campo. La modellazione esplicita delle prime riflessioni, basata su sorgenti secondarie descritte con funzioni di Green, garantisce buoni risultati anche in presenza di un forte riverbero. Con l'aggiunta nel dizionario di funzioni di Green direzionali, il modello contempla sorgenti con direttività arbitraria. In seguito alla valutazione dei pesi di funzioni di Green e onde piane, il campo sonoro può essere ricostruito in posizioni arbitrarie risolvendo un problema diretto. Abbiamo verificato l’efficacia del metodo proposto tramite simulazioni ed esperimenti con misurazioni acustiche reali. Il numero limitato di microfoni richiesti e la flessibilità del nostro approccio lo rendono utilizzabile in applicazioni nell’ambito della realtà virtuale e della telepresenza.
File allegati
File Dimensione Formato  
2021_04_Damiano.pdf

solo utenti autorizzati dal 02/04/2024

Descrizione: testo tesi
Dimensione 3.4 MB
Formato Adobe PDF
3.4 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/173350