Sound field manipulation is a research topic that aims at modifying the properties of an acoustic scene. In the literature it has been proven that physically accurate sound field representations become unpractical when complex sound scenes are considered, due to the enormous computational effort they would require. This thesis aims at developing a novel manipulation methodology based upon Soundfield Imaging techniques, which model the acoustic propagation adopting the concept of acoustic rays, i.e. straight lines that carry acoustic information. We have taken advantage of the Ray Space Transform, a powerful tool that efficiently maps the sound field information acquired by means of a Uniform Linear Array (ULA) of microphones onto a domain known as ray space. Points in this domain represent rays in the geometric space, therefore the analysis of the propagating sound field could be addressed considering each directional component individually. The description of acoustic scenes is here approached adopting a parametric spatial sound paradigm. More precisely, the sound scene is described by defining the acoustic source, its position and orientation in space, its emitted signal and finally its radiation pattern, defined as the angular-frequency dependence of the amplitude of the signal. First, the ray space transform of the microphone signals is computed and provided to the parameter estimation stage. In particular, the source position is estimated through a weighted least squares problem, while the radiation pattern is extrapolated from the linear pattern of the ray space image. Since the microphone array "sees" the source from a narrow range of directions, the radiation pattern is modelled in the Circular Harmonics domain and the coefficients are estimated through an optimization problem. Finally, a spatial filter called beamformer is designed upon the results of the previous steps in order to extract the source signal directly from the array signals. The estimated paramaters could be provided to any parametric sound scene rendering system. Through computer-aided simulations and experiments we have proven the capability of the proposed system performing different manipulations. The results of the tests suggest that the proposed methodology would play a significant role in future research topics on spatial audio processing.

La manipolazione dei campi acustici è un argomento di ricerca che si prefigge di modificare le proprietà di una scena acustica. In letteratura è stato comprovato che le rappresentazioni fisicamente accurate del campo sonoro risultano impraticabili nella modellazione di scene complesse, a causa dell'ingente costo computazionale richiesto. Questa tesi sviluppa una metodologia di manipolazione innovativa basata sulle tecniche di Soundfield Imaging, nelle quali la propagazione sonora sfrutta il concetto di raggi acustici, ovvero linee rette che trasportano informazione acustica. Abbiamo adottato la trasformata Ray Space, un potente operatore che mappa l'informazione acquisita da una schiera lineare uniforme di microfoni nello spazio dei raggi. Punti in questo dominio rappresentano raggi nello spazio geometrico, perciò l'analisi della propagazione del campo acustico può essere affrontata considerando individualmente le componenti direzionali. La descrizione della scena acustica fa proprio il paradigma parametrico della spazializzazione sonora. Più precisamente, la scena acustica è qui parametrizzata definendo la sorgente acustica, la sua posizione e il suo orientamento nello spazio, il suo segnale emesso e infine il pattern di radianza, definito come la dipendenza dell'ampiezza del segnale dalla frequenza e dalla direzione di propagazione. Innanzitutto i segnali microfonici viengono trasformati e l'immagine ray space processata per stimare i parametri. In particolare, la posizione della sorgente è stimata grazie a una regressione ponderata dei minimi quadrati, mentre il pattern di radianza è estrapolato dalla linea emergente dall'immagine ray space. Siccome la schiera di microfoni "vede" la sorgente in un intervallo ristretto di direzioni, il pattern di radianza è modellato nel dominio delle Armoniche Circolari e i coefficienti stimati con un problema di ottimizzazione. Infine, un filtro spaziale chiamato beamformer viene progettato conoscendo i risultati dei passaggi precedenti al fine di estrarre il segnale della sorgente direttamente dai segnali microfonici. I parametri stimati possono essere utilizzati da qualsiasi sistema parametrico di rendering acustico. Grazie a simulazioni computerizzate ed esperimenti in laboratorio abbiamo dimostrato le capacità del sistema proposto eseguendo diverse manipolazioni. I risultati delle prove suggeriscono che la metodologia proposta giocherà un ruolo importante nelle ricerche future sull'elaborazione di campi acustici.

A plenacoustic approach to sound scene manipulation

PICETTI, FRANCESCO
2016/2017

Abstract

Sound field manipulation is a research topic that aims at modifying the properties of an acoustic scene. In the literature it has been proven that physically accurate sound field representations become unpractical when complex sound scenes are considered, due to the enormous computational effort they would require. This thesis aims at developing a novel manipulation methodology based upon Soundfield Imaging techniques, which model the acoustic propagation adopting the concept of acoustic rays, i.e. straight lines that carry acoustic information. We have taken advantage of the Ray Space Transform, a powerful tool that efficiently maps the sound field information acquired by means of a Uniform Linear Array (ULA) of microphones onto a domain known as ray space. Points in this domain represent rays in the geometric space, therefore the analysis of the propagating sound field could be addressed considering each directional component individually. The description of acoustic scenes is here approached adopting a parametric spatial sound paradigm. More precisely, the sound scene is described by defining the acoustic source, its position and orientation in space, its emitted signal and finally its radiation pattern, defined as the angular-frequency dependence of the amplitude of the signal. First, the ray space transform of the microphone signals is computed and provided to the parameter estimation stage. In particular, the source position is estimated through a weighted least squares problem, while the radiation pattern is extrapolated from the linear pattern of the ray space image. Since the microphone array "sees" the source from a narrow range of directions, the radiation pattern is modelled in the Circular Harmonics domain and the coefficients are estimated through an optimization problem. Finally, a spatial filter called beamformer is designed upon the results of the previous steps in order to extract the source signal directly from the array signals. The estimated paramaters could be provided to any parametric sound scene rendering system. Through computer-aided simulations and experiments we have proven the capability of the proposed system performing different manipulations. The results of the tests suggest that the proposed methodology would play a significant role in future research topics on spatial audio processing.
BORRA, FEDERICO
ING - Scuola di Ingegneria Industriale e dell'Informazione
22-dic-2017
2016/2017
La manipolazione dei campi acustici è un argomento di ricerca che si prefigge di modificare le proprietà di una scena acustica. In letteratura è stato comprovato che le rappresentazioni fisicamente accurate del campo sonoro risultano impraticabili nella modellazione di scene complesse, a causa dell'ingente costo computazionale richiesto. Questa tesi sviluppa una metodologia di manipolazione innovativa basata sulle tecniche di Soundfield Imaging, nelle quali la propagazione sonora sfrutta il concetto di raggi acustici, ovvero linee rette che trasportano informazione acustica. Abbiamo adottato la trasformata Ray Space, un potente operatore che mappa l'informazione acquisita da una schiera lineare uniforme di microfoni nello spazio dei raggi. Punti in questo dominio rappresentano raggi nello spazio geometrico, perciò l'analisi della propagazione del campo acustico può essere affrontata considerando individualmente le componenti direzionali. La descrizione della scena acustica fa proprio il paradigma parametrico della spazializzazione sonora. Più precisamente, la scena acustica è qui parametrizzata definendo la sorgente acustica, la sua posizione e il suo orientamento nello spazio, il suo segnale emesso e infine il pattern di radianza, definito come la dipendenza dell'ampiezza del segnale dalla frequenza e dalla direzione di propagazione. Innanzitutto i segnali microfonici viengono trasformati e l'immagine ray space processata per stimare i parametri. In particolare, la posizione della sorgente è stimata grazie a una regressione ponderata dei minimi quadrati, mentre il pattern di radianza è estrapolato dalla linea emergente dall'immagine ray space. Siccome la schiera di microfoni "vede" la sorgente in un intervallo ristretto di direzioni, il pattern di radianza è modellato nel dominio delle Armoniche Circolari e i coefficienti stimati con un problema di ottimizzazione. Infine, un filtro spaziale chiamato beamformer viene progettato conoscendo i risultati dei passaggi precedenti al fine di estrarre il segnale della sorgente direttamente dai segnali microfonici. I parametri stimati possono essere utilizzati da qualsiasi sistema parametrico di rendering acustico. Grazie a simulazioni computerizzate ed esperimenti in laboratorio abbiamo dimostrato le capacità del sistema proposto eseguendo diverse manipolazioni. I risultati delle prove suggeriscono che la metodologia proposta giocherà un ruolo importante nelle ricerche future sull'elaborazione di campi acustici.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2017_12_Picetti.pdf

accessibile in internet per tutti

Descrizione: Thesis text
Dimensione 2.91 MB
Formato Adobe PDF
2.91 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/138430