In this thesis we propose a novel approach to wave field analysis and synthesis based on the geometric description of a sound field. Under the hypothesis of homogeneous medium, wave propagation can be approximated by means of acoustic rays that originate from a point source and spread in all the directions. The interaction with the environment causes the rays to reflect over the obstacles following the geometrical acoustic laws. Contiguous bundle of rays can be represented as acoustic beams that split and branch during the propagation as they encounter reflectors. An acoustic wave field can be seen as the superposition of acoustic beams, each characterized by the origin (source), direction and angular aperture. Due to the projective nature of rays, the most suitable tool for their representation is projective geometry, which gives also a compact and efficient description of more complex acoustic entities such as sources, receivers, reflectors and beams. As far as the wave field analysis is concerned, projective geometry makes it possible to convert standard acoustic measurements (TOAs, TDOAs, DOAs) into homogeneous quadratic constraints, which all share the same mathematical formulation. This way, through the combination of multiple constraints it is possible to formulate a cost function whose form is equivalent for several estimation problems, ranging from standard ones (e.g. acoustic source localization), to novel ones such as the inference of the geometry of the environment. As far as the sound field synthesis is concerned, the geometric description of a wave field leads to developing a methodology that aims at reproducing a complex wave field by superimposing elementary beams rendered by means of a loudspeaker array. The knowledge of the map of the environment, which can be estimated in the analysis stage, can be exploited to compensate for the environment hosting the loudspeakers, thus making the rendering system environment-aware. In particular, the reverberations (in terms of early reflections) are seen as determined by a set of image loudspeakers, which are inserted into the model and contribute to the reproduction of the wave field. This thesis also includes various novel validation methodologies for the proposed techniques. As far as wave field analysis is concerned, we show that it is possible to predict the accuracy of estimation algorithms as a linear mapping between the error on the measurements and the estimation error. As for the sound field synthesis, we propose a methodology for assessing the quality of wave fields reproduced by real loudspeakers. The wave field is sampled over a circle with a pair of rotating microphones and extrapolated by means of the circular harmonic decomposition. The deviation between the extrapolated and the expected wave fields are then evaluated by means of standard (MSE-based) and novel (modal analysis) metrics. In this thesis we also show the results of some simulations and experiments of room compensation and virtual environment rendering. The solutions proposed in this thesis find potential application in a wide range of fields, including advanced telecommunications (telepresence), immersive gaming, distributed music production, spatial audio at home.

In questa tesi si propone un approccio innovativo per l'analisi e la sintesi di campi acustici, basato sulla decomposizione geometrica di un campo sonoro. La propagazione di onde sonore in un mezzo omogeneo può essere descritta tramite raggi acustici che hanno origine in un punto sorgente e che si propagano in tutte le direzioni. L'interazione con l'ambiente è quindi modellizzata secondo le leggi dell'acustica geometrica, ovvero come riflessione dei raggi acustici sugli ostacoli presenti lungo il cammino dei raggi stessi. Gruppi di raggi acustici contigui, originati dallo stesso punto sorgente, possono essere rappresentati come fasci acustici. Ogni qualvolta un fascio acustico incontra un ostacolo, esso viene riflesso generandone di nuovi che saranno a loro volta verranno riflessi, producendo una struttura ramificata. Per questo motivo, un campo acustico può essere interpretato come sovrapposizione di fasci acustici, ognuno dei quali caratterizzato da un'origine (il punto sorgente), dalla direzione, e dall'apertura angolare. Un modo naturale per descrivere i raggi è la geometria proiettiva, che ben si adatta alla natura proiettiva dei raggi stessi. Lo stesso formalismo risulta inoltre essere adatto per descrivere oggetti acustici più complessi quali sorgenti, ricevitori, riflettori e fasci acustici. Per quanto riguarda l'analisi dei campi acustici, la geometria proiettiva permette di convertire misure acustiche standard (come i tempi di arrivo, le differenze dei tempi di arrivo, e le direzioni di arrivo) in vincoli quadratici espressi in coordinate omogenee. Essi sono tutti caratterizzati dalla medesima formulatione matematica, che permette di combinare più vincoli in una funzione di costo la cui forma risulta essere equivalente per i diversi problemi di stima introdotti, in particolare per problemi standard come la calibrazione delle schiere di microfoni e la localizzazione di sorgente, e per problemi innovativi come l'inferenza della geometria dell'ambiente. Per quanto riguarda la sintesi di campi acustici, la decomposizione geometrica permette di sviluppare una metodologia per la riproduzione di campi acustici arbitrari per mezzo di una o più schiere di altoparlanti. La conoscenza della geometria dell'ambiente (che può essere stimata nella fase di analisi) può essere sfruttata per compensare parte della riverberazione (le prime riflessioni) prodotta dalle pareti, al fine di rendere il sistema "consapevole" dell'ambiente. Dal punto di vista geometrico, le prime riflessioni sono determinate da un'insieme di altoparlanti immagine, i quali, una volta inseriti nel modello, contribuiscono alla riproduzione sonora. La tesi include inoltre una serie di nuove metodologie per la validazione, teorica e sperimentale, delle tecniche proposte. Per quanto riguarda l'analisi dei campi acustici, si mostrerà che l'accuratezza degli algoritmi di stima può essere predetta tramite una funzione lineare che lega l'errore di misura a quello di stima. Per quanto concerne la sintesi di campi acustici, viene proposta una metodologia per valutare sperimentalmente la bontà dei campi riprodotti da sistemi di altoparlanti. Il campo acustico viene campionato su una circonferenza per mezzo di una coppia di microfoni rotanti, ed estrapolato mediante decomposizione in armoniche circolari. L'eventuale degradazione del campo misurato (estrapolato) rispetto a quello desiderato viene quindi quantificata tramite metriche standard (basate sull'errore quadratico medio) e metriche innovative (analisi modale). Nella tesi sono riportati i risultati di alcune simulazioni ed esperimenti di sintesi di campi acustici in ambienti riverberanti. Le soluzioni proposte in questo lavoro trovano potenziale applicazione in diversi campi, quali le telecomunicazioni avanzate (telepresenza), i video-giochi immersivi, la produzione musicale distribuita, la spazializzazione sonora per sistemi di home entertainment.

Un approccio geometrico per l’analisi e la sintesi di campi acustici per applicazioni multimediali. A geometric approach to analysis and synthesis of acoustic wave fields for multimedia applications

CANCLINI, ANTONIO

Abstract

In this thesis we propose a novel approach to wave field analysis and synthesis based on the geometric description of a sound field. Under the hypothesis of homogeneous medium, wave propagation can be approximated by means of acoustic rays that originate from a point source and spread in all the directions. The interaction with the environment causes the rays to reflect over the obstacles following the geometrical acoustic laws. Contiguous bundle of rays can be represented as acoustic beams that split and branch during the propagation as they encounter reflectors. An acoustic wave field can be seen as the superposition of acoustic beams, each characterized by the origin (source), direction and angular aperture. Due to the projective nature of rays, the most suitable tool for their representation is projective geometry, which gives also a compact and efficient description of more complex acoustic entities such as sources, receivers, reflectors and beams. As far as the wave field analysis is concerned, projective geometry makes it possible to convert standard acoustic measurements (TOAs, TDOAs, DOAs) into homogeneous quadratic constraints, which all share the same mathematical formulation. This way, through the combination of multiple constraints it is possible to formulate a cost function whose form is equivalent for several estimation problems, ranging from standard ones (e.g. acoustic source localization), to novel ones such as the inference of the geometry of the environment. As far as the sound field synthesis is concerned, the geometric description of a wave field leads to developing a methodology that aims at reproducing a complex wave field by superimposing elementary beams rendered by means of a loudspeaker array. The knowledge of the map of the environment, which can be estimated in the analysis stage, can be exploited to compensate for the environment hosting the loudspeakers, thus making the rendering system environment-aware. In particular, the reverberations (in terms of early reflections) are seen as determined by a set of image loudspeakers, which are inserted into the model and contribute to the reproduction of the wave field. This thesis also includes various novel validation methodologies for the proposed techniques. As far as wave field analysis is concerned, we show that it is possible to predict the accuracy of estimation algorithms as a linear mapping between the error on the measurements and the estimation error. As for the sound field synthesis, we propose a methodology for assessing the quality of wave fields reproduced by real loudspeakers. The wave field is sampled over a circle with a pair of rotating microphones and extrapolated by means of the circular harmonic decomposition. The deviation between the extrapolated and the expected wave fields are then evaluated by means of standard (MSE-based) and novel (modal analysis) metrics. In this thesis we also show the results of some simulations and experiments of room compensation and virtual environment rendering. The solutions proposed in this thesis find potential application in a wide range of fields, including advanced telecommunications (telepresence), immersive gaming, distributed music production, spatial audio at home.
SARTI, AUGUSTO
FIORINI, CARLO ETTORE
CAPONE, ANTONIO
16-mar-2012
In questa tesi si propone un approccio innovativo per l'analisi e la sintesi di campi acustici, basato sulla decomposizione geometrica di un campo sonoro. La propagazione di onde sonore in un mezzo omogeneo può essere descritta tramite raggi acustici che hanno origine in un punto sorgente e che si propagano in tutte le direzioni. L'interazione con l'ambiente è quindi modellizzata secondo le leggi dell'acustica geometrica, ovvero come riflessione dei raggi acustici sugli ostacoli presenti lungo il cammino dei raggi stessi. Gruppi di raggi acustici contigui, originati dallo stesso punto sorgente, possono essere rappresentati come fasci acustici. Ogni qualvolta un fascio acustico incontra un ostacolo, esso viene riflesso generandone di nuovi che saranno a loro volta verranno riflessi, producendo una struttura ramificata. Per questo motivo, un campo acustico può essere interpretato come sovrapposizione di fasci acustici, ognuno dei quali caratterizzato da un'origine (il punto sorgente), dalla direzione, e dall'apertura angolare. Un modo naturale per descrivere i raggi è la geometria proiettiva, che ben si adatta alla natura proiettiva dei raggi stessi. Lo stesso formalismo risulta inoltre essere adatto per descrivere oggetti acustici più complessi quali sorgenti, ricevitori, riflettori e fasci acustici. Per quanto riguarda l'analisi dei campi acustici, la geometria proiettiva permette di convertire misure acustiche standard (come i tempi di arrivo, le differenze dei tempi di arrivo, e le direzioni di arrivo) in vincoli quadratici espressi in coordinate omogenee. Essi sono tutti caratterizzati dalla medesima formulatione matematica, che permette di combinare più vincoli in una funzione di costo la cui forma risulta essere equivalente per i diversi problemi di stima introdotti, in particolare per problemi standard come la calibrazione delle schiere di microfoni e la localizzazione di sorgente, e per problemi innovativi come l'inferenza della geometria dell'ambiente. Per quanto riguarda la sintesi di campi acustici, la decomposizione geometrica permette di sviluppare una metodologia per la riproduzione di campi acustici arbitrari per mezzo di una o più schiere di altoparlanti. La conoscenza della geometria dell'ambiente (che può essere stimata nella fase di analisi) può essere sfruttata per compensare parte della riverberazione (le prime riflessioni) prodotta dalle pareti, al fine di rendere il sistema "consapevole" dell'ambiente. Dal punto di vista geometrico, le prime riflessioni sono determinate da un'insieme di altoparlanti immagine, i quali, una volta inseriti nel modello, contribuiscono alla riproduzione sonora. La tesi include inoltre una serie di nuove metodologie per la validazione, teorica e sperimentale, delle tecniche proposte. Per quanto riguarda l'analisi dei campi acustici, si mostrerà che l'accuratezza degli algoritmi di stima può essere predetta tramite una funzione lineare che lega l'errore di misura a quello di stima. Per quanto concerne la sintesi di campi acustici, viene proposta una metodologia per valutare sperimentalmente la bontà dei campi riprodotti da sistemi di altoparlanti. Il campo acustico viene campionato su una circonferenza per mezzo di una coppia di microfoni rotanti, ed estrapolato mediante decomposizione in armoniche circolari. L'eventuale degradazione del campo misurato (estrapolato) rispetto a quello desiderato viene quindi quantificata tramite metriche standard (basate sull'errore quadratico medio) e metriche innovative (analisi modale). Nella tesi sono riportati i risultati di alcune simulazioni ed esperimenti di sintesi di campi acustici in ambienti riverberanti. Le soluzioni proposte in questo lavoro trovano potenziale applicazione in diversi campi, quali le telecomunicazioni avanzate (telepresenza), i video-giochi immersivi, la produzione musicale distribuita, la spazializzazione sonora per sistemi di home entertainment.
Tesi di dottorato
File allegati
File Dimensione Formato  
2012_03_PhD_Canclini.pdf

Open Access dal 28/02/2015

Descrizione: Testo della tesi
Dimensione 2.77 MB
Formato Adobe PDF
2.77 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/57182