In this thesis we address a fairly broad range of current audio signal processing problems through the study, representation, acquisition/construction and use of the plenacoustic data that captures the acoustic scene as “seen” from different points in space. In particular, for the modeling of acoustic propagation, the plenacoustic data takes form of the visibility information that specifies the visibility of geometric objects from generic points in space. This information is used for an efficient and accurate simulation of acoustic propagation in complex environments. As far as the analysis of acoustic scenes is concerned, the plenacoustic data acquired by one or more microphone arrays is represented in form of plenacoustic image that captures the soundfield coming from a given direction at a given point in space. This image carries a great deal of information on the acoustic scene. Following the laws of the geometrical acoustics, the plenacoustic data is represented in terms of acoustic rays in a space here referred to as the ray space. The adopted parameterization of the acoustic rays allows both an efficient construction of visibility information and an easy extraction of acoustic features from the acquired plenacoustic images. High regularity and generality make the ray space representation of plenacoustic data suitable for a variety of potential applications. The applications examined in this dissertation show the validity of the proposed approach for purposes of both modeling of acoustic propagation and analysis of acoustic scenes. In particular, the examined applications follow a specific scenario in which an advanced spatial audio system aimed at reproducing the desired soundfield within a region of space is placed inside an unknown hosting environment. First, an acoustic source probes the environment and the plenacoustic images acquired by a microphone array are examined in order to infer the geometry of the environment. The modeling engine computes the reflective paths between the source and the array. The modeled paths are then used by the second analysis algorithm that compares them with the acoustic measurements in order to estimate the reflection coefficients of all reflective surfaces in the environment. Given the information on geometry and reflection coefficients of the hosting environment, the modeling engine is used, once again, to model the sound propagation inside such environment. The rendering system uses this information to reproduce the desired soundfield by means of a loudspeaker array while compensating at the same time for the natural reverberation of the hosting environment. Theoretical aspects, implementation issues and statistical performance of proposed algorithms are analysed. The validity of the proposed approach, however, is not limited just to the presented applications. Efficiency, regularity and generality of the representation, as well as the perspective of even further availability of inexpensive integrated microphone/loudspeaker arrays in near future, make the proposed tools attractive for a wider range of possible applications including source characterization and separation, wavefield extrapolation, etc.

Questa tesi affronta un insieme di problematiche attuali nell’ambito di elaborazione dei segnali audio tramite lo studio, rappresentazione, acquisizione/costruzione e uso delle informazioni plenacustiche che catturano la scena acustica “vista” da diversi puti dello spazio. In particolare, per la modellazione della propagazione acustica, l’informazione plenacustica prende la forma di informazione di visibilità che cattura le condizioni di visibilità di oggetti geometrici da diversi punti dello spazio. Questa informazione viene usata per una efficiente ed accurata simulazione della propagazione di onde sonore in ambienti complessi. Per quanto riguarda invece l’analisi di scene acustiche, l’informazione plenacoustica acquisita da una o piu schiere di microfoni viene rappresentata in forma di un immagine plenacustica che cattura il campo sonoro proveniente da diverse direzioni sui diversi punti dello spazio. Questa immagine contiene un numero significativo di dettagli e informazioni sulla scena acustica. Seguendo le leggi dell’acustica geometrica, l’informazione plenacustica viene rappresentata in termini di raggi acustici in uno spazio parametrico indicato come lo spazio dei raggi. La parametrizzazione adottata per descrivere i raggi acustici permette un efficiente costruzione dell’informazione di visibilità ed una facile estrazione delle caratteristiche d’interesse dalle immagini plenacustiche. Regolarità e generalità della rappresentazione in termini di raggi acustici rende l’informazione plenacustica adatta ad una serie di possibili applicazioni. Le applicazioni esaminate in ambito di questa tesi mostrano la validità dell’approccio proposto sia per quanto riguarda la modellazione della propagazione sonora, sia per quanto riguarda l’analisi di scene acustiche. In particolare, le applicazioni discusse seguono lo scenario applicativo in cui un sistema di riproduzione spaziale di campi acustici basato su una o piu schiere di altoparlanti si trova ad operare dentro un ambiente sconosciuto. Una sorgente sonora genera il campo acustico e le immagini plenacustiche catturate con una schiera di microfoni vengono esaminate per ricostruire la geometria dell’ambiente. Data l’informazione sulla geometria, i percorsi acustici che collegano la sorgente con la schiera vengono calcolati tramite una simulazione della propagazione di onde sonore. Il secondo algoritmo di analisi confronta i percorsi simulati con le acquisizioni e stima i coefficienti di riflessione di ogni singola parete riflettente presente nella scena acustica. Il modello geometrico del campo sonoro viene ottenuto sfruttando l’informazione sulla geometria e proprietà riflessive dell’ambiente ottenuti in precedenza. Infine, il sistema di riproduzione usa questo modello per generare il campo acustico desiderato compensando allo stesso tempo le riverberazioni indesiderate dell’ambiente che ospita il sistema. Vengono analizzati i aspetti teorici, implementativi e le prestazioni statistiche dei algoritmi proposti. La validità del approccio proposto va, tuttavia, oltre le applicazioni discusse in questa tesi. Efficienza, regolarità e generalità della rappresentazione, insieme alla prospettiva di una sempre maggiore disponibilità di sistemi basati su dei microfoni/altoparlanti integrati a basso costo, rendono le idee sviluppate in questa tesi interessanti per una vasta gamma di possibili applicazioni tra cui caratterizzazione e separazione delle sorgenti, estrapolazione del campo, ecc.

Elaborazione plenacustica nello spazio dei raggi : modellazione e analisi delle scene acustiche

MARKOVIC, DEJAN

Abstract

In this thesis we address a fairly broad range of current audio signal processing problems through the study, representation, acquisition/construction and use of the plenacoustic data that captures the acoustic scene as “seen” from different points in space. In particular, for the modeling of acoustic propagation, the plenacoustic data takes form of the visibility information that specifies the visibility of geometric objects from generic points in space. This information is used for an efficient and accurate simulation of acoustic propagation in complex environments. As far as the analysis of acoustic scenes is concerned, the plenacoustic data acquired by one or more microphone arrays is represented in form of plenacoustic image that captures the soundfield coming from a given direction at a given point in space. This image carries a great deal of information on the acoustic scene. Following the laws of the geometrical acoustics, the plenacoustic data is represented in terms of acoustic rays in a space here referred to as the ray space. The adopted parameterization of the acoustic rays allows both an efficient construction of visibility information and an easy extraction of acoustic features from the acquired plenacoustic images. High regularity and generality make the ray space representation of plenacoustic data suitable for a variety of potential applications. The applications examined in this dissertation show the validity of the proposed approach for purposes of both modeling of acoustic propagation and analysis of acoustic scenes. In particular, the examined applications follow a specific scenario in which an advanced spatial audio system aimed at reproducing the desired soundfield within a region of space is placed inside an unknown hosting environment. First, an acoustic source probes the environment and the plenacoustic images acquired by a microphone array are examined in order to infer the geometry of the environment. The modeling engine computes the reflective paths between the source and the array. The modeled paths are then used by the second analysis algorithm that compares them with the acoustic measurements in order to estimate the reflection coefficients of all reflective surfaces in the environment. Given the information on geometry and reflection coefficients of the hosting environment, the modeling engine is used, once again, to model the sound propagation inside such environment. The rendering system uses this information to reproduce the desired soundfield by means of a loudspeaker array while compensating at the same time for the natural reverberation of the hosting environment. Theoretical aspects, implementation issues and statistical performance of proposed algorithms are analysed. The validity of the proposed approach, however, is not limited just to the presented applications. Efficiency, regularity and generality of the representation, as well as the perspective of even further availability of inexpensive integrated microphone/loudspeaker arrays in near future, make the proposed tools attractive for a wider range of possible applications including source characterization and separation, wavefield extrapolation, etc.
FIORINI, CARLO ETTORE
MONTI GUARNIERI, ANDREA
27-mar-2013
Plenacoustic processing in the ray space : applications to acoustic scene modeling and analysis
Questa tesi affronta un insieme di problematiche attuali nell’ambito di elaborazione dei segnali audio tramite lo studio, rappresentazione, acquisizione/costruzione e uso delle informazioni plenacustiche che catturano la scena acustica “vista” da diversi puti dello spazio. In particolare, per la modellazione della propagazione acustica, l’informazione plenacustica prende la forma di informazione di visibilità che cattura le condizioni di visibilità di oggetti geometrici da diversi punti dello spazio. Questa informazione viene usata per una efficiente ed accurata simulazione della propagazione di onde sonore in ambienti complessi. Per quanto riguarda invece l’analisi di scene acustiche, l’informazione plenacoustica acquisita da una o piu schiere di microfoni viene rappresentata in forma di un immagine plenacustica che cattura il campo sonoro proveniente da diverse direzioni sui diversi punti dello spazio. Questa immagine contiene un numero significativo di dettagli e informazioni sulla scena acustica. Seguendo le leggi dell’acustica geometrica, l’informazione plenacustica viene rappresentata in termini di raggi acustici in uno spazio parametrico indicato come lo spazio dei raggi. La parametrizzazione adottata per descrivere i raggi acustici permette un efficiente costruzione dell’informazione di visibilità ed una facile estrazione delle caratteristiche d’interesse dalle immagini plenacustiche. Regolarità e generalità della rappresentazione in termini di raggi acustici rende l’informazione plenacustica adatta ad una serie di possibili applicazioni. Le applicazioni esaminate in ambito di questa tesi mostrano la validità dell’approccio proposto sia per quanto riguarda la modellazione della propagazione sonora, sia per quanto riguarda l’analisi di scene acustiche. In particolare, le applicazioni discusse seguono lo scenario applicativo in cui un sistema di riproduzione spaziale di campi acustici basato su una o piu schiere di altoparlanti si trova ad operare dentro un ambiente sconosciuto. Una sorgente sonora genera il campo acustico e le immagini plenacustiche catturate con una schiera di microfoni vengono esaminate per ricostruire la geometria dell’ambiente. Data l’informazione sulla geometria, i percorsi acustici che collegano la sorgente con la schiera vengono calcolati tramite una simulazione della propagazione di onde sonore. Il secondo algoritmo di analisi confronta i percorsi simulati con le acquisizioni e stima i coefficienti di riflessione di ogni singola parete riflettente presente nella scena acustica. Il modello geometrico del campo sonoro viene ottenuto sfruttando l’informazione sulla geometria e proprietà riflessive dell’ambiente ottenuti in precedenza. Infine, il sistema di riproduzione usa questo modello per generare il campo acustico desiderato compensando allo stesso tempo le riverberazioni indesiderate dell’ambiente che ospita il sistema. Vengono analizzati i aspetti teorici, implementativi e le prestazioni statistiche dei algoritmi proposti. La validità del approccio proposto va, tuttavia, oltre le applicazioni discusse in questa tesi. Efficienza, regolarità e generalità della rappresentazione, insieme alla prospettiva di una sempre maggiore disponibilità di sistemi basati su dei microfoni/altoparlanti integrati a basso costo, rendono le idee sviluppate in questa tesi interessanti per una vasta gamma di possibili applicazioni tra cui caratterizzazione e separazione delle sorgenti, estrapolazione del campo, ecc.
Tesi di dottorato
File allegati
File Dimensione Formato  
2013_03_PhD_Markovic.pdf

Open Access dal 02/02/2016

Descrizione: Testo della tesi
Dimensione 12.69 MB
Formato Adobe PDF
12.69 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/74481