In the past few years, the problem of acoustic source separation using microphone arrays has gained interest in research and industry communities. The goal of this thesis is to develop a flexible methodology to address the problem, which is also able to manage multiple arrays distributed in the space. The use of multiple arrays allows us to capture truly global information about the sound field, but it is necessary to adopt a suitable representation for the signals. Among the different representation paradigms of the sound field present in the literature, we adopted a particular one inspired by geometrical acoustics, which is based on a description of the sound field in terms of acoustic rays. In particular, we have taken advantage of a powerful tool, known as ray space transform, in order to efficiently map the sound field information acquired by a microphone array onto a domain known as ray space. Points in this domain represent rays in the geometric space. Since we wanted to design a source separation approach able to manage multiple arrays, we could not directly use this tool, but a re-parametrization was necessary. The great advantage of this representation is that it gives a great insight on the acoustic scene under analysis and allows for a detailed design of the filtering process. The computation of the ray space representation trough this tool represents the step preceding that of the filter design and the actual filtering process, which are at the core of our system. The filter design is here approached as a two step procedure, which aims at minimising the interferences, while leaving undistorted the desired sound. The first step fully exploits the geometric intuition behind the ray space representation by selecting which elements in this domain should be kept and which discarded, while the second step is based on an optimization procedure. Another important advantage of the approach presented is that the overall filter design process needs only the position of the sources in the acoustic scene while no a-priori knowledge on the emitted signals is necessary. As a consequence, the filter coefficients can be easily precomputed and stored for a given set of positions. Through simulations and experiments we have proven that this approach is effective also in challenging acoustic scenes and that the use of multiple arrays brings great improvements concerning both the accuracy of the separation and the quality of the extracted signal.

Negli ultimi anni, il problema della separazione acustica di sorgenti utilizzando schiere di microfoni ha riscontrato un grande interesse sia da parte della comunità di ricerca che da parte dell'industria. L'obiettivo di questa tesi è lo sviluppo di una metodologia flessibile per affrontare questo problema, in grado di gestire più schiere microfoniche distribuite nello spazio. L'uso di più schiere infatti ci permette di ottenere maggiori informazioni sul campo sonoro, ma una adeguata rappresentazione dei segnali acquisiti dai microfoni deve essere adottata. Tra i diversi paradigmi di rappresentazione presenti nella letteratura, abbiamo scelto una rappresentazione ispirata all'acustica geometrica la quale si basa su una descrizione del campo sonoro in termini di raggi acustici. In particolare, abbiamo utilizzato la trasformata ray space, strumento in grado di mappare efficacemente le informazioni del campo sonoro acquisite tramite una schiera di microfoni in un dominio noto come spazio dei raggi. Punti in questo dominio rappresentano raggi nello spazio geometrico. Dovendo gestire più schiere microfoniche, non abbiamo potuto direttamente utilizzare la trasformata ray space, ma è stata necessaria una riparametrizzazione. Il grande vantaggio di questa rappresentazione è quello di fornire una visione intuitiva della scena acustica in analisi che consente quindi una progettazione dettagliata del processo di filtraggio. Il calcolo della rappresentazione del campo sonoro nello spazio dei raggi costituisce il passo che precede quello del progetto del filtro spaziale e della sua applicazione che costituiscono il fulcro del nostro sistema. Il progetto del filtro spaziale viene affrontato utilizzando una procedura divisa in due fasi consecutive, la quale mira a ridurre al minimo il contributo dei segnali interferenti lasciando al contempo inalterato quello del segnale desiderato. La prima fase sfrutta l'intuizione geometrica intrinseca nella rappresentazione nella spazio dei raggi andando a selezionare quali elementi in questo dominio vengono mantenuti e quali invece scartati, mentre la seconda è basata su una procedura di ottimizzazione. Un altro importante vantaggio dell'approccio presentato è che il processo di progettazione del filtro necessita solo della posizione delle fonti nella scena acustica mentre non è necessaria nessuna informazione sui segnali emessi. Di conseguenza, i coefficienti del filtro possono essere facilmente pre-calcolati e memorizzati per un determinato insieme di posizioni. Attraverso simulazioni ed esperimenti abbiamo dimostrato che questo approccio è efficace anche in scene acustiche difficili e che l'uso di più schiere porta grandi miglioramenti riguardanti sia l'accuratezza della separazione che la qualità del segnale estratto.

A flexible methodology for acoustic source extraction based on the ray space transform

BORRA, FEDERICO
2015/2016

Abstract

In the past few years, the problem of acoustic source separation using microphone arrays has gained interest in research and industry communities. The goal of this thesis is to develop a flexible methodology to address the problem, which is also able to manage multiple arrays distributed in the space. The use of multiple arrays allows us to capture truly global information about the sound field, but it is necessary to adopt a suitable representation for the signals. Among the different representation paradigms of the sound field present in the literature, we adopted a particular one inspired by geometrical acoustics, which is based on a description of the sound field in terms of acoustic rays. In particular, we have taken advantage of a powerful tool, known as ray space transform, in order to efficiently map the sound field information acquired by a microphone array onto a domain known as ray space. Points in this domain represent rays in the geometric space. Since we wanted to design a source separation approach able to manage multiple arrays, we could not directly use this tool, but a re-parametrization was necessary. The great advantage of this representation is that it gives a great insight on the acoustic scene under analysis and allows for a detailed design of the filtering process. The computation of the ray space representation trough this tool represents the step preceding that of the filter design and the actual filtering process, which are at the core of our system. The filter design is here approached as a two step procedure, which aims at minimising the interferences, while leaving undistorted the desired sound. The first step fully exploits the geometric intuition behind the ray space representation by selecting which elements in this domain should be kept and which discarded, while the second step is based on an optimization procedure. Another important advantage of the approach presented is that the overall filter design process needs only the position of the sources in the acoustic scene while no a-priori knowledge on the emitted signals is necessary. As a consequence, the filter coefficients can be easily precomputed and stored for a given set of positions. Through simulations and experiments we have proven that this approach is effective also in challenging acoustic scenes and that the use of multiple arrays brings great improvements concerning both the accuracy of the separation and the quality of the extracted signal.
BIANCHI, LUCIO
ING - Scuola di Ingegneria Industriale e dell'Informazione
29-set-2016
2015/2016
Negli ultimi anni, il problema della separazione acustica di sorgenti utilizzando schiere di microfoni ha riscontrato un grande interesse sia da parte della comunità di ricerca che da parte dell'industria. L'obiettivo di questa tesi è lo sviluppo di una metodologia flessibile per affrontare questo problema, in grado di gestire più schiere microfoniche distribuite nello spazio. L'uso di più schiere infatti ci permette di ottenere maggiori informazioni sul campo sonoro, ma una adeguata rappresentazione dei segnali acquisiti dai microfoni deve essere adottata. Tra i diversi paradigmi di rappresentazione presenti nella letteratura, abbiamo scelto una rappresentazione ispirata all'acustica geometrica la quale si basa su una descrizione del campo sonoro in termini di raggi acustici. In particolare, abbiamo utilizzato la trasformata ray space, strumento in grado di mappare efficacemente le informazioni del campo sonoro acquisite tramite una schiera di microfoni in un dominio noto come spazio dei raggi. Punti in questo dominio rappresentano raggi nello spazio geometrico. Dovendo gestire più schiere microfoniche, non abbiamo potuto direttamente utilizzare la trasformata ray space, ma è stata necessaria una riparametrizzazione. Il grande vantaggio di questa rappresentazione è quello di fornire una visione intuitiva della scena acustica in analisi che consente quindi una progettazione dettagliata del processo di filtraggio. Il calcolo della rappresentazione del campo sonoro nello spazio dei raggi costituisce il passo che precede quello del progetto del filtro spaziale e della sua applicazione che costituiscono il fulcro del nostro sistema. Il progetto del filtro spaziale viene affrontato utilizzando una procedura divisa in due fasi consecutive, la quale mira a ridurre al minimo il contributo dei segnali interferenti lasciando al contempo inalterato quello del segnale desiderato. La prima fase sfrutta l'intuizione geometrica intrinseca nella rappresentazione nella spazio dei raggi andando a selezionare quali elementi in questo dominio vengono mantenuti e quali invece scartati, mentre la seconda è basata su una procedura di ottimizzazione. Un altro importante vantaggio dell'approccio presentato è che il processo di progettazione del filtro necessita solo della posizione delle fonti nella scena acustica mentre non è necessaria nessuna informazione sui segnali emessi. Di conseguenza, i coefficienti del filtro possono essere facilmente pre-calcolati e memorizzati per un determinato insieme di posizioni. Attraverso simulazioni ed esperimenti abbiamo dimostrato che questo approccio è efficace anche in scene acustiche difficili e che l'uso di più schiere porta grandi miglioramenti riguardanti sia l'accuratezza della separazione che la qualità del segnale estratto.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2016_09_Borra.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Testo della tesi
Dimensione 5.3 MB
Formato Adobe PDF
5.3 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/125842