This thesis aims at developing a new approach for denoising a sound- field that ensures the preservation of the spatial information. During the last decades the interest in capturing, manipulating and rendering 3D acoustic scenes has been grown thanks to the access to new acquisition devices, like spherical microphone arrays, and new methodologies for the representation of the spatial sound field. In some cases the recorded sound scene can be affected from noise or undesired sources. In this the- sis is presented a methodology that approximates the sound field as if the noise were not present including its spatial informations. Moreover the overall denoising algorithm is indipendent from any rendering system, thanks to the adopted domain, the spherical harmonic domain, for both the representation and the manipulation of the acoustic scene. In detail, the soundfield acquired by a spherical microphone array is mapped in the spherical harmonic domain through a linear transformation. This domain is convenient for representing the spatial cues of the soundfields, in particular given the choice we have made for the acquisition technique. First source extraction is achieved through a properly designed spatial filter, also called beamformer. It is formulated in the spherical harmonic domain and combines linearly the spherical harmonic coefficients for en- hancing the desired signal arriving from the desired source’s direction of arrival, estimated in a precedent analysis stage. The spatiality is restored through the application of a bank of filters. In particular the beamformer result acts as input signal for an adaptive filter, while each coefficient of the acquired soundfield corresponds to the desired signal. The final rep- resentation of the enhanced soundfield is obtained from the results of this filtering operation. The properties of the adopted representation allow us to perform the adaptive filtering effectively and efficiently. The overall system has been tested simulating a set of simple soundscenes composed of a single source and two types of noise, directional and spatially diffuse, with different reverberation time and signal to noise ratio. The results of the tests suggest that this technique is well-founded and effective. More- over the underlying principle can be exploited in the future for more complex applications.

L’obiettivo di questa tesi è lo sviluppo di un nuovo approccio per il de- noising di un campo sonoro disturbato da rumore garantendo la con- servazione della spazialità. Negli ultimi decenni si è sviluppato sempre più l’interesse per la registrazione, manipolazione e riproduzione di scene acustiche tridimensionali grazie allo sviluppo di nuovi dispositivi di ac- quisizione, come array di microfoni, e di nuove tecnologie per la rappre- sentazione del campo sonoro tridimensionale. Se la registrazione non è effettuata in condizioni ottimali la scena sonora catturata potrebbe essere corrotta da un rumore o da fonti indesiderate. Questa tesi propone una metodologia che approssima il campo sonoro privo di rumore incluse tutte le informazioni spaziali. L’algoritmo proposto è indipendente da un pos- sibile successivo sistema di rendering grazie all’utilizzo del dominio delle armoniche sferiche sia per la rappresentazione che per la manipolazione della scena sonora. Scendendo in dettaglio, il campo sonoro acquisito da una schiera sferica di microfoni è mappato nel dominio delle armoniche sferiche grazie ad una trasformazione lineare. Questo rappresentazione è particolarmente utile per rappresentare le proprietà spaziali di un campo sonoro, in particolar data la tecnica di acquisizione scelta. L’estrazione della sorgente viene eseguita da un filtro spaziale, anche detto beam- former. È formulato nel dominio delle armoniche sferiche e combina linearmente i coefficienti ottenuti dalla precedente trasformazione per estrarre il segnale desiderato proveniente dalla direzione di arrivo della sorgente desiderata, stimata in una precedente fase di analisi. La spazial- ità viene ripristinata attraverso una serie di filtri adattivi. Il risultato del beamformer è presentato all’ingresso di ogni filtro adattativo, mentre ciascun coefficiente del campo acquisito agisce come segnale desiderato. Le proprietà del dominio delle armoniche sferiche consentono di eseguire il filtraggio adattivo in modo efficace ed efficiente. Il risultato finale, cioè una approssimazione della rappresentazione spaziale del campo privo di rumore, è ottenuto a partire dai risultati Il sistema generale è stato tes- tato simulando una serie di scene acustiche composte da una singola sor- gente e da due tipi di rumore, direzionale e spazialmente diffuso, variando i parametri per il riverbero e il rapporto segnale-rumore. I risultati dei test suggeriscono che questa tecnica è valida e che il principio delineato può essere sfruttato in applicazioni più complesse.

Denoising in the spherical harmonic domain of sound scenes acquired by compact arrays

BORRELLI, CLARA
2016/2017

Abstract

This thesis aims at developing a new approach for denoising a sound- field that ensures the preservation of the spatial information. During the last decades the interest in capturing, manipulating and rendering 3D acoustic scenes has been grown thanks to the access to new acquisition devices, like spherical microphone arrays, and new methodologies for the representation of the spatial sound field. In some cases the recorded sound scene can be affected from noise or undesired sources. In this the- sis is presented a methodology that approximates the sound field as if the noise were not present including its spatial informations. Moreover the overall denoising algorithm is indipendent from any rendering system, thanks to the adopted domain, the spherical harmonic domain, for both the representation and the manipulation of the acoustic scene. In detail, the soundfield acquired by a spherical microphone array is mapped in the spherical harmonic domain through a linear transformation. This domain is convenient for representing the spatial cues of the soundfields, in particular given the choice we have made for the acquisition technique. First source extraction is achieved through a properly designed spatial filter, also called beamformer. It is formulated in the spherical harmonic domain and combines linearly the spherical harmonic coefficients for en- hancing the desired signal arriving from the desired source’s direction of arrival, estimated in a precedent analysis stage. The spatiality is restored through the application of a bank of filters. In particular the beamformer result acts as input signal for an adaptive filter, while each coefficient of the acquired soundfield corresponds to the desired signal. The final rep- resentation of the enhanced soundfield is obtained from the results of this filtering operation. The properties of the adopted representation allow us to perform the adaptive filtering effectively and efficiently. The overall system has been tested simulating a set of simple soundscenes composed of a single source and two types of noise, directional and spatially diffuse, with different reverberation time and signal to noise ratio. The results of the tests suggest that this technique is well-founded and effective. More- over the underlying principle can be exploited in the future for more complex applications.
ANTONACCI, FABIO
ING - Scuola di Ingegneria Industriale e dell'Informazione
18-apr-2018
2016/2017
L’obiettivo di questa tesi è lo sviluppo di un nuovo approccio per il de- noising di un campo sonoro disturbato da rumore garantendo la con- servazione della spazialità. Negli ultimi decenni si è sviluppato sempre più l’interesse per la registrazione, manipolazione e riproduzione di scene acustiche tridimensionali grazie allo sviluppo di nuovi dispositivi di ac- quisizione, come array di microfoni, e di nuove tecnologie per la rappre- sentazione del campo sonoro tridimensionale. Se la registrazione non è effettuata in condizioni ottimali la scena sonora catturata potrebbe essere corrotta da un rumore o da fonti indesiderate. Questa tesi propone una metodologia che approssima il campo sonoro privo di rumore incluse tutte le informazioni spaziali. L’algoritmo proposto è indipendente da un pos- sibile successivo sistema di rendering grazie all’utilizzo del dominio delle armoniche sferiche sia per la rappresentazione che per la manipolazione della scena sonora. Scendendo in dettaglio, il campo sonoro acquisito da una schiera sferica di microfoni è mappato nel dominio delle armoniche sferiche grazie ad una trasformazione lineare. Questo rappresentazione è particolarmente utile per rappresentare le proprietà spaziali di un campo sonoro, in particolar data la tecnica di acquisizione scelta. L’estrazione della sorgente viene eseguita da un filtro spaziale, anche detto beam- former. È formulato nel dominio delle armoniche sferiche e combina linearmente i coefficienti ottenuti dalla precedente trasformazione per estrarre il segnale desiderato proveniente dalla direzione di arrivo della sorgente desiderata, stimata in una precedente fase di analisi. La spazial- ità viene ripristinata attraverso una serie di filtri adattivi. Il risultato del beamformer è presentato all’ingresso di ogni filtro adattativo, mentre ciascun coefficiente del campo acquisito agisce come segnale desiderato. Le proprietà del dominio delle armoniche sferiche consentono di eseguire il filtraggio adattivo in modo efficace ed efficiente. Il risultato finale, cioè una approssimazione della rappresentazione spaziale del campo privo di rumore, è ottenuto a partire dai risultati Il sistema generale è stato tes- tato simulando una serie di scene acustiche composte da una singola sor- gente e da due tipi di rumore, direzionale e spazialmente diffuso, variando i parametri per il riverbero e il rapporto segnale-rumore. I risultati dei test suggeriscono che questa tecnica è valida e che il principio delineato può essere sfruttato in applicazioni più complesse.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
thesis.pdf

Open Access dal 05/04/2021

Descrizione: Testo della tesi
Dimensione 8.56 MB
Formato Adobe PDF
8.56 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/139075