Nowadays it is common to find devices equipped with multiple microphones, such as laptops, smatphones, personal assistant devices, in-car audio systems and IoT home appliances. The use of multiple microphones exploits the research in Array Signal Processing to extend the concept of filtering from the frequency to the spatial domain. This task, known as beamforming or spatial filtering, aims to achieve noise reduction and source separation which, combined with other techniques, make the application correctly capture the signal of interests (SOIs) while rejecting noise and interferers. There exists however a trade-off between high performance and low computational complexity. In particular, techniques based on sampling the covariance matrix are characterized by low computational complexity, but their performance is limited and far from the ideal case. In fact, they achieve a relatively good performance in either high or low SNR ranges. In this thesis, we propose a hybrid beamforming solution that combines two Sample Covariance Matrix (SCM)-based methods: one that is e cient for signals with high input SNR and one with low input SNR. In order to choose at every instant which algorithm is more suitable, we also propose a detector based on vector projections that acts as a SIR estimator. We design our solution for sparse linear microphone arrays, which allow us to perform more e cient computations with respect to a uniform linear geometry. In addition, sparse linear geometries are demonstrated to take advantage of benefits related to resolution and width of the aliasing-free frequency range. We test our solution on various noise conditions and compare it with methods from the state of the art. Results show that our SCM-based hybrid solution outperforms most SCM-based methods and exhibits a lower computational complexity, which makes our solution suitable for being deployed in devices with low computational resources.

Ad oggi, è comune trovare dispositivi dotati di più microfoni, come ad esempio laptop, smartphones, assistenti personali automatici, sistemi audio di autoveicoli e apparecchi per la domotica. L'utilizzo di più microfoni sfrutta il lavoro di ricerca svolto nell'Array Signal Processing per estendere il concetto di filtraggio dal dominio delle frequenze a un contesto spaziale. Questa tecnica, nota come beamforming, combinata ad altre operazioni mira ad ottenere una riduzione di rumore e interferenza mantenendo il segnale d'interesse. Esiste tuttavia un compromesso tra alti livelli di performance e bassa complessità computazionale. In particolare, le tecniche basate sulla stima della matrice di covarianza sono caratterizzate da una bassa complessità computazionale, ma la loro performance è limitata e lontana dal caso ideale. Infatti, esse ottengono buone prestazioni per valori alti o bassi del rapporto segnale rumore (SNR) in modo mutualmente esclusivo. In questa tesi si propone una soluzione ibrida di beamforming che combina due delle tecniche sopracitate, in modo che una sia efficace per bassi valori di SNR e l'altra per alti valori di SNR. Per decidere dinamicamente quale algoritmo utilizzare, proponiamo un detector che agisce come stima del SIR ed è basato sulle proiezioni relative a sottospazi vettoriali. La nostra soluzione adopera array di microfoni lineari sparsi, i quali permettono di ridurre la complessità computazionale rispetto ad un array lineare uniforme e presentano vantaggi significativi in termini di risoluzione e range di frequenze prive di aliasing. La nostra soluzione è testata per diverse condizioni di rumore e comparata con altri metodi dello stato dell'arte. I risultati mostrano che questo tipo di beamforming ibrido supera in performance altri metodi basati sulla stima della matrice di covarianza mantenendo una bassa complessità computazionale, rendendo dunque il nostro algoritmo un buon candidato per operare il beamforming su dispositivi con risorse computazionali limitate.

A hybrid approach for computationally-efficient beamforming using sparse linear microphone arrays

Balsarri, Davide
2019/2020

Abstract

Nowadays it is common to find devices equipped with multiple microphones, such as laptops, smatphones, personal assistant devices, in-car audio systems and IoT home appliances. The use of multiple microphones exploits the research in Array Signal Processing to extend the concept of filtering from the frequency to the spatial domain. This task, known as beamforming or spatial filtering, aims to achieve noise reduction and source separation which, combined with other techniques, make the application correctly capture the signal of interests (SOIs) while rejecting noise and interferers. There exists however a trade-off between high performance and low computational complexity. In particular, techniques based on sampling the covariance matrix are characterized by low computational complexity, but their performance is limited and far from the ideal case. In fact, they achieve a relatively good performance in either high or low SNR ranges. In this thesis, we propose a hybrid beamforming solution that combines two Sample Covariance Matrix (SCM)-based methods: one that is e cient for signals with high input SNR and one with low input SNR. In order to choose at every instant which algorithm is more suitable, we also propose a detector based on vector projections that acts as a SIR estimator. We design our solution for sparse linear microphone arrays, which allow us to perform more e cient computations with respect to a uniform linear geometry. In addition, sparse linear geometries are demonstrated to take advantage of benefits related to resolution and width of the aliasing-free frequency range. We test our solution on various noise conditions and compare it with methods from the state of the art. Results show that our SCM-based hybrid solution outperforms most SCM-based methods and exhibits a lower computational complexity, which makes our solution suitable for being deployed in devices with low computational resources.
BUCCOLI, MICHELE
PECORINO, SIMONE
ING - Scuola di Ingegneria Industriale e dell'Informazione
15-dic-2020
2019/2020
Ad oggi, è comune trovare dispositivi dotati di più microfoni, come ad esempio laptop, smartphones, assistenti personali automatici, sistemi audio di autoveicoli e apparecchi per la domotica. L'utilizzo di più microfoni sfrutta il lavoro di ricerca svolto nell'Array Signal Processing per estendere il concetto di filtraggio dal dominio delle frequenze a un contesto spaziale. Questa tecnica, nota come beamforming, combinata ad altre operazioni mira ad ottenere una riduzione di rumore e interferenza mantenendo il segnale d'interesse. Esiste tuttavia un compromesso tra alti livelli di performance e bassa complessità computazionale. In particolare, le tecniche basate sulla stima della matrice di covarianza sono caratterizzate da una bassa complessità computazionale, ma la loro performance è limitata e lontana dal caso ideale. Infatti, esse ottengono buone prestazioni per valori alti o bassi del rapporto segnale rumore (SNR) in modo mutualmente esclusivo. In questa tesi si propone una soluzione ibrida di beamforming che combina due delle tecniche sopracitate, in modo che una sia efficace per bassi valori di SNR e l'altra per alti valori di SNR. Per decidere dinamicamente quale algoritmo utilizzare, proponiamo un detector che agisce come stima del SIR ed è basato sulle proiezioni relative a sottospazi vettoriali. La nostra soluzione adopera array di microfoni lineari sparsi, i quali permettono di ridurre la complessità computazionale rispetto ad un array lineare uniforme e presentano vantaggi significativi in termini di risoluzione e range di frequenze prive di aliasing. La nostra soluzione è testata per diverse condizioni di rumore e comparata con altri metodi dello stato dell'arte. I risultati mostrano che questo tipo di beamforming ibrido supera in performance altri metodi basati sulla stima della matrice di covarianza mantenendo una bassa complessità computazionale, rendendo dunque il nostro algoritmo un buon candidato per operare il beamforming su dispositivi con risorse computazionali limitate.
File allegati
File Dimensione Formato  
Tesi_Balsarri_903265.pdf

non accessibile

Dimensione 17.11 MB
Formato Adobe PDF
17.11 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/171239