A high directivity beamforming for speech enhancement based on a micro array of MEMS microphones

Many emerging applications require robust algorithms for speech enhancement which can have high computational cost and are implemented using several professional grade microphones. These large arrays, composed of many microphones, restrict possible system applications due to costs and invasiveness. The main purpose of this thesis is to design and develop a system for speech enhancement in noisy environments by isolating a voice coming from a certain direction from noise coming from other directions. The thesis describes the development and implementation of a high directivity beamformer system based on a micro array of digital MEMS microphones with PDM output arranged in a compact square structure. Several beamforming algorithms for our microphone array architecture have been investigated and implemented. Based on this preliminary analysis, Differential Microphone Array (DMA) techniques are adopted. In order to create a more robust application and increase the SNR, an adaptive post-filtering stage based on the Multidelay block frequency domain (MDF) adaptive filter is inserted in the Generalized Side-lobe Canceller (GSC) structure. The last stage of the system is composed of a single channel noise reduction implemented via an alternative version of the Ephraim Malah suppression rule. This block is designed to remove all the residual noise and increase the intelligibility of speech. The algorithms have been implemented on a board, based on STM32 microcontroller. The hardware system acquires the corrupted acoustic signal and streams the enhanced speech in real time. Results show that even an architecture based on two very close MEMS microphones can improve the quality of speech in a noisy environment with low computational costs.

Molte applicazioni emergenti richiedono algoritmi robusti per il miglioramento del segnale parlato i quali possono avere un elevato costo computazionale ed essere attuati utilizzando molteplici microfoni di alta qualità. Array di grandi dimensioni composti da molti microfoni riducono le possibili applicazioni del sistema a causa del loro costo e della loro invasività. L’obiettivo della tesi è migliorare la percezione del segnale parlato in ambienti rumorosi isolando il segnale parlato proveniente da una determinata direzione dal rumore proveniente da altre direzioni. La tesi descrive la progettazione e realizzazione di un sistema di beamforming direttivo basato su un micro array di microfoni digitali MEMS con uscita PDM disposti su una compatta struttura quadrata. A tale fine, sono stati studiati ed implementati diversi algoritmi di beamforming per la nostra architettura di array di microfoni. Sulla base di questa analisi preliminare, vengono adottate le tecniche Differential Microphone Array (DMA). Con lo scopo di realizzare un'applicazione più robusta ed aumentare il Rapporto Segnale Rumore, è stato inserito un filtro adattivo basato sull'algoritmo Multidelay block frequency domain (MDF) nella struttura Generalized Side-lobe Canceller (GSC). L'ultimo blocco del sistema è composto da un riduttore di rumore su un singolo canale implementato mediante una versione alternativa della regola di soppressione di Ephraim Malah. Questo blocco è progettato per rimuovere tutto il rumore residuo e aumentare l'intelligibilità del segnale parlato. Gli algoritmi sono stati implementati su una scheda digitale basata sul microcontrollore STM32. Il sistema hardware acquisisce il segnale acustico e invia in uscita il segnale migliorato in tempo reale. Dai risultati si evince che anche un'architettura basata su due microfoni MEMS molto vicini può migliorare la qualità del segnale vocale in un ambiente rumoroso mantenendo basso il costo computazionale.