The majority of the state-of-the-art dereverberation algorithms focuses only on the reduction of the late reverberation, while early reflections are either preserved or suffer from slight modification. Thus, there is only few literature concerning explicitly the suppression of the early reflections and this work aims at filling this gap, by investigating their characteristics and developing an algorithm which can apply to hands-free speech communication devices. However, an important question is whether also human listeners would benefit from a reduction of the early reflections. For this purpose, before algorithms for dereverberation are reviewed and proposed, the influence of early reflections on the human sound perception was investigated by means of a listening test. Given a fixed reduction of the late reverberation, we tried to determine the minimum early reflections reduction level providing perceivable changes to a signal in terms of spectral coloration and source distance. It was also deduced that a certain suppression of the early reflections is preferred in typical communication scenarios. In this work, some state-of-the-art dereverberation methods based on the Minimum Variance Distortionless Response (MVDR) beamformer are reviewed by connecting all its different signal models in a common framework. An algorithm was finally designed by formulating a new model for the MVDR where the desired transfer function is the generalized mean over the transfer functions of the channels acquiring the signal. This allows to partially equalize the contributions of the reflections in the frequency domain. The proposed beamformer was then tested under several conditions. An accurate analysis of the improvement in terms of reflections reduction and signal quality was made and it was shown that the algorithm achieves both early reflections and late reverberation reduction, in addition to sound quality enhancement. Finally, the performance was compared with other state-of-the-art dereverberation methods.

La maggior parte degli algoritmi di dereverberazione si concentra esclusivamente sulla riduzione delle ultime riflessioni (late reverberation), mentre le prime riflessioni (early reflections) vengono preservate o subiscono modifiche minime. È infatti difficile trovare della letteratura che si riferisca esplicitamente alla riduzione delle prime riflessioni e il presente lavoro ha l'obiettivo di colmare questo gap attraverso un'indagine sulle caratteristiche delle suddette riflessioni e lo sviluppo di un algoritmo che le riduca e che quindi possa essere utilizzato da hands-free speech communication devices. Inoltre, risulta interessante scoprire qualora la riduzione delle prime riflessioni possa migliorare la comune esperienza d'ascolto. Per questo motivo, attraverso l'implementazione e conduzione di un test d'ascolto, è stato effettuato uno studio sull'influenza che le prime riflessioni esercitano sulla percezione umana del suono. Fissato un livello di soppressione delle ultime riflessioni, si è cercato di determinare quale sia il minimo livello di riduzione delle prime riflessioni tale per cui vengano percepite delle modifiche al segnale in termini di colorazione dello spettro e distanza della sorgente sonora. È stato possibile anche dedurre che la riduzione delle prime riflessioni costituisce un miglioramento dell'esperienza d'ascolto in tipici scenari di comunicazione. Nell'ambito di questa ricerca sono stati rivisitati gli algoritmi di dereverberazione basati sul Minimum Variance Distortionless Response (MVDR) beamformer e i loro modelli sono stati connessi all'interno di un unico framework. In seguito, è stato ideato un algoritmo che costituisce un nuovo modello di MVDR dove la funzione di trasferimento desiderata è data dalla media generalizzata delle funzioni di trasferimento dei microfoni che acquisiscono il segnale in input. Tale algoritmo permette la parziale equalizzazione del contributo dato dalle riflessioni nel dominio delle frequenze. Il beamformer proposto è stato successivamente testato in diverse condizioni acustiche. Un'attenta analisi dei risultati in termini di riduzione delle riflessioni e miglioramento della qualità del segnale ha mostrato che l'algoritmo riduce sia le prime che le ultime riflessioni, oltre a migliorare la qualità del segnale in input. Infine, le performance sono state comparate con quelle degli algoritmi di dereverberazione che costituiscono lo stato dell'arte.

Perception and reduction of early reflections using spatial filtering

MANZONE, GIAMMARCO
2015/2016

Abstract

The majority of the state-of-the-art dereverberation algorithms focuses only on the reduction of the late reverberation, while early reflections are either preserved or suffer from slight modification. Thus, there is only few literature concerning explicitly the suppression of the early reflections and this work aims at filling this gap, by investigating their characteristics and developing an algorithm which can apply to hands-free speech communication devices. However, an important question is whether also human listeners would benefit from a reduction of the early reflections. For this purpose, before algorithms for dereverberation are reviewed and proposed, the influence of early reflections on the human sound perception was investigated by means of a listening test. Given a fixed reduction of the late reverberation, we tried to determine the minimum early reflections reduction level providing perceivable changes to a signal in terms of spectral coloration and source distance. It was also deduced that a certain suppression of the early reflections is preferred in typical communication scenarios. In this work, some state-of-the-art dereverberation methods based on the Minimum Variance Distortionless Response (MVDR) beamformer are reviewed by connecting all its different signal models in a common framework. An algorithm was finally designed by formulating a new model for the MVDR where the desired transfer function is the generalized mean over the transfer functions of the channels acquiring the signal. This allows to partially equalize the contributions of the reflections in the frequency domain. The proposed beamformer was then tested under several conditions. An accurate analysis of the improvement in terms of reflections reduction and signal quality was made and it was shown that the algorithm achieves both early reflections and late reverberation reduction, in addition to sound quality enhancement. Finally, the performance was compared with other state-of-the-art dereverberation methods.
HABETS, EMANUEL
ING - Scuola di Ingegneria Industriale e dell'Informazione
27-lug-2016
2015/2016
La maggior parte degli algoritmi di dereverberazione si concentra esclusivamente sulla riduzione delle ultime riflessioni (late reverberation), mentre le prime riflessioni (early reflections) vengono preservate o subiscono modifiche minime. È infatti difficile trovare della letteratura che si riferisca esplicitamente alla riduzione delle prime riflessioni e il presente lavoro ha l'obiettivo di colmare questo gap attraverso un'indagine sulle caratteristiche delle suddette riflessioni e lo sviluppo di un algoritmo che le riduca e che quindi possa essere utilizzato da hands-free speech communication devices. Inoltre, risulta interessante scoprire qualora la riduzione delle prime riflessioni possa migliorare la comune esperienza d'ascolto. Per questo motivo, attraverso l'implementazione e conduzione di un test d'ascolto, è stato effettuato uno studio sull'influenza che le prime riflessioni esercitano sulla percezione umana del suono. Fissato un livello di soppressione delle ultime riflessioni, si è cercato di determinare quale sia il minimo livello di riduzione delle prime riflessioni tale per cui vengano percepite delle modifiche al segnale in termini di colorazione dello spettro e distanza della sorgente sonora. È stato possibile anche dedurre che la riduzione delle prime riflessioni costituisce un miglioramento dell'esperienza d'ascolto in tipici scenari di comunicazione. Nell'ambito di questa ricerca sono stati rivisitati gli algoritmi di dereverberazione basati sul Minimum Variance Distortionless Response (MVDR) beamformer e i loro modelli sono stati connessi all'interno di un unico framework. In seguito, è stato ideato un algoritmo che costituisce un nuovo modello di MVDR dove la funzione di trasferimento desiderata è data dalla media generalizzata delle funzioni di trasferimento dei microfoni che acquisiscono il segnale in input. Tale algoritmo permette la parziale equalizzazione del contributo dato dalle riflessioni nel dominio delle frequenze. Il beamformer proposto è stato successivamente testato in diverse condizioni acustiche. Un'attenta analisi dei risultati in termini di riduzione delle riflessioni e miglioramento della qualità del segnale ha mostrato che l'algoritmo riduce sia le prime che le ultime riflessioni, oltre a migliorare la qualità del segnale in input. Infine, le performance sono state comparate con quelle degli algoritmi di dereverberazione che costituiscono lo stato dell'arte.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2016_07_Manzone.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Testo della Tesi
Dimensione 6.68 MB
Formato Adobe PDF
6.68 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/123085