Wind noise often degrades outdoor speech signals recordings and transmissions, whose quality and intelligibility are impaired by low-frequency rumbling artifacts caused by the wind stream. The temporal high non-stationarity of wind noise leads to the exigency of designing dedicated reduction algorithms, where common background noise reduction schemes provide insufficient suppression. In this thesis a fluid-dynamic model, namely the Corcos model, is exploited to approximate the complex coherence of wind noise signals measured with arrays of closely-spaced microphones. Preliminary experiments focus on a spatial analysis of multichannel wind noise signals, validating the Corcos model for diverse configuration set-ups. The aforementioned model is subsequently used to synthetically generate wind noise signals exhibiting the sought complex coherence and to design a novel multichannel wind noise reduction algorithm for speech enhancement. The artificial generation overcomes the time-consuming challenges of collecting wind noise samples for noise reduction evaluations and provides flexibility in the number of generated signals and microphone used in the simulations. Temporal, spectral and spatial characteristics of the artificially generated signals are comparable to the measured wind noise and a perceptual satisfaction is achieved. The proposed reduction algorithm exploits a parametric multichannel Wiener filter to spatially enhance the desired speech signal and subsequently reduce the spectral components associated to wind noise residuals degradation. The estimation of the wind noise power spectral density is performed assuming the complex coherence of the wind noise contributions as defined by the Corcos model, or can be further adapted for uncorrelated wind noise. To assess the improvements of the proposed approach, various simulations are performed: experimental results show the efficiency of the proposed reduction algorithm compared to an existing multichannel approach. Additionally, comparable performance for measured and artificial wind noise further validates the feasibility of using synthetically generated wind noise signals in reduction simulations.
Il rumore del vento è spesso causa di degradazioni che affliggono la registrazione e la trasmissione di segnali vocali all'esterno. La qualità e l'intellegibilità di questi ultimi vengono compromesse da artefatti caratterizzati da rumore a bassa frequenza, causato dall'interazione del flusso del vento con il dispositivo utilizzato per l'acquisizione audio. L'elevata non-stazionarietà del rumore del vento temporale comporta l'esigenza di progettare algoritmi di riduzione del rumore specificatamente dedicati, dove schemi di riduzione di rumore di fondo esistenti forniscono performance insufficienti. In questo lavoro di tesi, un modello fluidodinamico chiamato modello di Corcos viene adoperato per approssimare la coerenza complessa di segnali di rumore del vento acquisiti da array microfonici con esigua interdistanza tra i sensori. Esperimenti preliminari mirano all'analisi spaziale dei segnali di rumore del vento acquisiti con due microfoni, validando il modello di Corcos. Il modello citato è successivamente utilizzato per generare segnali artificiali multi-microfonici di rumore del vento, caratterizzati da una coerenza complessa approssimata dal modello di Corcos. La generazione artificiale è atta a superare le difficoltà nel collezionare campioni isolati di rumore del vento (necessari alla valutazione delle performance degli algoritmi di riduzione) e a fornire flessibilità nel numero di segnali generati e microfoni utilizzati nelle simulazioni. Il generatore multi-canale proposto fornisce segnali sintetici con caratteristiche temporali, spettrali e spaziali affini a quelle del rumore del vento reale, nonchè un suono percettivamente naturale. Infine, tale modello viene sfruttato per la progettazione di un algoritmo di riduzione del rumore del vento focalizzato al miglioramento di segnali vocali degradati dal rumore in esame. Il metodo di riduzione proposto sfrutta un filtro di Wiener parametrico multi-canale, atto al miglioramento del segnale vocale a livello spaziale e alla riduzione delle componenti spettrali associate alle degradazioni residue del rumore del vento. La fase di stima della densità spettrale di potenza del rumore del vento utilizza l'approssimazione del modello di Corcos per la coerenza complessa del rumore. Per determinare i miglioramenti apportati dall'algoritmo proposto, diverse configurazioni vengono simulate: risultati sperimentali mostrano l'efficienza del metodo proposto rispetto ad un algoritmo dello stato dell'arte in termini di incremento di qualità, intellegibilità e rapporto segnale-rumore. Inoltre, performance comparabili dell'algoritmo applicato rispettivamente a rumore artificiale e reale dimostrano l'affidabilità nell'utilizzo di segnali di rumore del vento sintetici per simulazioni di riduzione.
Multichannel wind noise reduction
MIRABILII, DANIELE
2016/2017
Abstract
Wind noise often degrades outdoor speech signals recordings and transmissions, whose quality and intelligibility are impaired by low-frequency rumbling artifacts caused by the wind stream. The temporal high non-stationarity of wind noise leads to the exigency of designing dedicated reduction algorithms, where common background noise reduction schemes provide insufficient suppression. In this thesis a fluid-dynamic model, namely the Corcos model, is exploited to approximate the complex coherence of wind noise signals measured with arrays of closely-spaced microphones. Preliminary experiments focus on a spatial analysis of multichannel wind noise signals, validating the Corcos model for diverse configuration set-ups. The aforementioned model is subsequently used to synthetically generate wind noise signals exhibiting the sought complex coherence and to design a novel multichannel wind noise reduction algorithm for speech enhancement. The artificial generation overcomes the time-consuming challenges of collecting wind noise samples for noise reduction evaluations and provides flexibility in the number of generated signals and microphone used in the simulations. Temporal, spectral and spatial characteristics of the artificially generated signals are comparable to the measured wind noise and a perceptual satisfaction is achieved. The proposed reduction algorithm exploits a parametric multichannel Wiener filter to spatially enhance the desired speech signal and subsequently reduce the spectral components associated to wind noise residuals degradation. The estimation of the wind noise power spectral density is performed assuming the complex coherence of the wind noise contributions as defined by the Corcos model, or can be further adapted for uncorrelated wind noise. To assess the improvements of the proposed approach, various simulations are performed: experimental results show the efficiency of the proposed reduction algorithm compared to an existing multichannel approach. Additionally, comparable performance for measured and artificial wind noise further validates the feasibility of using synthetically generated wind noise signals in reduction simulations.| File | Dimensione | Formato | |
|---|---|---|---|
|
tesi_853203_MIRABILII_DANIELE.pdf
solo utenti autorizzati dal 05/04/2021
Descrizione: Testo della tesi
Dimensione
4.92 MB
Formato
Adobe PDF
|
4.92 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/139033