In this thesis we propose a psychoacoustic-based methodology to evaluate the artifacts introduced by sound field rendering systems. We show that the practical realization of rendering techniques like WFS and GR always causes some approximations that alter the rendered sound field. These approximations produce acoustic wave fronts that impinge on the listening area before (pre-echoes) and after (post-echoes) the desired wave front; since these additional wave fronts are concentrated in a short time window, they affect the perception of the timbre. Furthermore, the approximations also produce a distortion of the shape of the rendered wave fronts, causing an erroneous localization of the virtual sound source. We introduce a class of metrics aimed at characterizing the timbral distortion. In particular, our metrics are based on the psychoacoustic effect of masking in time domain and use on a masking threshold well known in the field of perceptual audio coding. We describe also a methodology that employs a generalized Hough Transform to estimate the position of a virtual source given the curvature of the wave fronts. This methodology allows us to evaluate the errors committed by a human listener in the localization of a virtual source, due to spatial artifacts introduced by the rendering system. Since our methodology requires the description of the sound field in terms of the space-time impulse response, we adopt a well known measurement methodology, based on a virtual microphone array; this methodology adopts CHD in order to extrapolate the sound field over the whole listening area. In order to obtain a subjective evaluation of rendering artifacts we have conducted formal listening tests aimed at an assessment of timbral and spatial artifacts. The results of the listening tests have a strong correlation with the results of the psychoacoustic-based evaluation methodology, thus we can conclude that our evaluation methodology is informative enough to be used in place of a more costly subjective assessment.

In questa tesi proponiamo una metodologia basata su considerazioni psico\-acustiche per valutare gli artefatti introdotti da sistemi di rendering di campi acustici. La realizzazione pratica di tecniche di rendering come WFS e GR provoca sempre delle approssimazioni che alterano il campo sonoro riprodotto. Queste approssimazioni causano fronti d'onda che impattano sull'area di ascolto prima (pre-echi) e dopo (post-echi) il fronte d'onda desiderato; considerato che questi fronti d'onda aggiuntivi sono concentrati in una finestra temporale corta, questi condizionano la percezione del timbro. Inoltre, le approssimazioni producono anche una distorsione della forma dei fronti d'onda, causando una localizzazione errata della sorgente sonora virtuale. Noi proponiamo una classe di metriche per caratterizzare la distorsione timbrica basate sull'effetto psicoacustico del mascheramento temporale e che usano una soglia di mascheramento mutuata dall'ambito della codifica percettiva dell'audio. Descriviamo anche una metodologia che utilizza una trasformata di Hough generalizzata per stimare la posizione di una sorgente virtuale data la curvatura dei fronti d'onda, permettendoci di valutare gli errori commessi da un ascoltatore nella localizzazione di una sorgente virtuale a causa degli artefatti spaziali introdotti dal sistema di rendering. Dal momento che la nostra metodologia richiede la conoscenza della risposta all'impulso spazio-temporale, adottiamo una metodologia di misura ben conosciuta, basata su una schiera virtuale di microfoni; scomponendo il campo in armoniche circolari (CHD) siamo in grado di estrapolare il campo acustico nell'intera area di ascolto. Per ottenere una valutazione soggettiva degli artefatti abbiamo condotto dei test di ascolto formali. Il risultato dei test di ascolto ha una forte correlazione con i risultati della metodologia proposta in questa tesi, così possiamo concludere che la nostra metodologia di valutazione è abbastanza informativa da poter essere usata al posto di una più costosa valutazione soggettiva.

Evaluation of artifacts in sound field rendering techniques : from an objective to a subjective approach

BIANCHI, LUCIO
2011/2012

Abstract

In this thesis we propose a psychoacoustic-based methodology to evaluate the artifacts introduced by sound field rendering systems. We show that the practical realization of rendering techniques like WFS and GR always causes some approximations that alter the rendered sound field. These approximations produce acoustic wave fronts that impinge on the listening area before (pre-echoes) and after (post-echoes) the desired wave front; since these additional wave fronts are concentrated in a short time window, they affect the perception of the timbre. Furthermore, the approximations also produce a distortion of the shape of the rendered wave fronts, causing an erroneous localization of the virtual sound source. We introduce a class of metrics aimed at characterizing the timbral distortion. In particular, our metrics are based on the psychoacoustic effect of masking in time domain and use on a masking threshold well known in the field of perceptual audio coding. We describe also a methodology that employs a generalized Hough Transform to estimate the position of a virtual source given the curvature of the wave fronts. This methodology allows us to evaluate the errors committed by a human listener in the localization of a virtual source, due to spatial artifacts introduced by the rendering system. Since our methodology requires the description of the sound field in terms of the space-time impulse response, we adopt a well known measurement methodology, based on a virtual microphone array; this methodology adopts CHD in order to extrapolate the sound field over the whole listening area. In order to obtain a subjective evaluation of rendering artifacts we have conducted formal listening tests aimed at an assessment of timbral and spatial artifacts. The results of the listening tests have a strong correlation with the results of the psychoacoustic-based evaluation methodology, thus we can conclude that our evaluation methodology is informative enough to be used in place of a more costly subjective assessment.
CANCLINI, ANTONIO
ING V - Scuola di Ingegneria dell'Informazione
25-lug-2012
2011/2012
In questa tesi proponiamo una metodologia basata su considerazioni psico\-acustiche per valutare gli artefatti introdotti da sistemi di rendering di campi acustici. La realizzazione pratica di tecniche di rendering come WFS e GR provoca sempre delle approssimazioni che alterano il campo sonoro riprodotto. Queste approssimazioni causano fronti d'onda che impattano sull'area di ascolto prima (pre-echi) e dopo (post-echi) il fronte d'onda desiderato; considerato che questi fronti d'onda aggiuntivi sono concentrati in una finestra temporale corta, questi condizionano la percezione del timbro. Inoltre, le approssimazioni producono anche una distorsione della forma dei fronti d'onda, causando una localizzazione errata della sorgente sonora virtuale. Noi proponiamo una classe di metriche per caratterizzare la distorsione timbrica basate sull'effetto psicoacustico del mascheramento temporale e che usano una soglia di mascheramento mutuata dall'ambito della codifica percettiva dell'audio. Descriviamo anche una metodologia che utilizza una trasformata di Hough generalizzata per stimare la posizione di una sorgente virtuale data la curvatura dei fronti d'onda, permettendoci di valutare gli errori commessi da un ascoltatore nella localizzazione di una sorgente virtuale a causa degli artefatti spaziali introdotti dal sistema di rendering. Dal momento che la nostra metodologia richiede la conoscenza della risposta all'impulso spazio-temporale, adottiamo una metodologia di misura ben conosciuta, basata su una schiera virtuale di microfoni; scomponendo il campo in armoniche circolari (CHD) siamo in grado di estrapolare il campo acustico nell'intera area di ascolto. Per ottenere una valutazione soggettiva degli artefatti abbiamo condotto dei test di ascolto formali. Il risultato dei test di ascolto ha una forte correlazione con i risultati della metodologia proposta in questa tesi, così possiamo concludere che la nostra metodologia di valutazione è abbastanza informativa da poter essere usata al posto di una più costosa valutazione soggettiva.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2012_07_Bianchi.PDF

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 15.81 MB
Formato Adobe PDF
15.81 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/56924