In the field of audio production and reproduction, artificial reverberation have gained a main role over the last decades. Different approaches have been proposed but all of them face the trade-off between the need of reaching highly accurate results, and the necessity of avoiding heavy computational complexity. In particular, a compromise between these two targets is much more difficult to reach whenever we are dealing with a multi-channel Room Impulse Response (RIR). In order to investigate further in finding an optimal compromise, in this thesis, we present a method that can be contextualized in the middle between convolution techniques, that are accurate but computationally expensive, and Feedback Delay Networks (FDNs), that are highly efficient but rely on strong approximations. To fulfil the aim of matching a reference measured RIR, the procedure proposed in this thesis makes use of the Eigensystem Realization Algorithm, widely used in data-driven control applications, to obtain a state-space system description characterized by a set of matrices. The procedure includes a first step in which the target RIR is segmented, and then each one of the obtained segments is modeled in an independent fashion by using a dedicated state-space system and then applying different levels of model order reduction. As a result, a target RIR is described by a bank of state-space filters that are then used to process a generic dry input signal to which artificial reverberation has to be applied. The proposed block-wise implementation method can be applied both to SISO and MIMO RIRs. Moreover, it is extremely flexible, since, according to the chosen number of segments and the level of applied model order reduction allows us to adapt its computational complexity to the artificial reverberation scenario of interest. As a future development of this research work, we believe that the presented method paves the way towards more advanced block-based and computationally efficient artificial reverberators characterized by both state-space filters (accurately modeling early reflections) and FDNs (used for modeling late reverberations).

Negli ultimi decenni, il riverbero artificiale ha acquisito un ruolo principale nel campo della produzione e riproduzione audio. La comunità di ricerca ha proposto nel tempo approcci anche molto diversi tra loro, ma tutti comunque risentono dell’incompatibilità che caratterizza la necessità di raggiungere risultati altamente accurati e allo stesso tempo il bisogno di limitare la complessità computazionale. In particolare, nel caso dei sistemi multi-canale, questo trade-off tra le due esigenze è molto più difficile da raggiungere. Il metodo proposto, il cui fine è quello di indagare ulteriormente nella ricerca di un compromesso ottimale tra accuratezza e semplicità di calcolo, può essere contestualizzato nel mezzo tra le tecniche basate sull’utilizzo della convoluzione e i metodi approssimati che sfruttano sistemi composti da delay networks. Per raggiungere l’obiettivo di descrivere fedelmente in termini matriciali una Room Impulse Response (RIR) di riferimento, la procedura presentata in questa tesi fa uso dell’Eigensystem Realization Algorithm, un algoritmo ampiamente utilizzato per il controllo dei sistemi data-driven, la cui conoscenza si basa esclusivamente su un ampio set di dati provenienti da misurazioni e/o simulazioni. La procedura prevede una prima fase in cui la RIR di riferimento viene suddivisa in blocchi, i quali a loro volta possono essere trattati in maniera indipendente l’uno dall’altro applicando diversi livelli di riduzione della dimensione del modello. In questo modo, la RIR in esame viene rappresentata da un banco di filtri state-space descritti tramite matrici. Di conseguenza, questi filtri vengono poi utilizzati per processare un generico segnale di ingresso al quale dev’essere aggiunto del riverbero. Questo metodo di implementazione a blocchi può essere applicato in entrambi i casi SISO e MIMO e gode di un alto grado di flessibilità. Infatti, in base al numero di segmenti scelto e al livello di riduzione dell’ordine applicato, permette di adattare la propria complessità computazionale allo specifico scenario di riverbero artificiale considerato. Infine, come sviluppo futuro di questo lavoro di ricerca, riteniamo che il metodo proposto possa aprire la strada verso riverberatori artificiali più avanzati basati su implementazioni a blocchi, ed allo stesso tempo più efficienti dal punto di vista computazionale, in quanto caratterizzati sia dalla presenza di filtri state-space per la descrizione delle prime riflessioni, che da FDN, utilizzati per modellare invece la coda di riverbero.

Modeling multichannel room impulse responses using banks of state-space filters

Pantaleone, Agnese
2019/2020

Abstract

In the field of audio production and reproduction, artificial reverberation have gained a main role over the last decades. Different approaches have been proposed but all of them face the trade-off between the need of reaching highly accurate results, and the necessity of avoiding heavy computational complexity. In particular, a compromise between these two targets is much more difficult to reach whenever we are dealing with a multi-channel Room Impulse Response (RIR). In order to investigate further in finding an optimal compromise, in this thesis, we present a method that can be contextualized in the middle between convolution techniques, that are accurate but computationally expensive, and Feedback Delay Networks (FDNs), that are highly efficient but rely on strong approximations. To fulfil the aim of matching a reference measured RIR, the procedure proposed in this thesis makes use of the Eigensystem Realization Algorithm, widely used in data-driven control applications, to obtain a state-space system description characterized by a set of matrices. The procedure includes a first step in which the target RIR is segmented, and then each one of the obtained segments is modeled in an independent fashion by using a dedicated state-space system and then applying different levels of model order reduction. As a result, a target RIR is described by a bank of state-space filters that are then used to process a generic dry input signal to which artificial reverberation has to be applied. The proposed block-wise implementation method can be applied both to SISO and MIMO RIRs. Moreover, it is extremely flexible, since, according to the chosen number of segments and the level of applied model order reduction allows us to adapt its computational complexity to the artificial reverberation scenario of interest. As a future development of this research work, we believe that the presented method paves the way towards more advanced block-based and computationally efficient artificial reverberators characterized by both state-space filters (accurately modeling early reflections) and FDNs (used for modeling late reverberations).
BERNARDINI, ALBERTO
ING - Scuola di Ingegneria Industriale e dell'Informazione
9-giu-2021
2019/2020
Negli ultimi decenni, il riverbero artificiale ha acquisito un ruolo principale nel campo della produzione e riproduzione audio. La comunità di ricerca ha proposto nel tempo approcci anche molto diversi tra loro, ma tutti comunque risentono dell’incompatibilità che caratterizza la necessità di raggiungere risultati altamente accurati e allo stesso tempo il bisogno di limitare la complessità computazionale. In particolare, nel caso dei sistemi multi-canale, questo trade-off tra le due esigenze è molto più difficile da raggiungere. Il metodo proposto, il cui fine è quello di indagare ulteriormente nella ricerca di un compromesso ottimale tra accuratezza e semplicità di calcolo, può essere contestualizzato nel mezzo tra le tecniche basate sull’utilizzo della convoluzione e i metodi approssimati che sfruttano sistemi composti da delay networks. Per raggiungere l’obiettivo di descrivere fedelmente in termini matriciali una Room Impulse Response (RIR) di riferimento, la procedura presentata in questa tesi fa uso dell’Eigensystem Realization Algorithm, un algoritmo ampiamente utilizzato per il controllo dei sistemi data-driven, la cui conoscenza si basa esclusivamente su un ampio set di dati provenienti da misurazioni e/o simulazioni. La procedura prevede una prima fase in cui la RIR di riferimento viene suddivisa in blocchi, i quali a loro volta possono essere trattati in maniera indipendente l’uno dall’altro applicando diversi livelli di riduzione della dimensione del modello. In questo modo, la RIR in esame viene rappresentata da un banco di filtri state-space descritti tramite matrici. Di conseguenza, questi filtri vengono poi utilizzati per processare un generico segnale di ingresso al quale dev’essere aggiunto del riverbero. Questo metodo di implementazione a blocchi può essere applicato in entrambi i casi SISO e MIMO e gode di un alto grado di flessibilità. Infatti, in base al numero di segmenti scelto e al livello di riduzione dell’ordine applicato, permette di adattare la propria complessità computazionale allo specifico scenario di riverbero artificiale considerato. Infine, come sviluppo futuro di questo lavoro di ricerca, riteniamo che il metodo proposto possa aprire la strada verso riverberatori artificiali più avanzati basati su implementazioni a blocchi, ed allo stesso tempo più efficienti dal punto di vista computazionale, in quanto caratterizzati sia dalla presenza di filtri state-space per la descrizione delle prime riflessioni, che da FDN, utilizzati per modellare invece la coda di riverbero.
File allegati
File Dimensione Formato  
Tesi_Pantaleone.pdf

non accessibile

Dimensione 3.26 MB
Formato Adobe PDF
3.26 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/175082