In the last decades, many models have been developed to replicate the acoustic properties of enclosed spaces in the field of digital artificial reverberation. Algorithms for room acoustics simulations require a balance between efficiency and accuracy. While wave-based models offer exceptional accuracy, they come with a hefty computational cost. On the other hand, delay network models usually lack physical accuracy. Scattering Delay Networks (SDNs) address this issue by means of a recursive structure that can reproduce precise First-Order Reflections (FORs) and approximate Higher-Order Reflections (HORs). In this work, we propose a highly effective solution to improve the accuracy of SDNs on HORs modeling through the integration of a machine learning algorithm based on automatic differentiation. After conducting a thorough analysis of the SDN architecture, we identify the parameters that mainly contribute to inaccuracy in HORs modeling. In order to improve this aspect, we propose differentiable SDNs that allow us to optimize the functional blocks of the architecture that have a considerable impact on the generation of Room Impulse Responses (RIRs). After successfully demonstrating the potentiality of the proposed approach, we employ the differentiable SDN to mimic the behavior of a RIR simulated exploiting PyRoomacoustics. The results show that the proposed method is able to improve the traditional SDN making it match a target RIR as far as energy decay curve and reverberation time are concerned.

Negli ultimi decenni, nel campo della modellazione di Reverberatori Artificiali Digitali (DAR) sono stati sviluppati molti modelli con l’obiettivo di replicare le proprietà acustiche degli spazi chiusi. Tuttavia, le simulazioni digitali dell’acustica ambientale presuppongono un bilanciamento tra efficienza e accuratezza: i modelli basati sul dominio delle onde raggiungono eccellenti livelli di precisione, ma sono caretterizzati da un elevato costo computazionale. D’altra parte, i modelli basati su reti di ritardo peccano di precisione fisica. L’architettura denominata Scattering Delay Network (SDN) si basa su una struttura ricorsiva in grado di riprodurre accuratamente le riflessioni del primo ordine (FORs) e di approssima e quelle di ordine superiore (HORs) con precisione sempre meno fedele all’aumentare dell’ordine di riflessione. In questo lavoro proponiamo una soluzione implementativa efficiente per il miglioramento dell’accuratezza della SDN attraverso l’integrazione di un algoritmo di Machine Learning (ML) basato sulla Differenziazione Automatica (AD). Dopo aver condotto un’analisi approfondita dell’architettura SDN, ci concentriamo sull’identificazione dei parametri che contribuiscono principalmente alla perdita di precisione riguardante la modellazione delle riflessioni di ordine superiore al primo. Per migliorare questo aspetto, introduciamo una versione di SDN differenziabile che ottimizza i blocchi funzionali dell’architettura che hanno un impatto diretto nella generazione di un risposta all’impulso (RIR) di una stanza preso come caso di studio. Dopo aver dimostrato con successo il corretto funzionamento del processo di ottimizzazione dei parametri, utilizziamo l’SDN differenziabile per imitare il comportamento di una RIR simulata attraverso l'interfaccia denominata PyRoomacoustics. La misurazione oggettiva delle Curve di Decadimento dell’Energia (EDC) mostra una stretta corrispondenza tra i risultati ottenuti utilizzando il metodo proposto e il modello di riferimento. Infine, mostriamo il consistente miglioramento nell’accuratezza raggiunta dall’architettura proposta rispetto al modello SDN classico utilizzando metriche specifiche come il Tempo di Riverbero (RT) e il Prediction Gain (PG).

Designing of scattering delay networks via automatic differentiation

Boarino, Francesco
2022/2023

Abstract

In the last decades, many models have been developed to replicate the acoustic properties of enclosed spaces in the field of digital artificial reverberation. Algorithms for room acoustics simulations require a balance between efficiency and accuracy. While wave-based models offer exceptional accuracy, they come with a hefty computational cost. On the other hand, delay network models usually lack physical accuracy. Scattering Delay Networks (SDNs) address this issue by means of a recursive structure that can reproduce precise First-Order Reflections (FORs) and approximate Higher-Order Reflections (HORs). In this work, we propose a highly effective solution to improve the accuracy of SDNs on HORs modeling through the integration of a machine learning algorithm based on automatic differentiation. After conducting a thorough analysis of the SDN architecture, we identify the parameters that mainly contribute to inaccuracy in HORs modeling. In order to improve this aspect, we propose differentiable SDNs that allow us to optimize the functional blocks of the architecture that have a considerable impact on the generation of Room Impulse Responses (RIRs). After successfully demonstrating the potentiality of the proposed approach, we employ the differentiable SDN to mimic the behavior of a RIR simulated exploiting PyRoomacoustics. The results show that the proposed method is able to improve the traditional SDN making it match a target RIR as far as energy decay curve and reverberation time are concerned.
GIAMPICCOLO, RICCARDO
MEZZA, ALESSANDRO ILIC
ING - Scuola di Ingegneria Industriale e dell'Informazione
19-lug-2023
2022/2023
Negli ultimi decenni, nel campo della modellazione di Reverberatori Artificiali Digitali (DAR) sono stati sviluppati molti modelli con l’obiettivo di replicare le proprietà acustiche degli spazi chiusi. Tuttavia, le simulazioni digitali dell’acustica ambientale presuppongono un bilanciamento tra efficienza e accuratezza: i modelli basati sul dominio delle onde raggiungono eccellenti livelli di precisione, ma sono caretterizzati da un elevato costo computazionale. D’altra parte, i modelli basati su reti di ritardo peccano di precisione fisica. L’architettura denominata Scattering Delay Network (SDN) si basa su una struttura ricorsiva in grado di riprodurre accuratamente le riflessioni del primo ordine (FORs) e di approssima e quelle di ordine superiore (HORs) con precisione sempre meno fedele all’aumentare dell’ordine di riflessione. In questo lavoro proponiamo una soluzione implementativa efficiente per il miglioramento dell’accuratezza della SDN attraverso l’integrazione di un algoritmo di Machine Learning (ML) basato sulla Differenziazione Automatica (AD). Dopo aver condotto un’analisi approfondita dell’architettura SDN, ci concentriamo sull’identificazione dei parametri che contribuiscono principalmente alla perdita di precisione riguardante la modellazione delle riflessioni di ordine superiore al primo. Per migliorare questo aspetto, introduciamo una versione di SDN differenziabile che ottimizza i blocchi funzionali dell’architettura che hanno un impatto diretto nella generazione di un risposta all’impulso (RIR) di una stanza preso come caso di studio. Dopo aver dimostrato con successo il corretto funzionamento del processo di ottimizzazione dei parametri, utilizziamo l’SDN differenziabile per imitare il comportamento di una RIR simulata attraverso l'interfaccia denominata PyRoomacoustics. La misurazione oggettiva delle Curve di Decadimento dell’Energia (EDC) mostra una stretta corrispondenza tra i risultati ottenuti utilizzando il metodo proposto e il modello di riferimento. Infine, mostriamo il consistente miglioramento nell’accuratezza raggiunta dall’architettura proposta rispetto al modello SDN classico utilizzando metriche specifiche come il Tempo di Riverbero (RT) e il Prediction Gain (PG).
File allegati
File Dimensione Formato  
Designing of Scattering Delay Netwroks via Automatic Differentiation Executive Summary.pdf

non accessibile

Descrizione: Executive Summary
Dimensione 1.04 MB
Formato Adobe PDF
1.04 MB Adobe PDF   Visualizza/Apri
Designing of Scattering Delay Netwroks via Automatic Differentiation.pdf

non accessibile

Descrizione: Thesis
Dimensione 2.6 MB
Formato Adobe PDF
2.6 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/211644