In the context of augmented/virtual reality, reproducing the directivity of sound sources is an important procedure to ensure a high-quality immersive experience. However, accurately measuring the directivity of a source with a large number of microphones proves to be challenging which is why these measurements are often sparsely sampled. Furthermore, applications in the VR/AR domain require access to directivity values in any arbitrary direction, which are not practically measurable in real-world scenarios. In these scenarios, the need of spatial interpolation schemes becomes evident, in order to reconstruct the sound field with optimal fidelity. However, current mathematical interpolation methods exhibit limitations, as they are designed for generic interpolation problems and lack an understanding of the underlying physics. In our work, we aim to exploit an approach based on deep learning. The demonstrated capabilities of deep learning methods in identifying complex patterns and models from processed data have made it a widely employed approach in various fields, including the acoustic domain. Currently, Physics-informed Neural Networks (PINN) are receiving particular attention from the scientific research within the acoustic engineering area, owing to their ability to capture and represent fundamental physical phenomena and thus better predict the evolution of dynamical systems. In this study, we propose a spatial interpolation scheme based on PINN for the reconstruction of sound source directivity. PINN are used to solve the Helmholtz equation starting from acquisitions of the directivity over a limited set of sparsely distributed points. Results are compared with the outcomes of well-established interpolation techniques: Spherical Harmonics Decomposition (SH), Thin Plate Pseudo-Spline Interpolation (SPLINE) and Piece-wise Linear Spherical Triangular Interpolation (TRI). The results highlight the promising capabilities of the PINN method in reconstructing the acoustic field of the sound sources taken into consideration, even when dealing with sparsely sampled grids. Notably, the PINN method demonstrated performance superiority in several instances, surpassing the effectiveness of the considered mathematical methods, which lack integrated physical information.

Nel campo della realtà aumentata/virtuale, la riproduzione della direttività delle sorgenti sonore è fondamentale per un’esperienza immersiva di qualità. Tuttavia, misurare accuratamente la direttività di una sorgente con un gran numero di microfoni non sempre risulta fattibile, motivo per cui queste misurazioni vengono spesso campionate con una distribuzione sparsa. Inoltre, le applicazioni nel dominio della VR/AR necessitano di valori di direttività in tutte le direzione arbitrariamente, cosa impossibile da misurare nel pratico. In questi casi, diventa evidente la necessità di schemi di interpolazione spaziale per ricostruire fedelmente il campo sonoro. Tuttavia, gli attuali metodi matematici di interpolazione presentano dei limiti, poiché sono ideati per problemi di interpolazione generici e non sfruttano in nessun modo le leggi fisiche che governano i sistemi presi in considerazione. Nel nostro lavoro, miriamo a sfruttare un approccio basato sul deep learning. Le capacità, dimostrate dai metodi di deep learning, nell’estrapoalre modelli complessi dai dati elaborati li hanno resi un approccio ampiamente impiegato in vari campi, incluso quello acustico. Attualmente, le Physics-informed Neural Networks (PINN) stanno ricevendo particolare attenzione da parte della ricerca scientifica nell’ambito dell’ingegneria acustica, grazie alla loro capacità di modellare e rappresentare i fenomeni fisici fondamentali e quindi prevedere meglio l’evoluzione dei sistemi dinamici. In questo studio, proponiamo uno schema di interpolazione spaziale basato sulle PINN per la ricostruzione della direttività delle sorgenti sonore. Le PINN vengono utilizzate per risolvere l’equazione di Helmholtz partendo dalle acquisizioni della direttività su un set limitato di punti distribuiti in modo sparso. I risultati vengono confrontati con quelli di tecniche di interpolazione ben consolidate: Spherical Harmonics Decomposition (SH), Thin Plate Pseudo-Spline Interpolation (SPLINE) e Piece-wise Linear Spherical Triangular Interpolation (TRI). I risultati evidenziano le promettenti capacità delle PINN nella ricostruzione del campo acustico delle sorgenti sonore prese in esame, anche quando si lavora con griglie campionate in modo sparso. In particolare, il metodo basato sulle PINN ha dimostrato una superiorità nelle prestazioni in diverse istanze, superando l’efficacia dei metodi matematici considerati, che mancano di informazioni fisiche integrate.

Sound source directivity interpolation with physics-informed neural networks

Morena, Edoardo
2023/2024

Abstract

In the context of augmented/virtual reality, reproducing the directivity of sound sources is an important procedure to ensure a high-quality immersive experience. However, accurately measuring the directivity of a source with a large number of microphones proves to be challenging which is why these measurements are often sparsely sampled. Furthermore, applications in the VR/AR domain require access to directivity values in any arbitrary direction, which are not practically measurable in real-world scenarios. In these scenarios, the need of spatial interpolation schemes becomes evident, in order to reconstruct the sound field with optimal fidelity. However, current mathematical interpolation methods exhibit limitations, as they are designed for generic interpolation problems and lack an understanding of the underlying physics. In our work, we aim to exploit an approach based on deep learning. The demonstrated capabilities of deep learning methods in identifying complex patterns and models from processed data have made it a widely employed approach in various fields, including the acoustic domain. Currently, Physics-informed Neural Networks (PINN) are receiving particular attention from the scientific research within the acoustic engineering area, owing to their ability to capture and represent fundamental physical phenomena and thus better predict the evolution of dynamical systems. In this study, we propose a spatial interpolation scheme based on PINN for the reconstruction of sound source directivity. PINN are used to solve the Helmholtz equation starting from acquisitions of the directivity over a limited set of sparsely distributed points. Results are compared with the outcomes of well-established interpolation techniques: Spherical Harmonics Decomposition (SH), Thin Plate Pseudo-Spline Interpolation (SPLINE) and Piece-wise Linear Spherical Triangular Interpolation (TRI). The results highlight the promising capabilities of the PINN method in reconstructing the acoustic field of the sound sources taken into consideration, even when dealing with sparsely sampled grids. Notably, the PINN method demonstrated performance superiority in several instances, surpassing the effectiveness of the considered mathematical methods, which lack integrated physical information.
MALVERMI, RAFFAELE
OLIVIERI, MARCO
ING - Scuola di Ingegneria Industriale e dell'Informazione
17-lug-2024
2023/2024
Nel campo della realtà aumentata/virtuale, la riproduzione della direttività delle sorgenti sonore è fondamentale per un’esperienza immersiva di qualità. Tuttavia, misurare accuratamente la direttività di una sorgente con un gran numero di microfoni non sempre risulta fattibile, motivo per cui queste misurazioni vengono spesso campionate con una distribuzione sparsa. Inoltre, le applicazioni nel dominio della VR/AR necessitano di valori di direttività in tutte le direzione arbitrariamente, cosa impossibile da misurare nel pratico. In questi casi, diventa evidente la necessità di schemi di interpolazione spaziale per ricostruire fedelmente il campo sonoro. Tuttavia, gli attuali metodi matematici di interpolazione presentano dei limiti, poiché sono ideati per problemi di interpolazione generici e non sfruttano in nessun modo le leggi fisiche che governano i sistemi presi in considerazione. Nel nostro lavoro, miriamo a sfruttare un approccio basato sul deep learning. Le capacità, dimostrate dai metodi di deep learning, nell’estrapoalre modelli complessi dai dati elaborati li hanno resi un approccio ampiamente impiegato in vari campi, incluso quello acustico. Attualmente, le Physics-informed Neural Networks (PINN) stanno ricevendo particolare attenzione da parte della ricerca scientifica nell’ambito dell’ingegneria acustica, grazie alla loro capacità di modellare e rappresentare i fenomeni fisici fondamentali e quindi prevedere meglio l’evoluzione dei sistemi dinamici. In questo studio, proponiamo uno schema di interpolazione spaziale basato sulle PINN per la ricostruzione della direttività delle sorgenti sonore. Le PINN vengono utilizzate per risolvere l’equazione di Helmholtz partendo dalle acquisizioni della direttività su un set limitato di punti distribuiti in modo sparso. I risultati vengono confrontati con quelli di tecniche di interpolazione ben consolidate: Spherical Harmonics Decomposition (SH), Thin Plate Pseudo-Spline Interpolation (SPLINE) e Piece-wise Linear Spherical Triangular Interpolation (TRI). I risultati evidenziano le promettenti capacità delle PINN nella ricostruzione del campo acustico delle sorgenti sonore prese in esame, anche quando si lavora con griglie campionate in modo sparso. In particolare, il metodo basato sulle PINN ha dimostrato una superiorità nelle prestazioni in diverse istanze, superando l’efficacia dei metodi matematici considerati, che mancano di informazioni fisiche integrate.
File allegati
File Dimensione Formato  
2024_07_Morena_Tesi.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 3.28 MB
Formato Adobe PDF
3.28 MB Adobe PDF Visualizza/Apri
2024_07_Morena_Executive Summary.pdf

accessibile in internet per tutti

Descrizione: Testo dell'Executive Summary
Dimensione 2.34 MB
Formato Adobe PDF
2.34 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/223039