Convolution has become a largely exploited signal operation thanks to his several applications in digital signal processing. In the realm of audio elaboration, convolution has the particular meaning of imposing a spectral and temporal structure onto a sound. These structures are completely given by the signal with which the signal is being convolved, called Impulse Response These signals contain a sort of acoustical footprint that can be completely transferred to another sound, earning the same acoustic characteristics as a consequence. With a multichannel approach, convolution assumes even a further meaning and a wider application field. Indeed, it's exploited to deal with modern spatial sound techniques such as Ambisonics which necessitate matrix elaborations of the involved signals. Ambisonics recordings, for example, are made by special coincident multi-capsule microphone arrays, whose signals can be converted to standard Ambisonics format by a multi-channel convolver. A similar concept can apply to the mixing stage of audio production, where direction-based audio objects must be converted to the Ambisonics format to be reproduced in the relative speaker setups. Multi-signal convolver applications go further and may adopt particular matrices to achieve super-directional microphones or to design a speaker whose acoustic waves directionality is based on a musician's motions and rotations on the stage. Even more, these particular multi-capsules microphones and multi-speakers diffusers can be combined to obtain a brand new way acoustic characterization of closed environments. This method grants a collection of special matrices called MIMO IR, which can be exploited for various applications as a new approach for acoustical analysis and a new way for spatial sounds enrichment. Concerning convolution, this has historically found difficulties to be implemented for his high computational demand with large Impulse Response. Over the past years, there have been numerous algorithms attempting to overcome this issue by even implementing convolution with a multiple-channel approach. Another nowadays problem is to find a standard way to manage IR matrices, it's being currently researched a technique to store all the individual filters of the matrix in one single file in such a way to also simplify the loading phase for end-user employing. This work is intended to analyze an open-source development of a multi-channel convolver with special attention to the matrix loading stage to ease the job of the matrix creators and inexpert users.

La convoluzione è un'operazione tra segnali ampiamente utilizzata per le sue numerose applicazioni nell'elaborazione di segnali digitali. Nel campo audio, la convoluzione ricopre un ruolo importante in quanto ha la particolare funzione di modificare le caratteristiche temporali e spettrali di un suono. Queste alterazioni sono definite nella loro totalità dal segnale con il quale la convoluzione è applicata, chiamato Risposta all'Impulso. Questi segnali, infatti, contengono una sorta di impronta acustica che può essere trasferita completamente a un altro suono, che ne acquisirà le sue proprietà. Se inserita in un contesto multicanale, la convoluzione assume significati ulteriori e il campo di applicazioni si allarga. Questo tipo di approccio viene utilizzato infatti per gestire le moderne tecniche di suono spaziale come ad esempio Ambisonics, che richiede un'elaborazione matriciale dei segnali coinvolti. Le registrazioni per ottenere questa spazializzazione necessitano di speciali array di microfoni con capsule coincidenti; i segnali provenienti da ogni capsula vanno poi convertiti nel formato standard di Ambisonics mediante l'uso di convolutori multicanale. Un concetto simile si applica anche in una situazione di missaggio di una produzione audio, dove oggetti sonori posizionati nello spazio devono essere convertiti nel formato Ambisonics per poter essere riprodotti nella configurazione di altoparlanti corrispondente. L'uso di particolari matrici, permette inoltre ai convolutori di segnali multipli di ottenere microfoni iper-direzionali, o di progettare diffusori la cui direzionalità delle onde acustiche può essere relativa ai movimenti reali di un musicista sul palco. In secondo luogo, specifici array di microfoni e array di altoparlanti possono essere combinati insieme per ottenere una modalità completamente nuova per caratterizzare acusticamente gli ambienti chiusi. Questo metodo, permette di acquisire matrici di Risposte all'Impulso chiamate MIMO, che possono essere sfruttate in numerose applicazioni di analisi acustica e di arricchimento del suono spaziale. Per quanto riguarda il processo stesso di convoluzione, i metodi tradizionali per la sua implementazione sono stati fonte di problematiche in presenza di lunghe Risposte all'Impulso a causa del grande carico computazionale che richiedevano. Negli anni, sono stati sviluppati diversi algoritmi per compensare questo problema e riuscire anche a realizzare convolutori multicanale. Un altro problema odierno, riguarda la standardizzazione della gestione delle matrici in file unici, in modo da semplificare contemporaneamente il caricamento nei convolutori da parte dell'utente finale e la loro realizzazione da parte degli sviluppatori. Questo lavoro si prefigge di analizzare un'esistente realizzazione open-source di un convolutore multicanale, con un'attenzione particolare alla fase di caricamento delle matrici. Nel contesto verrà esaminato anche l'algoritmo implementato per il processo di convoluzione, migliorandone eventualmente le prestazioni.

A practical implementation of non-equal partitioned multi-channel convolver. A tool for spatial audio applications

BATTISTI, LUCA
2019/2020

Abstract

Convolution has become a largely exploited signal operation thanks to his several applications in digital signal processing. In the realm of audio elaboration, convolution has the particular meaning of imposing a spectral and temporal structure onto a sound. These structures are completely given by the signal with which the signal is being convolved, called Impulse Response These signals contain a sort of acoustical footprint that can be completely transferred to another sound, earning the same acoustic characteristics as a consequence. With a multichannel approach, convolution assumes even a further meaning and a wider application field. Indeed, it's exploited to deal with modern spatial sound techniques such as Ambisonics which necessitate matrix elaborations of the involved signals. Ambisonics recordings, for example, are made by special coincident multi-capsule microphone arrays, whose signals can be converted to standard Ambisonics format by a multi-channel convolver. A similar concept can apply to the mixing stage of audio production, where direction-based audio objects must be converted to the Ambisonics format to be reproduced in the relative speaker setups. Multi-signal convolver applications go further and may adopt particular matrices to achieve super-directional microphones or to design a speaker whose acoustic waves directionality is based on a musician's motions and rotations on the stage. Even more, these particular multi-capsules microphones and multi-speakers diffusers can be combined to obtain a brand new way acoustic characterization of closed environments. This method grants a collection of special matrices called MIMO IR, which can be exploited for various applications as a new approach for acoustical analysis and a new way for spatial sounds enrichment. Concerning convolution, this has historically found difficulties to be implemented for his high computational demand with large Impulse Response. Over the past years, there have been numerous algorithms attempting to overcome this issue by even implementing convolution with a multiple-channel approach. Another nowadays problem is to find a standard way to manage IR matrices, it's being currently researched a technique to store all the individual filters of the matrix in one single file in such a way to also simplify the loading phase for end-user employing. This work is intended to analyze an open-source development of a multi-channel convolver with special attention to the matrix loading stage to ease the job of the matrix creators and inexpert users.
FARINA, ANGELO
ING - Scuola di Ingegneria Industriale e dell'Informazione
16-dic-2020
2019/2020
La convoluzione è un'operazione tra segnali ampiamente utilizzata per le sue numerose applicazioni nell'elaborazione di segnali digitali. Nel campo audio, la convoluzione ricopre un ruolo importante in quanto ha la particolare funzione di modificare le caratteristiche temporali e spettrali di un suono. Queste alterazioni sono definite nella loro totalità dal segnale con il quale la convoluzione è applicata, chiamato Risposta all'Impulso. Questi segnali, infatti, contengono una sorta di impronta acustica che può essere trasferita completamente a un altro suono, che ne acquisirà le sue proprietà. Se inserita in un contesto multicanale, la convoluzione assume significati ulteriori e il campo di applicazioni si allarga. Questo tipo di approccio viene utilizzato infatti per gestire le moderne tecniche di suono spaziale come ad esempio Ambisonics, che richiede un'elaborazione matriciale dei segnali coinvolti. Le registrazioni per ottenere questa spazializzazione necessitano di speciali array di microfoni con capsule coincidenti; i segnali provenienti da ogni capsula vanno poi convertiti nel formato standard di Ambisonics mediante l'uso di convolutori multicanale. Un concetto simile si applica anche in una situazione di missaggio di una produzione audio, dove oggetti sonori posizionati nello spazio devono essere convertiti nel formato Ambisonics per poter essere riprodotti nella configurazione di altoparlanti corrispondente. L'uso di particolari matrici, permette inoltre ai convolutori di segnali multipli di ottenere microfoni iper-direzionali, o di progettare diffusori la cui direzionalità delle onde acustiche può essere relativa ai movimenti reali di un musicista sul palco. In secondo luogo, specifici array di microfoni e array di altoparlanti possono essere combinati insieme per ottenere una modalità completamente nuova per caratterizzare acusticamente gli ambienti chiusi. Questo metodo, permette di acquisire matrici di Risposte all'Impulso chiamate MIMO, che possono essere sfruttate in numerose applicazioni di analisi acustica e di arricchimento del suono spaziale. Per quanto riguarda il processo stesso di convoluzione, i metodi tradizionali per la sua implementazione sono stati fonte di problematiche in presenza di lunghe Risposte all'Impulso a causa del grande carico computazionale che richiedevano. Negli anni, sono stati sviluppati diversi algoritmi per compensare questo problema e riuscire anche a realizzare convolutori multicanale. Un altro problema odierno, riguarda la standardizzazione della gestione delle matrici in file unici, in modo da semplificare contemporaneamente il caricamento nei convolutori da parte dell'utente finale e la loro realizzazione da parte degli sviluppatori. Questo lavoro si prefigge di analizzare un'esistente realizzazione open-source di un convolutore multicanale, con un'attenzione particolare alla fase di caricamento delle matrici. Nel contesto verrà esaminato anche l'algoritmo implementato per il processo di convoluzione, migliorandone eventualmente le prestazioni.
File allegati
File Dimensione Formato  
2020_12_BATTISTI.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Testo della tesi
Dimensione 1.79 MB
Formato Adobe PDF
1.79 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/170476