The scope of audio computing is in a never-ending need for more processing power and more efficient software. Sound designers, engineers, musicians and composers are constantly seeking for less restrictive tools, for higher-quality synthesis and processing techniques, and for more sophisticated sound analysis techniques, possibly at a lower cost. The appearance on the market of general-purpose, highly parallel processors (like modern GPUs) has triggered, in the last decade, a new trend in the scientific research aimed at developing better performing audio processes: in many cases, harnessing this kind of hardware, which is widespread in a variety of electronic devices (or it can be conveniently added to most computer systems), allows for the execution of more tasks simultaneously and/or for the achievement of better sound quality results. In this thesis, the practice of casting audio computing tasks to general-purpose graphics processing units is reviewed and discussed. In addition, a specific field of application is thoroughly investigated, namely that of spectral manipulation of audio signals: the streaming phase vocoder framework provided in the Csound environment is ported to a GPU-based parallel computing model by means of developing CUDA-based processing modules. These modules are tested and compared against the original CPU-based versions on two target computer systems. The results show that real-time spectral manipulation of audio on GPUs is not only feasible but it is also computed potentially faster with respect to the standard centralised approach.

L’ambito dell’elaborazione digitale di segnali audio è caratterizzato da un'ineusaribile necessità di dispositivi di calcolo sempre più potenti e di programmi sempre più efficienti. Figure professionali quali il sound designer, l’ingegnere del suono, il musicista e il compositore sono alla costante ricerca di strumenti sempre meno limitanti, di tecniche di elaborazione e sintesi del suono che restituiscano una maggiore qualità audio, nonché di tecniche di analisi più sofisticate, possibilmente a costi contenuti. La comparsa sul mercato, nel corso dell’ultimo decennio, di processori altamente paralleli e liberamente programmabili (come le moderne unità di elaborazione grafica), ha innescato una nuova tendenza nella ricerca scientifica volta allo sviluppo di processi audio ad alte prestazioni: in molti casi lo sfruttamento della suddetta categoria di processori, ampiamente diffusa in diverse tipologie di dispositivi elettronici, consente di eseguire un maggior numero di applicazioni contemporaneamente e/o di ottenere risultati di maggiore qualità. In questa tesi viene analizzata e commentata la prassi di delegare l’elaborazione di processi audio di vario tipo a processori grafici. Inoltre, particolare attenzione viene dedicata allo studio di un’applicazione specifica, l’elaborazione spettrale del suono: il contesto operativo fornito da Csound per la manipolazione di segnali audio basata sulla rappresentazione streaming phase vocoder viene declinato in termini di calcolo parallelo su unità di elaborazione grafica, attraverso lo sviluppo di moduli operativi in ambiente CUDA. La funzionalità di questi moduli è stata verificata su due sistemi di riferimento e comparata con le versioni originali, basate su un modello di calcolo tradizionale, ovvero centralizzato. I risultati mostrano che la manipolazione spettrale di segnali audio su unità grafiche non è solo realizzabile in tempo reale ma è anche caratterizzata da migliori prestazioni se confrontata con il metodo tradizionale impostato su unità di elaborazione centrali, almeno per quanto riguarda i due sistemi in esame.

Spectral manipulation of audio using general-purpose graphics processing units

CRESPI, ANDREA GIANFRANCO
2015/2016

Abstract

The scope of audio computing is in a never-ending need for more processing power and more efficient software. Sound designers, engineers, musicians and composers are constantly seeking for less restrictive tools, for higher-quality synthesis and processing techniques, and for more sophisticated sound analysis techniques, possibly at a lower cost. The appearance on the market of general-purpose, highly parallel processors (like modern GPUs) has triggered, in the last decade, a new trend in the scientific research aimed at developing better performing audio processes: in many cases, harnessing this kind of hardware, which is widespread in a variety of electronic devices (or it can be conveniently added to most computer systems), allows for the execution of more tasks simultaneously and/or for the achievement of better sound quality results. In this thesis, the practice of casting audio computing tasks to general-purpose graphics processing units is reviewed and discussed. In addition, a specific field of application is thoroughly investigated, namely that of spectral manipulation of audio signals: the streaming phase vocoder framework provided in the Csound environment is ported to a GPU-based parallel computing model by means of developing CUDA-based processing modules. These modules are tested and compared against the original CPU-based versions on two target computer systems. The results show that real-time spectral manipulation of audio on GPUs is not only feasible but it is also computed potentially faster with respect to the standard centralised approach.
LAZZARINI, VICTOR
ING - Scuola di Ingegneria Industriale e dell'Informazione
27-lug-2016
2015/2016
L’ambito dell’elaborazione digitale di segnali audio è caratterizzato da un'ineusaribile necessità di dispositivi di calcolo sempre più potenti e di programmi sempre più efficienti. Figure professionali quali il sound designer, l’ingegnere del suono, il musicista e il compositore sono alla costante ricerca di strumenti sempre meno limitanti, di tecniche di elaborazione e sintesi del suono che restituiscano una maggiore qualità audio, nonché di tecniche di analisi più sofisticate, possibilmente a costi contenuti. La comparsa sul mercato, nel corso dell’ultimo decennio, di processori altamente paralleli e liberamente programmabili (come le moderne unità di elaborazione grafica), ha innescato una nuova tendenza nella ricerca scientifica volta allo sviluppo di processi audio ad alte prestazioni: in molti casi lo sfruttamento della suddetta categoria di processori, ampiamente diffusa in diverse tipologie di dispositivi elettronici, consente di eseguire un maggior numero di applicazioni contemporaneamente e/o di ottenere risultati di maggiore qualità. In questa tesi viene analizzata e commentata la prassi di delegare l’elaborazione di processi audio di vario tipo a processori grafici. Inoltre, particolare attenzione viene dedicata allo studio di un’applicazione specifica, l’elaborazione spettrale del suono: il contesto operativo fornito da Csound per la manipolazione di segnali audio basata sulla rappresentazione streaming phase vocoder viene declinato in termini di calcolo parallelo su unità di elaborazione grafica, attraverso lo sviluppo di moduli operativi in ambiente CUDA. La funzionalità di questi moduli è stata verificata su due sistemi di riferimento e comparata con le versioni originali, basate su un modello di calcolo tradizionale, ovvero centralizzato. I risultati mostrano che la manipolazione spettrale di segnali audio su unità grafiche non è solo realizzabile in tempo reale ma è anche caratterizzata da migliori prestazioni se confrontata con il metodo tradizionale impostato su unità di elaborazione centrali, almeno per quanto riguarda i due sistemi in esame.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Andrea Crespi - Master's Thesis.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 4.85 MB
Formato Adobe PDF
4.85 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/122542