This thesis concerns the physical modelling of musical sounds. The importance of such models lies in the wide range of applications that they find both in the field of signal processing and in that of instrumental acoustics. However, a major issue is encountered in the description of musical tones: due to their strong dependency from physics, an accurate representation often requires the knowledge of many parameters, which, furthermore, are not always easy to infer directly from a recorded sound. It is therefore useful to try to reduce the number of these coefficients and to have models able to estimate them from audio recordings. Exploiting physical relations it is sometimes possible to limit the number of parameters to one. This work benefits of this fact and has the double aim of building models that extract a single descriptor from sound excerpts and of studying the effects of such descriptor when applied to physical models of the sound itself. In order to achieve these objectives, a synergetic approach is used between signal processing and physical modelling. In particular, the attention is focused on the phenomenon of inharmonicity (i.e. the partial frequencies are slightly higher than those of a harmonic combination) in struck strings. Such a property needs a great number of physical coefficients in order to be well described; however, such physical factors can be combined into a single non physical one called the inharmonicity coefficient. Thanks to the use of signal processing models constrained by acoustic information, we have been able to build instrument-specific models for the estimation of such a parameter from audio excerpts. Specifically, we consider piano tones since they strongly present the property of inharmonicity; moreover, they cover a wide range of frequencies, thus permitting a better analysis of the phenomenon. In addition, as piano music analysis is well established, we could benefit from the presence of different databases. Therefore, our models analyse each note recording and extract the main frequency F0 and the inharmonicity coefficient B from it. Two models are presented, corresponding to two different approaches: one is based on the physical observation that signals are the result of a superposition of waves, each one carrying meaningful information; the second approach, instead, isolates significant characteristics of sounds by means of matrix decomposition. The two models are then compared both qualitatively and quantitatively and the final results are used to annotate the correspondent databases. Finally, we study the effect of B in the physical model of piano notes by developing a parametric synthesis. Signal processing tools able to model physical relations and properties are used in the building of the synthesiser; in addition, the fundamental frequency and the inharmonicity coefficient contribute to the tuning of the final tone. In the end, a qualitative result is presented and possible improvements to the models are proposed; moreover other possible applications of the inharmonicity are presented, such as audio editing ones.

Questa tesi tratta della modellizzazione fisica dei segnali musicali. L'importanza di questi modelli risiede nell'ampia gamma di applicazioni che essi trovano sia nel campo dell'elaborazione dei segnali digitali (DSP) che in quello dell'acustica strumentale. Tuttavia, la descrizione dei toni musicali presenta un problema rilevante: a causa della loro forte dipendenza dalla fisica, una rappresentazione accurata di tali toni spesso richiede la conoscenza di molteplici parametri, i quali, inoltre, non sono sempre facilmente inferibili direttamente dalle registrazioni dei segnali stessi. Perciò, è utile cercare di ridurre il numero di questi coefficienti e di creare modelli capaci di stimare quest'ultimi dalle registrazioni audio.\\ Talvolta è possibile sfruttare relazioni fisiche per limitare il numero di parametri ad uno solo. Questa tesi beneficia di tale fatto e ha il duplice obiettivo di costruire modelli che estraggano un singolo descrittore dai brani musicali e di studiare l'effetto di tale descrittore quando viene applicato a modelli fisici del suono stesso. Per poter raggiungere questi obiettivi, abbiamo utilizzato un approccio sinergico tra l'elaborazione dei segnali digitali e la modellizzazione fisica.\\ In particolare, l'attenzione è stata focalizzata sul fenomeno dell'inarmonicità (i.e. le frequenze dei parziali risultano leggermente più elevate di quelle di una combinazione armonica) in corde percosse. Per descrivere tale proprietà è necessario disporre di molti parametri fisici; tuttavia, questi fattori possono essere combinati in modo tale da ottenerne uno singolo, non fisico, chiamato coefficiente di inarmonicità. Grazie all'utilizzo di modelli appartenenti al campo del DSP limitati da informazioni acustiche, abbiamo potuto costruire modelli specifici per lo strumento musicale considerato che stimassero quest'unico parametro. In particolare, lo studio è stato sviluppato sui toni del pianoforte poiché fortemente caratterizzati dalla proprietà dell'inarmonicità; inoltre, essi ricoprono un'ampia gamma di frequenze, permettendo, quindi, un'analisi più dettagliata del fenomeno. In aggiunta, siccome l'analisi della musica prodotta dal pianoforte è un'area consolidata e comune, abbiamo potuto beneficiare dell'esistenza di molteplici database contenenti diversi campionamenti di suoni di pianoforti. Pertanto, i modelli presentati in questa tesi analizzano la registrazione di ogni nota e ne estraggono la frequenza fondamentale F0 ed il coefficiente di inarmonicità B. Sono stati studiati e sviluppati due modelli, corrispondenti a due approcci differenti al problema: il primo si basa sull'osservazione fisica che i segnali sono il risultati di una sovrapposizione di onde, ognuna delle quali trasporta informazioni significative; il secondo approccio, invece, isola caratteristiche rilevanti tramite la decomposizione matriciale. Abbiamo poi qualitativamente e quantitativamente confrontato i due metodi ed abbiamo utilizzato i risultati finali per annotare i corrispondenti database. Infine, si è studiato l'effetto di B nella modellizzazione fisica delle note del pianoforte sviluppando una sintesi parametrica delle stesse. Per la realizzazione di quest'ultimo obiettivo, sono stati utilizzati strumenti appartenenti al campo del DSP in grado di modellizzare relazioni e proprietà fisiche; in aggiunta, l'accordatura finale dei toni è stata fatta dipendere anche dalla frequenza fondamentale e dal coefficiente di inarmonicità. In conclusione, vengono proposti possibili miglioramenti applicabili ai modelli presentati e suggerite alcune ulteriori applicazioni del coefficiente di inarmonicità.

Physics iformed analysis of inharmonicity in struck strings with applications to parametric sound synthesis

VERZI, VALERIA
2013/2014

Abstract

This thesis concerns the physical modelling of musical sounds. The importance of such models lies in the wide range of applications that they find both in the field of signal processing and in that of instrumental acoustics. However, a major issue is encountered in the description of musical tones: due to their strong dependency from physics, an accurate representation often requires the knowledge of many parameters, which, furthermore, are not always easy to infer directly from a recorded sound. It is therefore useful to try to reduce the number of these coefficients and to have models able to estimate them from audio recordings. Exploiting physical relations it is sometimes possible to limit the number of parameters to one. This work benefits of this fact and has the double aim of building models that extract a single descriptor from sound excerpts and of studying the effects of such descriptor when applied to physical models of the sound itself. In order to achieve these objectives, a synergetic approach is used between signal processing and physical modelling. In particular, the attention is focused on the phenomenon of inharmonicity (i.e. the partial frequencies are slightly higher than those of a harmonic combination) in struck strings. Such a property needs a great number of physical coefficients in order to be well described; however, such physical factors can be combined into a single non physical one called the inharmonicity coefficient. Thanks to the use of signal processing models constrained by acoustic information, we have been able to build instrument-specific models for the estimation of such a parameter from audio excerpts. Specifically, we consider piano tones since they strongly present the property of inharmonicity; moreover, they cover a wide range of frequencies, thus permitting a better analysis of the phenomenon. In addition, as piano music analysis is well established, we could benefit from the presence of different databases. Therefore, our models analyse each note recording and extract the main frequency F0 and the inharmonicity coefficient B from it. Two models are presented, corresponding to two different approaches: one is based on the physical observation that signals are the result of a superposition of waves, each one carrying meaningful information; the second approach, instead, isolates significant characteristics of sounds by means of matrix decomposition. The two models are then compared both qualitatively and quantitatively and the final results are used to annotate the correspondent databases. Finally, we study the effect of B in the physical model of piano notes by developing a parametric synthesis. Signal processing tools able to model physical relations and properties are used in the building of the synthesiser; in addition, the fundamental frequency and the inharmonicity coefficient contribute to the tuning of the final tone. In the end, a qualitative result is presented and possible improvements to the models are proposed; moreover other possible applications of the inharmonicity are presented, such as audio editing ones.
SANDLER, MARK
ING - Scuola di Ingegneria Industriale e dell'Informazione
19-dic-2014
2013/2014
Questa tesi tratta della modellizzazione fisica dei segnali musicali. L'importanza di questi modelli risiede nell'ampia gamma di applicazioni che essi trovano sia nel campo dell'elaborazione dei segnali digitali (DSP) che in quello dell'acustica strumentale. Tuttavia, la descrizione dei toni musicali presenta un problema rilevante: a causa della loro forte dipendenza dalla fisica, una rappresentazione accurata di tali toni spesso richiede la conoscenza di molteplici parametri, i quali, inoltre, non sono sempre facilmente inferibili direttamente dalle registrazioni dei segnali stessi. Perciò, è utile cercare di ridurre il numero di questi coefficienti e di creare modelli capaci di stimare quest'ultimi dalle registrazioni audio.\\ Talvolta è possibile sfruttare relazioni fisiche per limitare il numero di parametri ad uno solo. Questa tesi beneficia di tale fatto e ha il duplice obiettivo di costruire modelli che estraggano un singolo descrittore dai brani musicali e di studiare l'effetto di tale descrittore quando viene applicato a modelli fisici del suono stesso. Per poter raggiungere questi obiettivi, abbiamo utilizzato un approccio sinergico tra l'elaborazione dei segnali digitali e la modellizzazione fisica.\\ In particolare, l'attenzione è stata focalizzata sul fenomeno dell'inarmonicità (i.e. le frequenze dei parziali risultano leggermente più elevate di quelle di una combinazione armonica) in corde percosse. Per descrivere tale proprietà è necessario disporre di molti parametri fisici; tuttavia, questi fattori possono essere combinati in modo tale da ottenerne uno singolo, non fisico, chiamato coefficiente di inarmonicità. Grazie all'utilizzo di modelli appartenenti al campo del DSP limitati da informazioni acustiche, abbiamo potuto costruire modelli specifici per lo strumento musicale considerato che stimassero quest'unico parametro. In particolare, lo studio è stato sviluppato sui toni del pianoforte poiché fortemente caratterizzati dalla proprietà dell'inarmonicità; inoltre, essi ricoprono un'ampia gamma di frequenze, permettendo, quindi, un'analisi più dettagliata del fenomeno. In aggiunta, siccome l'analisi della musica prodotta dal pianoforte è un'area consolidata e comune, abbiamo potuto beneficiare dell'esistenza di molteplici database contenenti diversi campionamenti di suoni di pianoforti. Pertanto, i modelli presentati in questa tesi analizzano la registrazione di ogni nota e ne estraggono la frequenza fondamentale F0 ed il coefficiente di inarmonicità B. Sono stati studiati e sviluppati due modelli, corrispondenti a due approcci differenti al problema: il primo si basa sull'osservazione fisica che i segnali sono il risultati di una sovrapposizione di onde, ognuna delle quali trasporta informazioni significative; il secondo approccio, invece, isola caratteristiche rilevanti tramite la decomposizione matriciale. Abbiamo poi qualitativamente e quantitativamente confrontato i due metodi ed abbiamo utilizzato i risultati finali per annotare i corrispondenti database. Infine, si è studiato l'effetto di B nella modellizzazione fisica delle note del pianoforte sviluppando una sintesi parametrica delle stesse. Per la realizzazione di quest'ultimo obiettivo, sono stati utilizzati strumenti appartenenti al campo del DSP in grado di modellizzare relazioni e proprietà fisiche; in aggiunta, l'accordatura finale dei toni è stata fatta dipendere anche dalla frequenza fondamentale e dal coefficiente di inarmonicità. In conclusione, vengono proposti possibili miglioramenti applicabili ai modelli presentati e suggerite alcune ulteriori applicazioni del coefficiente di inarmonicità.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Master.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Testo Tesi
Dimensione 4.87 MB
Formato Adobe PDF
4.87 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/101522