The thesis aims to create an annotated musical dataset and to propose an Automatic Music Transcription system specifi c to jazz music only. Although many available annotated datasets are built from the audio recordings, the proposed one is built from MIDI le format data, providing robust annotation. The automatic polyphonic transcription method uses a Convolutional Neural Network for the prediction of the outcome. Automatic Music Transcription is an interesting and active research eld of Music Information Retrieval. Automatic Music Transcription refers to the analysis of the musical signal to extract a parametric representation of it, e.g. a musical score or MIDI format le. Even for man, the transcription of music is di cult and still remains a hard task requiring a deep knowledge of music and high level of musical training. Providing a parametric representation of audio signals would be important for application to annotated music for automatic research in large and interactive musical systems. Massive support would be given to the musicology elds producing annotation for audio performance without any written representation, and to the education eld. The work hereby presented is focused on the jazz genre, due to its variety of styles and improvisation parts, of which usually there is no available transcription, and to which the eld of Automatic Music Transcription can be of help. Its variability makes the problem of Automatic Music Transcription even more challenging and also for that reason there is not much work available. Results of the transcription system highlighted the di culties of transcribing jazz music, compared to classical music, but still comparable to state-of-art methodologies, producing an f-measure of 0.837 testing the Neural Network on 30 tracks of MAPS dataset and 0.50 from the jazz dataset experiment.

La tesi si pone come obiettivi creare una nuova raccolta musicale e proporre un sistema di trascrizione automatica specifici per il jazz. Il campo della trascrizione automatica è un'area di ricerca del Music Information Retrieval che si riferisce alla parametrizzazione di segnali musicali. Rappresentazioni diverse di una traccia audio possono essere lo spartito usato nella musica Occidentale o il formato MIDI. La trascrizione di musica trova le maggiori applicazioni in sistemi musicali di ricerca automatica o interattivi. Ed inoltre si rivela di grandissimo supporto ai campi di analisi musicologica e dell’educazione musicale, nei quali viene applicata a generi di cui non abbiamo alcuno spartito, come il jazz. Il jazz, infatti, è rinomato per l’ampio utilizzo dell’improvvisazione, per la quale le tracce vengono interamente strutturate. La tesi presentata è focalizzata sul quest’ultimo genere musicale, il quale risulta interessante al problema della trascrizione automatica come banco di prova per la sua varietà e differenza di stili. Difatti, per la poca reperibilità e per la sua intrinseca complessità, il jazz non ha attirato moltissimo interesse in questa campo di studi, motivo per il quale la tesi si propone anche di creare una raccolta di musica dedicata al genere completa di annotazioni. Il sistema di trascrizione si focalizza sulla musica polifonica e sfrutta tecniche basate sull’apprendimento statistico, quali quelle di Machine Learning. L’algoritmo utilizzato dal sistema proposto è una rete convoluzionale, la quale viene testata sul database sopra menzionato. Inoltre, il sistema è stato applicato ad un’atra raccolta per avere un confronto con diversi metodi presenti nello stato dell’arte. I risultati su quest’ultima raccolta, sembrano comparabili con questi metodi, producendo un F-measure di 0.837. L’analisi dei risultati riguardanti l’insieme dedicato al jazz ha confermato la difficoltà della trascrizione applicata al genere, con un calo delle prestazioni del 30%.

An investigation of piano transcription algorithm for jazz music

MARZORATI, GIORGIO
2017/2018

Abstract

The thesis aims to create an annotated musical dataset and to propose an Automatic Music Transcription system specifi c to jazz music only. Although many available annotated datasets are built from the audio recordings, the proposed one is built from MIDI le format data, providing robust annotation. The automatic polyphonic transcription method uses a Convolutional Neural Network for the prediction of the outcome. Automatic Music Transcription is an interesting and active research eld of Music Information Retrieval. Automatic Music Transcription refers to the analysis of the musical signal to extract a parametric representation of it, e.g. a musical score or MIDI format le. Even for man, the transcription of music is di cult and still remains a hard task requiring a deep knowledge of music and high level of musical training. Providing a parametric representation of audio signals would be important for application to annotated music for automatic research in large and interactive musical systems. Massive support would be given to the musicology elds producing annotation for audio performance without any written representation, and to the education eld. The work hereby presented is focused on the jazz genre, due to its variety of styles and improvisation parts, of which usually there is no available transcription, and to which the eld of Automatic Music Transcription can be of help. Its variability makes the problem of Automatic Music Transcription even more challenging and also for that reason there is not much work available. Results of the transcription system highlighted the di culties of transcribing jazz music, compared to classical music, but still comparable to state-of-art methodologies, producing an f-measure of 0.837 testing the Neural Network on 30 tracks of MAPS dataset and 0.50 from the jazz dataset experiment.
ING - Scuola di Ingegneria Industriale e dell'Informazione
20-dic-2018
2017/2018
La tesi si pone come obiettivi creare una nuova raccolta musicale e proporre un sistema di trascrizione automatica specifici per il jazz. Il campo della trascrizione automatica è un'area di ricerca del Music Information Retrieval che si riferisce alla parametrizzazione di segnali musicali. Rappresentazioni diverse di una traccia audio possono essere lo spartito usato nella musica Occidentale o il formato MIDI. La trascrizione di musica trova le maggiori applicazioni in sistemi musicali di ricerca automatica o interattivi. Ed inoltre si rivela di grandissimo supporto ai campi di analisi musicologica e dell’educazione musicale, nei quali viene applicata a generi di cui non abbiamo alcuno spartito, come il jazz. Il jazz, infatti, è rinomato per l’ampio utilizzo dell’improvvisazione, per la quale le tracce vengono interamente strutturate. La tesi presentata è focalizzata sul quest’ultimo genere musicale, il quale risulta interessante al problema della trascrizione automatica come banco di prova per la sua varietà e differenza di stili. Difatti, per la poca reperibilità e per la sua intrinseca complessità, il jazz non ha attirato moltissimo interesse in questa campo di studi, motivo per il quale la tesi si propone anche di creare una raccolta di musica dedicata al genere completa di annotazioni. Il sistema di trascrizione si focalizza sulla musica polifonica e sfrutta tecniche basate sull’apprendimento statistico, quali quelle di Machine Learning. L’algoritmo utilizzato dal sistema proposto è una rete convoluzionale, la quale viene testata sul database sopra menzionato. Inoltre, il sistema è stato applicato ad un’atra raccolta per avere un confronto con diversi metodi presenti nello stato dell’arte. I risultati su quest’ultima raccolta, sembrano comparabili con questi metodi, producendo un F-measure di 0.837. L’analisi dei risultati riguardanti l’insieme dedicato al jazz ha confermato la difficoltà della trascrizione applicata al genere, con un calo delle prestazioni del 30%.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2018_12_Marzorati.pdf

Open Access dal 30/11/2019

Descrizione: Testo della tesi
Dimensione 1.9 MB
Formato Adobe PDF
1.9 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/144745