One of the distinctive traits of our society in the last decade is the availability and consequent fruition of multimedia content in digital format. The Internet, the growing density of storage systems and the increasing quality of compressed file formats, played the main roles in this revolution. Nowadays, audio and video contents are easily created, stored and shared by million of people. This huge amount of data has to be efficiently organized and archived, to ease the fruition of large databases as online shops (as Amazon, iTunes) and content sharing website (Youtube, Soundcloud). The task of extraction of meaningful descriptors from digital audio and classification of musical content are addressed by a new research field named Music Information Retrieval (MIR). Among the descriptors that MIR aims at extracting from audio are rhythm, harmony, melody. These descriptors are meaningful for a musician and can find many applications as computer aided music learning, and automated transcription. The high demand for reliable automated transcriptions comes from the hobby musicians too. Official transcriptions are not always published and often the information about chords is enough to reproduce the song. This thesis propose a system that performs the two tasks of beat tracking and chord recognition. The beat-tracking subsystem exploits a novel technique in finding the beat instants, based on the simultaneous tracking of many possible paths. This algorithm provide a useful self-evaluation property that can be exploited to achieve better accuracy. The downbeat is extracted by the same algorithm, proving the validity of the same approach at higher metrical level. The chord-recognition system proposed contemplates all the four most used key modes in western pop music (previously only major and minor modes are considered). Two novel parametric probabilistic models of keys and chords are proposed, where each parameter has a musical meaning. The performances of the two parts of the system exceed those taken as state-of-art reference. Finally the information gathered by our system is exploited to compute a set of three novel harmony-based features.

Uno dei tratti distintivi della nostra società nell'ultimo decennio è la disponibilità, e conseguente fruizione, di contenuti multimediali in formato digitale. Internet, la crescente densità dei sistemi di storage e l'aumento della qualità dei formati di file compressi, sono i protagonisti di questa rivoluzione. Al giorno d'oggi, contenuti audio e video sono facilmente creati, immagazzinati e condivisi da milioni di persone. E' necessario che questa enorme quantità di dati sia efficientemente organizzata e archiviata, per facilitare la fruizione di grandi basi di dati come negozi online (Amazone, iTunes) e siti di condivisione di contenuti (Youtube, Soundcloud). Il compito di estrazione di descrittori significativi da file audio e la classificazione del contenuto musicale sono affrontati da una nuova area di ricerca chiamata Music Information Retrieval (MIR). Tra i descrittori che MIR mira ad estrarre dall'audio ci sono il ritmo, l'armonia, la melodia. Questi descrittori sono significativi per un musicista e possono trovare molte applicazioni, ad esempio nello studio della musica con il computer, o per la trascrizione automatica di brani musicali. La grande richiesta per sistemi affidabili di trascrizione automatica viene anche dai musicisti non professionisti, in quanto non sempre vengono pubblicate trascrizioni ufficiali dei brani e la progressione di accordi è sufficiente per suonare il brano desiderato. Questa tesi propone un sistema che esegue i due compiti di tracciamento del beat e riconoscimento degli accordi. Il sotto-sistema di tracciamento del beat sfrutta una nuova tecnica per trovare gli istanti di beat, basata sul tracciamento simultaneo di più sentieri. Questo algoritmo fornisce un'utile proprietà di auto-valutazione che può essere sfruttata per migliorarne l'accuratezza. I primi beat delle misure sono estratti mediante lo stesso algoritmo, provando cos\'i la validità dello stesso approccio al livello gerarchico superiore. Il sotto-sistema di riconoscimento degli accordi proposto considera tutti e quattro i modi più usati nel pop occidentale (precedentemente solo i modi maggiore e minore erano stati considerati). Due nuovi modelli probabilistici parametrici per gli accordi e le tonalità sono proposti, dove ogni parametro ha un preciso significato musicale. Le prestazioni delle due parti del sistema superano quelle considerate come riferimento dello stato dell'arte. Infine, le informazioni raccolte dal nostro sistema sono sfruttate per calcolare tre nuovi descrittori basati sull'armonia.

Automatic chord recognition based on the probabilistic modeling of diatonic modal harmony

DI GIORGI, BRUNO
2011/2012

Abstract

One of the distinctive traits of our society in the last decade is the availability and consequent fruition of multimedia content in digital format. The Internet, the growing density of storage systems and the increasing quality of compressed file formats, played the main roles in this revolution. Nowadays, audio and video contents are easily created, stored and shared by million of people. This huge amount of data has to be efficiently organized and archived, to ease the fruition of large databases as online shops (as Amazon, iTunes) and content sharing website (Youtube, Soundcloud). The task of extraction of meaningful descriptors from digital audio and classification of musical content are addressed by a new research field named Music Information Retrieval (MIR). Among the descriptors that MIR aims at extracting from audio are rhythm, harmony, melody. These descriptors are meaningful for a musician and can find many applications as computer aided music learning, and automated transcription. The high demand for reliable automated transcriptions comes from the hobby musicians too. Official transcriptions are not always published and often the information about chords is enough to reproduce the song. This thesis propose a system that performs the two tasks of beat tracking and chord recognition. The beat-tracking subsystem exploits a novel technique in finding the beat instants, based on the simultaneous tracking of many possible paths. This algorithm provide a useful self-evaluation property that can be exploited to achieve better accuracy. The downbeat is extracted by the same algorithm, proving the validity of the same approach at higher metrical level. The chord-recognition system proposed contemplates all the four most used key modes in western pop music (previously only major and minor modes are considered). Two novel parametric probabilistic models of keys and chords are proposed, where each parameter has a musical meaning. The performances of the two parts of the system exceed those taken as state-of-art reference. Finally the information gathered by our system is exploited to compute a set of three novel harmony-based features.
ZANONI, MASSIMILIANO
ING V - Scuola di Ingegneria dell'Informazione
22-apr-2013
2011/2012
Uno dei tratti distintivi della nostra società nell'ultimo decennio è la disponibilità, e conseguente fruizione, di contenuti multimediali in formato digitale. Internet, la crescente densità dei sistemi di storage e l'aumento della qualità dei formati di file compressi, sono i protagonisti di questa rivoluzione. Al giorno d'oggi, contenuti audio e video sono facilmente creati, immagazzinati e condivisi da milioni di persone. E' necessario che questa enorme quantità di dati sia efficientemente organizzata e archiviata, per facilitare la fruizione di grandi basi di dati come negozi online (Amazone, iTunes) e siti di condivisione di contenuti (Youtube, Soundcloud). Il compito di estrazione di descrittori significativi da file audio e la classificazione del contenuto musicale sono affrontati da una nuova area di ricerca chiamata Music Information Retrieval (MIR). Tra i descrittori che MIR mira ad estrarre dall'audio ci sono il ritmo, l'armonia, la melodia. Questi descrittori sono significativi per un musicista e possono trovare molte applicazioni, ad esempio nello studio della musica con il computer, o per la trascrizione automatica di brani musicali. La grande richiesta per sistemi affidabili di trascrizione automatica viene anche dai musicisti non professionisti, in quanto non sempre vengono pubblicate trascrizioni ufficiali dei brani e la progressione di accordi è sufficiente per suonare il brano desiderato. Questa tesi propone un sistema che esegue i due compiti di tracciamento del beat e riconoscimento degli accordi. Il sotto-sistema di tracciamento del beat sfrutta una nuova tecnica per trovare gli istanti di beat, basata sul tracciamento simultaneo di più sentieri. Questo algoritmo fornisce un'utile proprietà di auto-valutazione che può essere sfruttata per migliorarne l'accuratezza. I primi beat delle misure sono estratti mediante lo stesso algoritmo, provando cos\'i la validità dello stesso approccio al livello gerarchico superiore. Il sotto-sistema di riconoscimento degli accordi proposto considera tutti e quattro i modi più usati nel pop occidentale (precedentemente solo i modi maggiore e minore erano stati considerati). Due nuovi modelli probabilistici parametrici per gli accordi e le tonalità sono proposti, dove ogni parametro ha un preciso significato musicale. Le prestazioni delle due parti del sistema superano quelle considerate come riferimento dello stato dell'arte. Infine, le informazioni raccolte dal nostro sistema sono sfruttate per calcolare tre nuovi descrittori basati sull'armonia.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2013_04_DiGiorgi.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 1.41 MB
Formato Adobe PDF
1.41 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/75024