Evaluating machine unlearning techniques in discriminative and generative music models

This thesis investigates the application of machine unlearning techniques in artificial intelligence systems for music, with a focus on both musical genre classification and generative audio models. The rapid development of AI technologies has raised concerns related to authorship, copyright, and ethical responsibility, particularly in creative domains where training data may include copyrighted or identifiable artistic content. Machine unlearning has emerged as a potential approach to address these issues by removing the influence of specific data from trained models without requiring full retraining. Several unlearning strategies are applied and compared across two experimental settings. First, a convolutional neural network for musical genre classification is trained and then subjected to targeted unlearning procedures. Second, the same techniques are examined in a music generation context using a diffusion-based model, enabling a comparison between discriminative and generative scenarios. The evaluation relies on accuracy and similarity-based measures to assess both forgetting effectiveness and knowledge preservation. Results in the classification setting are consistently strong, with simpler and less computationally demanding methods often proving the most effective. In contrast, the generative scenario shows more limited changes, reflecting the greater complexity of applying unlearning to generative models. Overall, the findings highlight clear differences between tasks and suggest additional challenges for reliable data removal in generative systems.

Questa tesi indaga l’applicazione delle tecniche di machine unlearning nei sistemi di intelligenza artificiale per la musica, con un focus sia sulla classificazione dei generi musicali sia sui modelli generativi. Il rapido sviluppo delle tecnologie di IA ha sollevato preoccupazioni relative all’autorialità, diritto d’autore e responsabilità etica, soprattutto in domini creativi in cui i dati di addestramento possono includere contenuti protetti o riconducibili a specifici autori. In questo contesto, il machine unlearning emerge come approccio per rimuovere l’influenza di dati specifici da modelli già addestrati senza richiedere un riaddestramento completo. Diverse strategie di unlearning sono state applicate e confrontate in due scenari sperimentali distinti. In una prima fase, una rete neurale convoluzionale per la classificazione dei generi musicali è stata sottoposta a procedure mirate di rimozione dell’informazione. Successivamente, le stesse tecniche sono state analizzate in un contesto di generazione musicale basato su modelli di diffusione, permettendo un confronto tra scenari discriminativi e generativi. La valutazione si basa su metriche di accuratezza e misure di similarità, al fine di analizzare sia l’efficacia della rimozione sia la capacità di preservare la conoscenza acquisita dal modello. I risultati mostrano prestazioni solide nella classificazione, in particolare con metodi semplici e poco onerosi dal punto di vista computazionale. Nei modelli generativi, invece, le modifiche risultano più limitate, confermando la maggiore complessità nell’applicazione dell’unlearning in contesti generativi. Complessivamente, i risultati evidenziano differenze tra i compiti analizzati e suggeriscono ulteriori sfide per garantire una rimozione dei dati affidabile nei sistemi generativi.