In contemporary creative installations, ambient music enhances emotional and aesthetic depth. This thesis explores the intersection of ambient music and generative AI, designing a system to produce high-quality ambient music soundtracks for artistic environments. The significance of ambient music in creating immersive sensory experiences is highlighted, tracing its evolution from electronic music to modern applications. The challenges and potentials of integrating AI in ambient music generation are examined, emphasizing the need for interdisciplinary approaches to address complexities in musical theory, emotional expression, and technical limitations. Deep learning has transformed music generation, enabling algorithms to replicate complex musical patterns from extensive datasets. Generative music systems find practical applications in film scoring, installation art, therapeutic products, and music production, showcasing their adaptability and growing importance in automated music. This work leverages Musika, a GAN-based architecture, to address challenges like dataset scarcity and computational intensity by fine-tuning pre-trained models and training new models from scratch on a specially constructed and further augmented with innovative data augmentation techniques dataset. The system's architecture, including an Audio Autoencoder and a Latent GAN, produces high-quality, coherent, and variable-length audio samples. Evaluation of the system's performance, using metrics such as Sum and Weighted Sum of Losses, and Convergence and Stability criteria, demonstrates its effectiveness and potential for creative installations. The research contributes to Music Information Retrieval (MIR) and creative technology, suggesting future directions for AI integration in music generation and expanding artistic expression in interactive spaces.
La musica ambient è ormai nota per arricchire con profondità estetica ed emotiva le installazioni creative contemporanee. Questa tesi esplora la sinergia tra musica ambient e intelligenza artificiale generativa, portando alla luce un sistema in grado di generare tracce di musica ambient di alta qualità per spazi e contesti creativi. Dopo aver evidenziato l'importanza della musica ambient nella creazione di esperienze sensoriali coinvolgenti, tracciando la sua evoluzione dalla musica elettronica alle applicazioni moderne, in questo lavoro, vengono esaminati i problemi e le potenzialità dell'integrazione dell'IA nella generazione di musica ambient, sottolineando la necessità di approcci interdisciplinari per affrontare le complessità della teoria musicale, dell'espressione emotiva e delle limitazioni tecniche nonché computazionali. Il deep learning ha trasformato l’intero settore del generative music, consentendo agli algoritmi di replicare modelli complessi da ampi set di dati. I sistemi di musica generativa trovano applicazioni pratiche nella sonorizzazione cinematografica, nelle installazioni artistiche, nei prodotti terapeutici e nella produzione musicale, dimostrando la loro adattabilità e crescente importanza nella produzione automatizzata della musica. Questo lavoro sfrutta Musika, un'architettura basata su GAN, per affrontare problemi come la scarsità di dataset e l'intensità computazionale, ottimizzando modelli preaddestrati e allenando nuovi modelli da zero su un dataset appositamente costruito e ulteriormente arricchito con innovative tecniche di aumento dei dati. L'architettura del sistema, comprensiva di un Audio Autoencoder e di una Latent GAN, produce campioni audio di alta qualità, coerenti e di lunghezza variabile. La valutazione delle prestazioni del sistema, utilizzando metriche come la Somma e la Somma Pesata dei Costi, e i criteri di Convergenza e Stabilità, ne dimostra l'efficacia e il potenziale per installazioni creative. La ricerca contribuisce al Music Information Retrieval (MIR) e all’avanzamento della tecnologia creativa, suggerendo future direzioni per l'integrazione dell'IA nella generazione di musica e nell'espansione dell'espressione artistica negli spazi interattivi.
Generative adversarial networks for ambient music creation: enhancing creative installations with AI-driven soundscapes
BLE, ZOUZOUA AXEL ISRAEL
2023/2024
Abstract
In contemporary creative installations, ambient music enhances emotional and aesthetic depth. This thesis explores the intersection of ambient music and generative AI, designing a system to produce high-quality ambient music soundtracks for artistic environments. The significance of ambient music in creating immersive sensory experiences is highlighted, tracing its evolution from electronic music to modern applications. The challenges and potentials of integrating AI in ambient music generation are examined, emphasizing the need for interdisciplinary approaches to address complexities in musical theory, emotional expression, and technical limitations. Deep learning has transformed music generation, enabling algorithms to replicate complex musical patterns from extensive datasets. Generative music systems find practical applications in film scoring, installation art, therapeutic products, and music production, showcasing their adaptability and growing importance in automated music. This work leverages Musika, a GAN-based architecture, to address challenges like dataset scarcity and computational intensity by fine-tuning pre-trained models and training new models from scratch on a specially constructed and further augmented with innovative data augmentation techniques dataset. The system's architecture, including an Audio Autoencoder and a Latent GAN, produces high-quality, coherent, and variable-length audio samples. Evaluation of the system's performance, using metrics such as Sum and Weighted Sum of Losses, and Convergence and Stability criteria, demonstrates its effectiveness and potential for creative installations. The research contributes to Music Information Retrieval (MIR) and creative technology, suggesting future directions for AI integration in music generation and expanding artistic expression in interactive spaces.File | Dimensione | Formato | |
---|---|---|---|
2024_07_BLE.pdf
accessibile in internet per tutti
Descrizione: tesi BLE 10571289
Dimensione
3.05 MB
Formato
Adobe PDF
|
3.05 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/222933