The increasing application of machine learning in medical imaging research has accentuated the need for large and high-quality MRI datasets. However, it is difficult to procure such datasets due to privacy constraints and acquisition costs. This thesis investigates the use of deep conditional generative models to synthetically generate realistic scanner-conditioned brain MR images. Several generative models were assessed and, ultimately, a conditional Variational Autoencoder (VAE) with a log-cosh loss function was proposed. The model was trained on real MR data labeled by scanner type and evaluated using the Fréchet Inception Distance (FID) computed with Inception-V3 pre-trained on ImageNet. The conditional VAE achieved competitive results. Moreover, visual analysis confirmed that the model was able to produce realistic images conditioned on the features and characteristics of specific scanner types. Overall, the proposed approach offers a practical and extensible method for enhancing labeled medical datasets in scenarios where data availability is a critical challenge.

L’applicazione crescente del machine learning nella ricerca di imaging medico ha accentuato la necessità di disporre di dataset di risonanza magnetica (MRI) ampi e di alta qualità. Tuttavia, ottenere tali dataset è difficile a causa di vincoli legati alla privacy e ai costi di acquisizione. Questa tesi esplora l’uso di modelli generativi profondi condizionati per generare sinteticamente immagini cerebrali realistiche condizionate in base al tipo di scanner. Sono stati valutati diversi modelli generativi e, infine, è stato proposto un Variational Autoencoder (VAE) condizionato con una funzione di perdita log-cosh. Il modello è stato addestrato su dati MRI reali etichettati per tipo di scanner ed è stato valutato utilizzando la Fréchet Inception Distance (FID) calcolata con Inception-V3 pre-addestrato su ImageNet. Il VAE condizionato ha ottenuto risultati competitivi. Inoltre, l’analisi visiva ha confermato che il modello è stato in grado di generare immagini realistiche condizionate in base alla distribuzione e alle caratteristiche dei diversi tipi di scanner. Nel complesso, l’approccio proposto rappresenta un metodo pratico ed estensibile per arricchire i dataset medici in scenari in cui la disponibilità dei dati costituisce una sfida critica.

Generating synthetic MR images using state-of-the-art deep learning approaches

Ballesteros Ramirez, Sebastian
2024/2025

Abstract

The increasing application of machine learning in medical imaging research has accentuated the need for large and high-quality MRI datasets. However, it is difficult to procure such datasets due to privacy constraints and acquisition costs. This thesis investigates the use of deep conditional generative models to synthetically generate realistic scanner-conditioned brain MR images. Several generative models were assessed and, ultimately, a conditional Variational Autoencoder (VAE) with a log-cosh loss function was proposed. The model was trained on real MR data labeled by scanner type and evaluated using the Fréchet Inception Distance (FID) computed with Inception-V3 pre-trained on ImageNet. The conditional VAE achieved competitive results. Moreover, visual analysis confirmed that the model was able to produce realistic images conditioned on the features and characteristics of specific scanner types. Overall, the proposed approach offers a practical and extensible method for enhancing labeled medical datasets in scenarios where data availability is a critical challenge.
CALDERA, LUCA
ING - Scuola di Ingegneria Industriale e dell'Informazione
23-ott-2025
2024/2025
L’applicazione crescente del machine learning nella ricerca di imaging medico ha accentuato la necessità di disporre di dataset di risonanza magnetica (MRI) ampi e di alta qualità. Tuttavia, ottenere tali dataset è difficile a causa di vincoli legati alla privacy e ai costi di acquisizione. Questa tesi esplora l’uso di modelli generativi profondi condizionati per generare sinteticamente immagini cerebrali realistiche condizionate in base al tipo di scanner. Sono stati valutati diversi modelli generativi e, infine, è stato proposto un Variational Autoencoder (VAE) condizionato con una funzione di perdita log-cosh. Il modello è stato addestrato su dati MRI reali etichettati per tipo di scanner ed è stato valutato utilizzando la Fréchet Inception Distance (FID) calcolata con Inception-V3 pre-addestrato su ImageNet. Il VAE condizionato ha ottenuto risultati competitivi. Inoltre, l’analisi visiva ha confermato che il modello è stato in grado di generare immagini realistiche condizionate in base alla distribuzione e alle caratteristiche dei diversi tipi di scanner. Nel complesso, l’approccio proposto rappresenta un metodo pratico ed estensibile per arricchire i dataset medici in scenari in cui la disponibilità dei dati costituisce una sfida critica.
File allegati
File Dimensione Formato  
2025_10_Ballesteros_Thesis.pdf

accessibile in internet per tutti

Descrizione: Tesi
Dimensione 4.55 MB
Formato Adobe PDF
4.55 MB Adobe PDF Visualizza/Apri
2025_10_Ballesteros_Executive Summary.pdf

accessibile in internet per tutti

Descrizione: Executive Summary
Dimensione 1.01 MB
Formato Adobe PDF
1.01 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/242971