The diagnosis and treatment of brain tumors represent one of the most complex challenges in modern medicine, due to their wide variety and location within the skull. Among these, gliomas are the most common, with Glioblastoma Multiforme (GBM) being the most aggressive and lethal form. In this context, accurate segmentation of Magnetic Resonance Imaging (MRI) plays a crucial role, as it allows for precise determination of the extent and characteristics of the lesion, improving treatment planning and disease monitoring. Although the use of multimodal images (T1, T2, T1ce, and FLAIR) is ideal for accurate segmentation, in clinical practice, data availability is often limited to a single modality, generally T1 with contrast enhancement (T1ce). This study addresses the problem of brain tumor segmentation in scenarios with limited data availability, analyzing three key aspects: the comparison of different deep learning architectures to evaluate whether models based on ResNet and Transformer outperform the simpler VNet; the impact of knowledge distillation to determine if a unimodal model can benefit from a teacher-student framework with the teacher trained on multimodal data; and the effect of dataset expansion on the improvement of segmentation quality. Experiments were conducted with progressively larger datasets, starting with the BraTS2018 dataset and integrating images from BraTS2023. The results show that more complex architectures do not provide significant improvements over an optimized VNet. Distillation is only useful with simpler architectures. The most impactful factor is the size of the dataset, which significantly improves predictions for all architectures. In particular, it enabled the unimodal VNet model to achieve a Dice Score of 85.62% for the whole tumor. In a unimodal context, a well-optimized VNet trained on a large dataset represents the most effective and adaptable solution for clinical use, combining accuracy and computational efficiency.

La diagnosi e il trattamento dei tumori cerebrali rappresentano una delle sfide più complesse della medicina moderna, a causa della loro grande varietà e localizzazione all'interno del cranio. Tra questi, i gliomi sono i più diffusi, con il Glioblastoma Multiforme (GBM) come forma più aggressiva e letale. In questo contesto, la segmentazione accurata delle immagini di Risonanza Magnetica (RM) assume un ruolo fondamentale, poiché consente di determinare con precisione l'estensione e le caratteristiche della lesione, migliorando la pianificazione del trattamento e il monitoraggio della malattia. Sebbene l’uso di immagini multimodali (T1, T2, T1ce e FLAIR) sia ideale per una segmentazione accurata, nella pratica clinica la disponibilità dei dati è spesso limitata a una singola modalità, generalmente la T1 con mezzo di contrasto (T1ce). Questo studio affronta il problema della segmentazione dei tumori cerebrali nello scenario in cui la disponibilità dei dati sia limitata, analizzando tre aspetti chiave: il confronto tra diverse architetture di deep learning, valutando se modelli basati su ResNet e Transformer superano la semplice VNet; l’impatto della distillazione di conoscenza, per determinare se un modello unimodale può beneficiare di un framework teacher-student con teacher addestrato su dati multimodali; e l’effetto dell’espansione del dataset sul miglioramento della qualità della segmentazione. Gli esperimenti sono stati condotti con dataset di dimensioni crescenti, partendo dal dataset BraTS2018 e integrando con immagini del BraTS2023. I risultati mostrano che le architetture più complesse, non offrono miglioramenti significativi rispetto a una VNet ottimizzata. La distillazione risulta utile solo con architetture più semplici. Il fattore più determinante è la dimensione del dataset, capace di migliorare significativamente le predizioni di tutte le architetture. In particolare, ha permesso al modello unimodale VNet di raggiungere un Dice Score dell’85,62% per l'intero tumore. In un contesto unimodale, una VNet ben ottimizzata e addestrata su un dataset ampio rappresenta la soluzione più efficace e adattabile all'uso clinico, combinando accuratezza ed efficienza computazionale.

Segmentazione di tumori cerebrali con modalita' mancanti attraverso deep-learning e distillazione: il reale ruolo dei dati rispetto alla complessita' dei modelli

Piazzoli, Marta
2023/2024

Abstract

The diagnosis and treatment of brain tumors represent one of the most complex challenges in modern medicine, due to their wide variety and location within the skull. Among these, gliomas are the most common, with Glioblastoma Multiforme (GBM) being the most aggressive and lethal form. In this context, accurate segmentation of Magnetic Resonance Imaging (MRI) plays a crucial role, as it allows for precise determination of the extent and characteristics of the lesion, improving treatment planning and disease monitoring. Although the use of multimodal images (T1, T2, T1ce, and FLAIR) is ideal for accurate segmentation, in clinical practice, data availability is often limited to a single modality, generally T1 with contrast enhancement (T1ce). This study addresses the problem of brain tumor segmentation in scenarios with limited data availability, analyzing three key aspects: the comparison of different deep learning architectures to evaluate whether models based on ResNet and Transformer outperform the simpler VNet; the impact of knowledge distillation to determine if a unimodal model can benefit from a teacher-student framework with the teacher trained on multimodal data; and the effect of dataset expansion on the improvement of segmentation quality. Experiments were conducted with progressively larger datasets, starting with the BraTS2018 dataset and integrating images from BraTS2023. The results show that more complex architectures do not provide significant improvements over an optimized VNet. Distillation is only useful with simpler architectures. The most impactful factor is the size of the dataset, which significantly improves predictions for all architectures. In particular, it enabled the unimodal VNet model to achieve a Dice Score of 85.62% for the whole tumor. In a unimodal context, a well-optimized VNet trained on a large dataset represents the most effective and adaptable solution for clinical use, combining accuracy and computational efficiency.
MILESI, DAVIDE
ING - Scuola di Ingegneria Industriale e dell'Informazione
3-apr-2025
2023/2024
La diagnosi e il trattamento dei tumori cerebrali rappresentano una delle sfide più complesse della medicina moderna, a causa della loro grande varietà e localizzazione all'interno del cranio. Tra questi, i gliomi sono i più diffusi, con il Glioblastoma Multiforme (GBM) come forma più aggressiva e letale. In questo contesto, la segmentazione accurata delle immagini di Risonanza Magnetica (RM) assume un ruolo fondamentale, poiché consente di determinare con precisione l'estensione e le caratteristiche della lesione, migliorando la pianificazione del trattamento e il monitoraggio della malattia. Sebbene l’uso di immagini multimodali (T1, T2, T1ce e FLAIR) sia ideale per una segmentazione accurata, nella pratica clinica la disponibilità dei dati è spesso limitata a una singola modalità, generalmente la T1 con mezzo di contrasto (T1ce). Questo studio affronta il problema della segmentazione dei tumori cerebrali nello scenario in cui la disponibilità dei dati sia limitata, analizzando tre aspetti chiave: il confronto tra diverse architetture di deep learning, valutando se modelli basati su ResNet e Transformer superano la semplice VNet; l’impatto della distillazione di conoscenza, per determinare se un modello unimodale può beneficiare di un framework teacher-student con teacher addestrato su dati multimodali; e l’effetto dell’espansione del dataset sul miglioramento della qualità della segmentazione. Gli esperimenti sono stati condotti con dataset di dimensioni crescenti, partendo dal dataset BraTS2018 e integrando con immagini del BraTS2023. I risultati mostrano che le architetture più complesse, non offrono miglioramenti significativi rispetto a una VNet ottimizzata. La distillazione risulta utile solo con architetture più semplici. Il fattore più determinante è la dimensione del dataset, capace di migliorare significativamente le predizioni di tutte le architetture. In particolare, ha permesso al modello unimodale VNet di raggiungere un Dice Score dell’85,62% per l'intero tumore. In un contesto unimodale, una VNet ben ottimizzata e addestrata su un dataset ampio rappresenta la soluzione più efficace e adattabile all'uso clinico, combinando accuratezza ed efficienza computazionale.
File allegati
File Dimensione Formato  
2025_4_Piazzoli_Tesi.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Testo della tesi
Dimensione 7.38 MB
Formato Adobe PDF
7.38 MB Adobe PDF   Visualizza/Apri
2025_4_Piazzoli_ExecutiveSummary.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Executive summary
Dimensione 950.25 kB
Formato Adobe PDF
950.25 kB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/236389