Recent advances in ultrafast ultrasound (UFUS) imaging open doors to innovative clinical applications for real-time monitoring of physiological processes, thanks to higher frame rates than traditional ultrasound imaging. Nevertheless, compared to them, UFUS produces a lower image quality due to unfocused beams. This drawback has been recently addressed with deep learning-based approaches aiming to reduce image artefacts and to preserve speckle patterns while maintaining high frame rates. Yet, these methods predominantly rely on datasets primarily composed of both simulated and in vitro acquisitions, which may not accurately represent the variability of in vivo experiments. Moreover, most of these approaches focus on the radio-frequency (RF) representation of ultrasound images, overlooking other representations like In Phase Quadrature (IQ) and B-mode. Building on previous work, this thesis firstly examines how the performance of a pre-existing CNN’s architecture varies when it is trained with the RF representation on in vivo images instead of simulated data. Secondly, a novel U-Net-based architecture is proposed to improve the current method. That architecture is trained with a combination of Mean Signed Logarithmic Absolute Error and Kullback-Leibler divergence, in order to more effectively preserve the probability distributions of the echogenicity values. Additionally, the proposed approach is extended to IQ representations. Comparable results are reached both with the previous real-valued architecture and with a novel complex-valued U-Net-based architecture. Finally, the method is extended to the B-mode domain, where models are trained using different loss functions, including perceptual, spectral, and adversarial losses. However, in contrast to the successful implementation with RF and IQ, the attempts in the B-mode domain face challenges in effectively preserving speckle patterns and contrast. This work explores innovative methods for image enhancement and thus contributes to the advancement of UFUS research. Our results in RF and IQ demonstrate significant improvements in image quality of single unfocused acquisitions, with a substantial reduction of artefacts.

I recenti progressi nell'ecografia a ultrasuoni ultrarapidi (UFUS) aprono le porte ad applicazioni cliniche innovative per il monitoraggio in tempo reale dei processi fisiologici, grazie a frequenze di fotogrammi più elevate rispetto all'ecografia tradizionale. Tuttavia, rispetto ad essa, la tecnica UFUS produce una qualità d'immagine inferiore a causa dei fasci non focalizzati. Questo svantaggio è stato recentemente affrontato con approcci basati sul deep learning che mirano a ridurre gli artefatti dell'immagine e a preservare i pattern speckle, mantenendo al contempo un'elevata velocità di trasmissione. Tuttavia, questi metodi si basano prevalentemente su set di dati composti principalmente da acquisizioni simulate e in vitro, che potrebbero non rappresentare accuratamente la variabilità degli esperimenti in vivo. Inoltre, la maggior parte di questi approcci si concentra sulla rappresentazione a radiofrequenza (RF) delle immagini a ultrasuoni, trascurando altre rappresentazioni come la quadratura in fase (IQ) e la B-mode. Sulla base di un lavoro precedente, questa tesi esamina innanzitutto come variano le prestazioni dell'architettura di una CNN preesistente quando viene addestrata con la rappresentazione RF su immagini in vivo invece che su dati simulati. In secondo luogo, viene proposta una nuova architettura basata su U-Net per migliorare il metodo attuale. Tale architettura viene addestrata con una combinazione di Errore Assoluto Logaritmico Medio con Segno e divergenza di Kullback-Leibler, al fine di preservare più efficacemente le distribuzioni di probabilità dei valori di ecogenicità. Inoltre, l'approccio proposto viene esteso alle rappresentazioni IQ. Si ottengono risultati comparabili sia con la precedente architettura a valori reali sia con una nuova architettura a valori complessi basata su U-Net. Infine, il metodo viene esteso al dominio B-mode, dove i modelli vengono addestrati utilizzando diverse funzioni di perdita, tra cui perdite percettive, spettrali e avversarie. Tuttavia, a differenza del successo dell'implementazione con RF e IQ, i tentativi nel dominio B-mode incontrano difficoltà nel preservare efficacemente i pattern speckle e il contrasto. Questo lavoro esplora metodi innovativi per il miglioramento delle immagini, contribuendo così al progresso della ricerca UFUS. I nostri risultati in RF e IQ dimostrano miglioramenti significativi nella qualità dell'immagine di singole acquisizioni non focalizzate, con una sostanziale riduzione degli artefatti.

Data Distributions Effect on CNN-based Ultrafast Ultrasound Image Improvement

MOTTA, PAOLO
2022/2023

Abstract

Recent advances in ultrafast ultrasound (UFUS) imaging open doors to innovative clinical applications for real-time monitoring of physiological processes, thanks to higher frame rates than traditional ultrasound imaging. Nevertheless, compared to them, UFUS produces a lower image quality due to unfocused beams. This drawback has been recently addressed with deep learning-based approaches aiming to reduce image artefacts and to preserve speckle patterns while maintaining high frame rates. Yet, these methods predominantly rely on datasets primarily composed of both simulated and in vitro acquisitions, which may not accurately represent the variability of in vivo experiments. Moreover, most of these approaches focus on the radio-frequency (RF) representation of ultrasound images, overlooking other representations like In Phase Quadrature (IQ) and B-mode. Building on previous work, this thesis firstly examines how the performance of a pre-existing CNN’s architecture varies when it is trained with the RF representation on in vivo images instead of simulated data. Secondly, a novel U-Net-based architecture is proposed to improve the current method. That architecture is trained with a combination of Mean Signed Logarithmic Absolute Error and Kullback-Leibler divergence, in order to more effectively preserve the probability distributions of the echogenicity values. Additionally, the proposed approach is extended to IQ representations. Comparable results are reached both with the previous real-valued architecture and with a novel complex-valued U-Net-based architecture. Finally, the method is extended to the B-mode domain, where models are trained using different loss functions, including perceptual, spectral, and adversarial losses. However, in contrast to the successful implementation with RF and IQ, the attempts in the B-mode domain face challenges in effectively preserving speckle patterns and contrast. This work explores innovative methods for image enhancement and thus contributes to the advancement of UFUS research. Our results in RF and IQ demonstrate significant improvements in image quality of single unfocused acquisitions, with a substantial reduction of artefacts.
MANZONI, ANDREA
THIRAN, JEAN-PHILIPPE
VINALS TERRES, ROSER
ING - Scuola di Ingegneria Industriale e dell'Informazione
5-ott-2023
2022/2023
I recenti progressi nell'ecografia a ultrasuoni ultrarapidi (UFUS) aprono le porte ad applicazioni cliniche innovative per il monitoraggio in tempo reale dei processi fisiologici, grazie a frequenze di fotogrammi più elevate rispetto all'ecografia tradizionale. Tuttavia, rispetto ad essa, la tecnica UFUS produce una qualità d'immagine inferiore a causa dei fasci non focalizzati. Questo svantaggio è stato recentemente affrontato con approcci basati sul deep learning che mirano a ridurre gli artefatti dell'immagine e a preservare i pattern speckle, mantenendo al contempo un'elevata velocità di trasmissione. Tuttavia, questi metodi si basano prevalentemente su set di dati composti principalmente da acquisizioni simulate e in vitro, che potrebbero non rappresentare accuratamente la variabilità degli esperimenti in vivo. Inoltre, la maggior parte di questi approcci si concentra sulla rappresentazione a radiofrequenza (RF) delle immagini a ultrasuoni, trascurando altre rappresentazioni come la quadratura in fase (IQ) e la B-mode. Sulla base di un lavoro precedente, questa tesi esamina innanzitutto come variano le prestazioni dell'architettura di una CNN preesistente quando viene addestrata con la rappresentazione RF su immagini in vivo invece che su dati simulati. In secondo luogo, viene proposta una nuova architettura basata su U-Net per migliorare il metodo attuale. Tale architettura viene addestrata con una combinazione di Errore Assoluto Logaritmico Medio con Segno e divergenza di Kullback-Leibler, al fine di preservare più efficacemente le distribuzioni di probabilità dei valori di ecogenicità. Inoltre, l'approccio proposto viene esteso alle rappresentazioni IQ. Si ottengono risultati comparabili sia con la precedente architettura a valori reali sia con una nuova architettura a valori complessi basata su U-Net. Infine, il metodo viene esteso al dominio B-mode, dove i modelli vengono addestrati utilizzando diverse funzioni di perdita, tra cui perdite percettive, spettrali e avversarie. Tuttavia, a differenza del successo dell'implementazione con RF e IQ, i tentativi nel dominio B-mode incontrano difficoltà nel preservare efficacemente i pattern speckle e il contrasto. Questo lavoro esplora metodi innovativi per il miglioramento delle immagini, contribuendo così al progresso della ricerca UFUS. I nostri risultati in RF e IQ dimostrano miglioramenti significativi nella qualità dell'immagine di singole acquisizioni non focalizzate, con una sostanziale riduzione degli artefatti.
File allegati
File Dimensione Formato  
Master_Thesis.pdf

non accessibile

Descrizione: Master's Thesis
Dimensione 73.08 MB
Formato Adobe PDF
73.08 MB Adobe PDF   Visualizza/Apri
Executive_Summary.pdf

non accessibile

Descrizione: Executive Summary of Master's Thesis
Dimensione 13.98 MB
Formato Adobe PDF
13.98 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/210395