One in eight women will be diagnosed with breast cancer in her lifetime. The complexity of the disease is well-documented, yet its early-stage detection can significantly reduce mortality rates over the long term. As a universal public health issue, breast cancer is addressed through massive screening programs, demanding significant time and human resources. In this scenario, this thesis delves into the application of deep learning algorithms to streamline the detection of breast cancer lesions through Digital Breast Tomosynthesis (DBT), an advanced imaging technique reported to enhance diagnostic accuracy by providing a pseudo-3D view of the lesioned breast. While reducing women's recall rates of an estimated 30%, DBT requires twice as long reading time as the gold standard in breast screening, Digital Mammography (DM). Supporting radiologists in this resource-consuming process, automated lesion detection applications can make the difference. The entire research is conducted navigating through the complexities of leveraging open-source data, with the objective of contributing to the body of knowledge by offering a methodological foundation for future applications on consistent and curated datasets. With the vast majority of the studies present in the literature relying on private datasets, this thesis aims to bridge the existing gap by developing and comparatively analyze two end-to-end pipelines. The first approach relies on Detectron object detection algorithm and explores the application of transfer learning from DM to DBT images. The second approach consists of a two-phased strategy, involving the classification of DBT patches followed by the lesion localization on full DBT slices. This solution produces an intuitive heatmap output, meeting the interpretability requirements of medical applications. This analysis demonstrates the effectiveness of both the approaches, while drawing the attention to the challenges introduced by the utilization of open-source data and pointing to the advantages of transitioning to 3D modeling to exploit DBT diagnostic potential to the fullest.

Il cancro al seno viene diagnosticato su una donna su otto, nel corso della sua vita. La complessità della malattia è ben documentata, tuttavia la diagnosi precoce può ridurre significativamente i tassi di mortalità a lungo termine. Le autorità sanitarie dei diversi paesi affrontano tale grave patologia con l'implementazione di programmi di screening su larga scala, che richiedono un significativo impiego di tempo e risorse umane. In questo scenario, la tesi approfondisce l'applicazione di algoritmi di deep learning per semplificare la rilevazione di lesioni da cancro al seno attraverso la Tomosintesi Mammaria Digitale (DBT), una tecnica di imaging avanzata che ha dimostrato di migliorare l'accuratezza diagnostica fornendo una vista pseudo-3D del seno lesionato. Sebbene riduca i tassi di richiamo delle donne di circa il 30%, la DBT richiede un tempo di lettura raddoppiato rispetto alla Mammografia Digitale (DM), che costituisce, oggi, la tecnica di riferimento nello screening del seno. Le applicazioni di rilevamento automatico delle lesioni, supportando i radiologi in questo dispendioso processo di analisi, possono fare la differenza. L'intera ricerca si propone, pur con i vincoli e le complessità indotte dallo sfruttamento dei dati open-source, di contribuire al patrimonio delle conoscenze offrendo una base metodologica per le future applicazioni su dataset privati di più facile gestione. Sviluppando ed analizzando comparativamente due pipeline end-to-end, questa tesi mira a colmare le lacune derivanti dal fatto che la stragrande maggioranza degli studi presenti in letteratura si affidano a dataset privati. Il primo approccio si basa sull'algoritmo di rilevamento di oggetti Detectron ed esplora l'applicazione del transfer learning dalle immagini di DM alle DBT. Il secondo approccio consiste in una strategia articolata su due fasi, che prevedono la classificazione delle patches di DBT seguita dalla localizzazione delle lesioni su intere slices di DBT. Questa soluzione produce un output sotto forma di heatmap intuitivo, in linea con i requisiti di interpretabilità delle applicazioni mediche. L'analisi dimostra l'efficacia dei due approcci e, focalizzando l'attenzione sulle sfide introdotte dall'utilizzo di dati open-source, fa emergere i vantaggi della transizione alla modellazione 3D, che consente di sfruttare appieno il potenziale diagnostico della DBT.

Improving breast cancer detection through deep learning and digital breast tomosynthesis leveraging open-source data

MOCETTI, CHIARA
2023/2024

Abstract

One in eight women will be diagnosed with breast cancer in her lifetime. The complexity of the disease is well-documented, yet its early-stage detection can significantly reduce mortality rates over the long term. As a universal public health issue, breast cancer is addressed through massive screening programs, demanding significant time and human resources. In this scenario, this thesis delves into the application of deep learning algorithms to streamline the detection of breast cancer lesions through Digital Breast Tomosynthesis (DBT), an advanced imaging technique reported to enhance diagnostic accuracy by providing a pseudo-3D view of the lesioned breast. While reducing women's recall rates of an estimated 30%, DBT requires twice as long reading time as the gold standard in breast screening, Digital Mammography (DM). Supporting radiologists in this resource-consuming process, automated lesion detection applications can make the difference. The entire research is conducted navigating through the complexities of leveraging open-source data, with the objective of contributing to the body of knowledge by offering a methodological foundation for future applications on consistent and curated datasets. With the vast majority of the studies present in the literature relying on private datasets, this thesis aims to bridge the existing gap by developing and comparatively analyze two end-to-end pipelines. The first approach relies on Detectron object detection algorithm and explores the application of transfer learning from DM to DBT images. The second approach consists of a two-phased strategy, involving the classification of DBT patches followed by the lesion localization on full DBT slices. This solution produces an intuitive heatmap output, meeting the interpretability requirements of medical applications. This analysis demonstrates the effectiveness of both the approaches, while drawing the attention to the challenges introduced by the utilization of open-source data and pointing to the advantages of transitioning to 3D modeling to exploit DBT diagnostic potential to the fullest.
COMOTTO, FEDERICO
ING - Scuola di Ingegneria Industriale e dell'Informazione
9-apr-2024
2023/2024
Il cancro al seno viene diagnosticato su una donna su otto, nel corso della sua vita. La complessità della malattia è ben documentata, tuttavia la diagnosi precoce può ridurre significativamente i tassi di mortalità a lungo termine. Le autorità sanitarie dei diversi paesi affrontano tale grave patologia con l'implementazione di programmi di screening su larga scala, che richiedono un significativo impiego di tempo e risorse umane. In questo scenario, la tesi approfondisce l'applicazione di algoritmi di deep learning per semplificare la rilevazione di lesioni da cancro al seno attraverso la Tomosintesi Mammaria Digitale (DBT), una tecnica di imaging avanzata che ha dimostrato di migliorare l'accuratezza diagnostica fornendo una vista pseudo-3D del seno lesionato. Sebbene riduca i tassi di richiamo delle donne di circa il 30%, la DBT richiede un tempo di lettura raddoppiato rispetto alla Mammografia Digitale (DM), che costituisce, oggi, la tecnica di riferimento nello screening del seno. Le applicazioni di rilevamento automatico delle lesioni, supportando i radiologi in questo dispendioso processo di analisi, possono fare la differenza. L'intera ricerca si propone, pur con i vincoli e le complessità indotte dallo sfruttamento dei dati open-source, di contribuire al patrimonio delle conoscenze offrendo una base metodologica per le future applicazioni su dataset privati di più facile gestione. Sviluppando ed analizzando comparativamente due pipeline end-to-end, questa tesi mira a colmare le lacune derivanti dal fatto che la stragrande maggioranza degli studi presenti in letteratura si affidano a dataset privati. Il primo approccio si basa sull'algoritmo di rilevamento di oggetti Detectron ed esplora l'applicazione del transfer learning dalle immagini di DM alle DBT. Il secondo approccio consiste in una strategia articolata su due fasi, che prevedono la classificazione delle patches di DBT seguita dalla localizzazione delle lesioni su intere slices di DBT. Questa soluzione produce un output sotto forma di heatmap intuitivo, in linea con i requisiti di interpretabilità delle applicazioni mediche. L'analisi dimostra l'efficacia dei due approcci e, focalizzando l'attenzione sulle sfide introdotte dall'utilizzo di dati open-source, fa emergere i vantaggi della transizione alla modellazione 3D, che consente di sfruttare appieno il potenziale diagnostico della DBT.
File allegati
File Dimensione Formato  
2024_04_Mocetti_Executive Summary_02.pdf

accessibile in internet per tutti

Descrizione: Executive Summary
Dimensione 4.2 MB
Formato Adobe PDF
4.2 MB Adobe PDF Visualizza/Apri
2024_04_Mocetti_Tesi_01.pdf

accessibile in internet per tutti

Descrizione: Tesi
Dimensione 15.71 MB
Formato Adobe PDF
15.71 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/219894