Colorectal cancer (CRC) is the second-leading cause of cancer deaths worldwide between men and women combined, with incidence and mortality rates of 19.5% and 9% respectively. Colonoscopies are considered the gold-standard for CRC screening due to their proven effectiveness in reducing CRC risk and mortality. Adenoma Detection Rate (ADR) is defined as the proportion of patients who have one or more adenoma detected during a colonoscopy procedure, and is a key quality indicator for colonoscopies. Recent technological advances, especially in the field of Artificial Intelligence (AI) and Deep Learning, have been associated with statistically significant ADR increases. In fact, AI-assisted Computer-Aided Detection (CADe) and Diagnosis (CADx) systems are already commercially available and are seeing a surge in interest in using them in routine procedures. The majority of these AI-assisted CAD* systems exploits specialized Convolutional Neural Networks (CNNs) for localizing and characterizing colorectal lesions. In this Thesis, we evaluate different Deep Learning-based Object Detection architectures as CADe and CADx tools on two recently released, large-scale open-source datasets for colonoscopy, the SUN Dataset and the LDPolypVideo Benchmark. For our experiments we benchmark state-of-the-art YOLOv5 detectors, modified to take into account the spatio-temporal characteristics of colonoscopy data, on the SUN Dataset for training and validation, and on the LDPolypVideo Benchmark exclusively for testing. Our proposed spatio-temporal aware models show an absolute 2% increase in mean Average Precision (mAP) over the static baseline models for both CADe and CADx tasks. Class-specific sensitivity scores suffer from the heavy class imbalance issues present in the SUN Dataset. Overall per-frame sensitivity and specificity scores computed on the independent test dataset are 90.4% and 94.9%, respectively, which are on par with the current literature on polyp detection. On the LDPolypVideo Benchmark, we set new state-of-the-art detection results with recall, precision and F1-score absolute increases of 5%, 7%, and 5%, respectively, with respect to the reported best-performing model. These results provide a starting point benchmark for future works aimed at colonoscopy CAD* systems development with modern Deep Learning architectures.
Il cancro del colon-retto (CRC) è la seconda causa di morte per cancro in tutto il mondo, con tassi di incidenza e mortalità rispettivamente del 19,5% e del 9%. Le colonscopie sono considerate lo standard clinico attuale per lo screening del CRC grazie alla loro comprovata efficacia nel ridurne sia il rischio che la mortalità. Il tasso di rilevamento dell'adenoma (ADR) è definito come la proporzione di pazienti a cui vengono rilevati uno o più adenomi durante una procedura di colonscopia ed è un indicatore chiave della qualità di una colonscopia. I recenti progressi tecnologici, in particolare nell'ambito dell'Intelligenza Artificiale (AI) e del Deep Learning, sono stati associati ad aumenti statisticamente significativi di ADR. A tutti gli effetti, sistemi di rilevamento e diagnosi assistita da computer basati su Intelligenza Artificiale (AI-assisted Computer-Aided Detection and Diagnosis, CADe/CADx) sono già disponibili in commercio e stanno registrando un costante aumento d'interesse nel loro utilizzo in procedure colonoscopiche di routine. La maggior parte di questi sistemi CAD* basati su Intelligenza Artificiale sfrutta reti neurali convoluzionali (CNN), algoritmi specializzati nella localizzazione e caratterizzazione delle lesioni colorettali. In questa Tesi, valutiamo diversi modelli di rilevamento di oggetti basati su Deep Learning come strumenti CADe e CADx su due recenti dataset pubblici di immagini e video colonoscopici: il SUN Dataset e il LDPolypVideo Benchmark. Per i nostri esperimenti confrontiamo i modelli stato dell'arte YOLOv5, modificati in modo da sfruttare le caratteristiche spazio-temporali tipiche dei dati colonoscopici, addestrandoli e validandoli sul SUN Dataset, e infine testandoli esclusivamente su LDPolypVideo Benchmark. I modelli spazio-temporali da noi proposti mostrano un miglioramento assoluto del 2% nel valore di precisione media (mAP) rispetto ai modelli di base. Tuttavia, i punteggi di mAP specifici per classe soffrono dell'irregolare distribuzione delle classi presente nel SUN Dataset. I punteggi complessivi di sensitività e specificità per fotogramma calcolati sul dataset di test indipendente sono rispettivamente del 90,4% e del 94,9%, alla pari con l'attuale letteratura sul rilevamento dei polipi. Sul LDPolypVideo Benchmark, abbiamo stabilito nuovi risultati stato dell'arte nel rilevamento di polipi con aumenti assoluti di richiamo, precisione ed F1-score rispettivamente del 5%, 7% e 5%, rispetto al miglior modello riportato dalla letteratura. Questi risultati forniscono un punto di partenza di riferimento per lavori futuri finalizzati allo sviluppo di sistemi CAD* di colonscopia con moderne architetture di Deep Learning.
Deep learning for computer-aided diagnosis in colonoscopy : a benchmark study
Huynh, Minh Tam Davide
2021/2022
Abstract
Colorectal cancer (CRC) is the second-leading cause of cancer deaths worldwide between men and women combined, with incidence and mortality rates of 19.5% and 9% respectively. Colonoscopies are considered the gold-standard for CRC screening due to their proven effectiveness in reducing CRC risk and mortality. Adenoma Detection Rate (ADR) is defined as the proportion of patients who have one or more adenoma detected during a colonoscopy procedure, and is a key quality indicator for colonoscopies. Recent technological advances, especially in the field of Artificial Intelligence (AI) and Deep Learning, have been associated with statistically significant ADR increases. In fact, AI-assisted Computer-Aided Detection (CADe) and Diagnosis (CADx) systems are already commercially available and are seeing a surge in interest in using them in routine procedures. The majority of these AI-assisted CAD* systems exploits specialized Convolutional Neural Networks (CNNs) for localizing and characterizing colorectal lesions. In this Thesis, we evaluate different Deep Learning-based Object Detection architectures as CADe and CADx tools on two recently released, large-scale open-source datasets for colonoscopy, the SUN Dataset and the LDPolypVideo Benchmark. For our experiments we benchmark state-of-the-art YOLOv5 detectors, modified to take into account the spatio-temporal characteristics of colonoscopy data, on the SUN Dataset for training and validation, and on the LDPolypVideo Benchmark exclusively for testing. Our proposed spatio-temporal aware models show an absolute 2% increase in mean Average Precision (mAP) over the static baseline models for both CADe and CADx tasks. Class-specific sensitivity scores suffer from the heavy class imbalance issues present in the SUN Dataset. Overall per-frame sensitivity and specificity scores computed on the independent test dataset are 90.4% and 94.9%, respectively, which are on par with the current literature on polyp detection. On the LDPolypVideo Benchmark, we set new state-of-the-art detection results with recall, precision and F1-score absolute increases of 5%, 7%, and 5%, respectively, with respect to the reported best-performing model. These results provide a starting point benchmark for future works aimed at colonoscopy CAD* systems development with modern Deep Learning architectures.File | Dimensione | Formato | |
---|---|---|---|
HUYNHTam_MSC_Thesis_928698.pdf
accessibile in internet solo dagli utenti autorizzati
Descrizione: M.Sc. Thesis - Huynh Minh Tam Davide - 928698
Dimensione
86.04 MB
Formato
Adobe PDF
|
86.04 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/196953