In the world of public health, one of the most critical problems about lung cancer is making fast and good diagnosis. This is a task that can be efficiently solved by machine learning image classifications techniques. In this work we use a private dataset consisting of lung cancer cells images divided in four classes: adenocarcinoma, epidermoid carcinoma, OAT-cells and negative cells. To solve the classification task, we first extract powerful images features truncating a Convolutional Neural Network still at level of convolutional layers, training it from scratch or using transfer learning with fine-tuned parameters, both with and without applying data augmentation. Images features are then pooled by applying different types of pooling encoders, like Fisher Vector, Bag of Visual Words and Vector of Locally Aggregated Descriptors. This is done in order to make them more suitable to be classified by a linear Support Vector Machine, which is trained with the pooled features. The experiments show that, using data augmentation and fine-tuning the parameters of a pre-trained CNN, the results obtained with FV encoding quite overtake all the other tested techniques (best mAP: 89.8% train, 70.4% test). This work demonstrates that the above mentioned structure reaches competitive performance in solving medical image classifications tasks.

Per la sanità pubblica, uno dei più grandi problemi riguardanti il cancro ai polmoni è riuscire ad effettuare rapidamente diagnosi corrette. Questo compito può essere risolto in modo efficiente mediante tecniche di classificazione di immagini con machine learning. In questo lavoro è stato utilizzato un dataset privato, costituito da immagini di cellule di cancro ai polmoni suddivise in quattro classi: adenocarcinoma, carcinoma epidermoide, cellule OAT e cellule negative. Per classificarle, vengono innanzitutto estratte le caratteristiche delle immagini troncando una Rete Neurale Convoluzionale a livello degli strati convoluzionali, sia allenandola da zero e sia utilizzando transfer learning ottimizzando i parametri, in entrambi i casi con e senza data augmentation. Le caratteristiche estratte vengono quindi raggruppate applicando diversi tipi di pooling encoders, come Fisher Vector, Bag of Visual Words e Vector of Locally Aggregated Descriptors. Questi hanno la funzione di renderle più adatte ad essere classificate da una Macchina a Vettori di Supporto lineare, la quale viene poi allenata proprio con le caratteristiche raggruppate. Gli esperimenti mostrano che, utilizzando data augmentation e ottimizzando i parametri di una RNC già allenata, i risultati ottenuti usando FV come encoder superano ampiamente tutte le altre tecniche testate (mAP migliore: 89.8% train, 70.4% test). Questo lavoro dimostra che la struttura sopra menzionata raggiunge prestazioni competitive nella risoluzione dei compiti di classificazione di immagini mediche.

Lung cancer cell images classification by fisher vector and convolutional neural network features

RUFFONI, GIACOMO
2019/2020

Abstract

In the world of public health, one of the most critical problems about lung cancer is making fast and good diagnosis. This is a task that can be efficiently solved by machine learning image classifications techniques. In this work we use a private dataset consisting of lung cancer cells images divided in four classes: adenocarcinoma, epidermoid carcinoma, OAT-cells and negative cells. To solve the classification task, we first extract powerful images features truncating a Convolutional Neural Network still at level of convolutional layers, training it from scratch or using transfer learning with fine-tuned parameters, both with and without applying data augmentation. Images features are then pooled by applying different types of pooling encoders, like Fisher Vector, Bag of Visual Words and Vector of Locally Aggregated Descriptors. This is done in order to make them more suitable to be classified by a linear Support Vector Machine, which is trained with the pooled features. The experiments show that, using data augmentation and fine-tuning the parameters of a pre-trained CNN, the results obtained with FV encoding quite overtake all the other tested techniques (best mAP: 89.8% train, 70.4% test). This work demonstrates that the above mentioned structure reaches competitive performance in solving medical image classifications tasks.
FLORINDO, JOAO BATISTA
ING - Scuola di Ingegneria Industriale e dell'Informazione
2-ott-2020
2019/2020
Per la sanità pubblica, uno dei più grandi problemi riguardanti il cancro ai polmoni è riuscire ad effettuare rapidamente diagnosi corrette. Questo compito può essere risolto in modo efficiente mediante tecniche di classificazione di immagini con machine learning. In questo lavoro è stato utilizzato un dataset privato, costituito da immagini di cellule di cancro ai polmoni suddivise in quattro classi: adenocarcinoma, carcinoma epidermoide, cellule OAT e cellule negative. Per classificarle, vengono innanzitutto estratte le caratteristiche delle immagini troncando una Rete Neurale Convoluzionale a livello degli strati convoluzionali, sia allenandola da zero e sia utilizzando transfer learning ottimizzando i parametri, in entrambi i casi con e senza data augmentation. Le caratteristiche estratte vengono quindi raggruppate applicando diversi tipi di pooling encoders, come Fisher Vector, Bag of Visual Words e Vector of Locally Aggregated Descriptors. Questi hanno la funzione di renderle più adatte ad essere classificate da una Macchina a Vettori di Supporto lineare, la quale viene poi allenata proprio con le caratteristiche raggruppate. Gli esperimenti mostrano che, utilizzando data augmentation e ottimizzando i parametri di una RNC già allenata, i risultati ottenuti usando FV come encoder superano ampiamente tutte le altre tecniche testate (mAP migliore: 89.8% train, 70.4% test). Questo lavoro dimostra che la struttura sopra menzionata raggiunge prestazioni competitive nella risoluzione dei compiti di classificazione di immagini mediche.
File allegati
File Dimensione Formato  
2020_10_Ruffoni.pdf

Open Access dal 15/09/2021

Descrizione: Testo della Tesi
Dimensione 8.28 MB
Formato Adobe PDF
8.28 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/166773