The aim of this work is to continue the existing studies regarding a problem that has arised since the early 1980s: the development of an automated system for animal keratin fibers classication, through feature extraction fromelectron microscope images. In particular it focuses on features’ analysis after their acquisition, in order to obtain a optimal classificator able to determine the origin of a fiber fromits features. Initially the sample data is analysed considering the entire feature set, using the two layer perceptron to build the classifier; the objective is to minimize the misclassification error, i.e. the percentage of misclassified fibers. After a critical observation of the data, it arises the need to exctract a smaller and less noisy feature set. Therefore it is performed a dimensional reduction through the method proposed here, that involves several repetitions of a Forward Feature Selection algorithm and uses the results obtained to define the desired reduced feature set. This method leads to an improvement in the experimental results and shows the property of stability with respect to the initial conditions. Moreover, the problem is analysed also with classical classification and feature selection methods, and the experimental results are compared with the ones obtained with our method. These results confirm better efficiency of our proposed procedure; our method is therefore shown to be suitable in solving the issues of redundancy of features with limited number of data, as well as strong non-linearity of the problem under study.

L’obbiettivo di questo elaborato è quello di proseguire lo studio riguardante un problema emerso a partire dalla metà degli anni 80: lo sviluppo di un sistema automatico per il riconoscimento e la classificazione di fibre cheratiniche animali tramite estrazione di feature da immagini a microscopio elettronico. In particolare si focalizza sull’analisi delle feature a valle della loro acquisizione, al fine di ottenere un classificatore in grado di stabilire la natura di una fibra note le feature della fibra stessa. Inizialmente viene analizzato il campione di dati a disposizione considerando l’intero set di feature, utilizzando il percettrone a due strati per costruire il classificatore. L’obbiettivo è quello di minimizzare l’errore di misclassificazione, ovvero la percentuale di fibre malclassificate. Un’osservazione critica dei dati rileva la necessità di estrarre un insieme più limitato e meno rumoroso di indicatori. Si passa quindi ad effettuare una riduzione dimensionale tramite il metodo qui proposto, che prevede varie ripetizioni dell’algoritmo di Forward Feature Selection e che sfrutta i risultati ottenuti in modo da definire l’insieme ridotto di feature desiderato. Tale metodo porta ad un miglioramento nei risultati sperimentali e dimostra di essere stabile rispetto alle condizioni iniziali. Inoltre si affronta il problema anche tramite classiche analisi di classificazione e riduzione dimensionale, e se ne mettono a confronto i risultati sperimentali. Questi confermano la miglior efficacia del procedimento di classificazione da noi proposto, il quale si rivela perciò adatto ad affrontare le problematiche di ridondanza di feature a fronte di un numero limitato di dati, nonchè di forte non linearità del problema in analisi.

Una metodologia di feature selection per reti neurali applicata alla classificazione di fibre cheratiniche

GENTILI, SILVIA
2013/2014

Abstract

The aim of this work is to continue the existing studies regarding a problem that has arised since the early 1980s: the development of an automated system for animal keratin fibers classication, through feature extraction fromelectron microscope images. In particular it focuses on features’ analysis after their acquisition, in order to obtain a optimal classificator able to determine the origin of a fiber fromits features. Initially the sample data is analysed considering the entire feature set, using the two layer perceptron to build the classifier; the objective is to minimize the misclassification error, i.e. the percentage of misclassified fibers. After a critical observation of the data, it arises the need to exctract a smaller and less noisy feature set. Therefore it is performed a dimensional reduction through the method proposed here, that involves several repetitions of a Forward Feature Selection algorithm and uses the results obtained to define the desired reduced feature set. This method leads to an improvement in the experimental results and shows the property of stability with respect to the initial conditions. Moreover, the problem is analysed also with classical classification and feature selection methods, and the experimental results are compared with the ones obtained with our method. These results confirm better efficiency of our proposed procedure; our method is therefore shown to be suitable in solving the issues of redundancy of features with limited number of data, as well as strong non-linearity of the problem under study.
ARRIGONI, MARIO
COMPAGNONI, MARCO
ING - Scuola di Ingegneria Industriale e dell'Informazione
25-lug-2014
2013/2014
L’obbiettivo di questo elaborato è quello di proseguire lo studio riguardante un problema emerso a partire dalla metà degli anni 80: lo sviluppo di un sistema automatico per il riconoscimento e la classificazione di fibre cheratiniche animali tramite estrazione di feature da immagini a microscopio elettronico. In particolare si focalizza sull’analisi delle feature a valle della loro acquisizione, al fine di ottenere un classificatore in grado di stabilire la natura di una fibra note le feature della fibra stessa. Inizialmente viene analizzato il campione di dati a disposizione considerando l’intero set di feature, utilizzando il percettrone a due strati per costruire il classificatore. L’obbiettivo è quello di minimizzare l’errore di misclassificazione, ovvero la percentuale di fibre malclassificate. Un’osservazione critica dei dati rileva la necessità di estrarre un insieme più limitato e meno rumoroso di indicatori. Si passa quindi ad effettuare una riduzione dimensionale tramite il metodo qui proposto, che prevede varie ripetizioni dell’algoritmo di Forward Feature Selection e che sfrutta i risultati ottenuti in modo da definire l’insieme ridotto di feature desiderato. Tale metodo porta ad un miglioramento nei risultati sperimentali e dimostra di essere stabile rispetto alle condizioni iniziali. Inoltre si affronta il problema anche tramite classiche analisi di classificazione e riduzione dimensionale, e se ne mettono a confronto i risultati sperimentali. Questi confermano la miglior efficacia del procedimento di classificazione da noi proposto, il quale si rivela perciò adatto ad affrontare le problematiche di ridondanza di feature a fronte di un numero limitato di dati, nonchè di forte non linearità del problema in analisi.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2014_07_Gentili.pdf

non accessibile

Descrizione: Testo della tesi
Dimensione 5.95 MB
Formato Adobe PDF
5.95 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/94393