Multispectral imaging plays a crucial role in various applications, as relying solely on the visible spectrum is often insufficient for computer vision tasks. Expanding imaging capabilities to include non-visible ranges offers significant advantages. In this study, we utilized a two-terminal dual-band detector to capture images of different solvents by reversing the bias polarity between the near-infrared (NIR) and visible bands. The primary objective is to perform classification for the liquids in the acquired data. The research encompasses several key steps, starting with the careful acquisition of solvent images under optimal illumination and focus conditions. The acquired data undergoes preprocessing, which includes addressing vignetting effects, definition of specific portions in the visible and NIR images and extracting features along the "meniscus" region or within the liquid portions. Principal Component Analysis (PCA) is then applied to reduce dimensionality. A major focus of the study is to investigate whether considering the ratio of NIR and visible information, represented by an appropriate matrix, yields better results compared to considering them separately. This newly created section is trained alongside the other features and subsequently evaluated for performance comparison. The theoretical foundations of several classifiers are explained in one of the chapters, followed by their practical implementation and testing on the dataset to evaluate their performance. The performance of the models on the dataset is extensively discussed and their effectiveness is analyzed. At last additional images are utilized to make predictions using the trained models in order to verify the robustness and generalizability of the obtained results.

L’imaging multispettrale svolge un ruolo cruciale in varie applicazioni, poiché affidarsi esclusivamente allo spettro visibile spesso non è sufficiente per compiti di visione artificiale. Espandere le capacità di imaging per includere intervalli non visibili offre significativi vantaggi. In questo studio, abbiamo utilizzato un rilevatore dual-band a due terminali per acquisire immagini di diversi solventi invertendo la polarità di bias tra le bande del vicino infrarosso (NIR) e visibile. L’obiettivo principale è quello di eseguire una classificazione dei liquidi nei dati acquisiti. La ricerca comprende diversi passaggi chiave, a partire dall’acquisizione accurata delle immagini del solvente in condizioni di illuminazione e messa a fuoco ottimali. I dati acquisiti vengono sottoposti a un pre-processing, che include la gestione degli effetti di vignettatura, la definizione di porzioni specifiche nelle immagini visibili e NIR e l’estrazione delle caratteristiche lungo la regione del "menisco" o all’interno delle porzioni liquide. Successivamente viene applicata un’Analisi delle Componenti Principali (PCA) per ridurre la dimensionalità. Una delle principali aree di interesse dello studio è stato esaminare se considerare il rapporto tra le informazioni NIR e visibili, rappresentato da una matrice apposita, porti a risultati migliori rispetto a considerarle separatamente. Questa nuova sezione viene inclusa nell’addestramento insieme alle altre caratteristiche e successivamente valutata per confrontarne le prestazioni. Le fondamenta teoriche di diversi classificatori vengono spiegate in uno dei capitoli, seguite dalla loro implementazione pratica e poi testati sul dataset per valutarne le prestazioni. Le prestazioni dei modelli sul dataset vengono ampiamente discusse e la loro efficacia viene analizzata. Infine, immagini aggiuntive vengono utilizzate per effettuare previsioni utilizzando i modelli addestrati al fine di verificare la robustezza e la generalizzabilità dei risultati ottenuti.

Multispectral imaging for solvent classification using NIR and Visible Spectra

Riccardi, Martino
2022/2023

Abstract

Multispectral imaging plays a crucial role in various applications, as relying solely on the visible spectrum is often insufficient for computer vision tasks. Expanding imaging capabilities to include non-visible ranges offers significant advantages. In this study, we utilized a two-terminal dual-band detector to capture images of different solvents by reversing the bias polarity between the near-infrared (NIR) and visible bands. The primary objective is to perform classification for the liquids in the acquired data. The research encompasses several key steps, starting with the careful acquisition of solvent images under optimal illumination and focus conditions. The acquired data undergoes preprocessing, which includes addressing vignetting effects, definition of specific portions in the visible and NIR images and extracting features along the "meniscus" region or within the liquid portions. Principal Component Analysis (PCA) is then applied to reduce dimensionality. A major focus of the study is to investigate whether considering the ratio of NIR and visible information, represented by an appropriate matrix, yields better results compared to considering them separately. This newly created section is trained alongside the other features and subsequently evaluated for performance comparison. The theoretical foundations of several classifiers are explained in one of the chapters, followed by their practical implementation and testing on the dataset to evaluate their performance. The performance of the models on the dataset is extensively discussed and their effectiveness is analyzed. At last additional images are utilized to make predictions using the trained models in order to verify the robustness and generalizability of the obtained results.
LEONZIO, DANIELE UGO
ING - Scuola di Ingegneria Industriale e dell'Informazione
18-lug-2023
2022/2023
L’imaging multispettrale svolge un ruolo cruciale in varie applicazioni, poiché affidarsi esclusivamente allo spettro visibile spesso non è sufficiente per compiti di visione artificiale. Espandere le capacità di imaging per includere intervalli non visibili offre significativi vantaggi. In questo studio, abbiamo utilizzato un rilevatore dual-band a due terminali per acquisire immagini di diversi solventi invertendo la polarità di bias tra le bande del vicino infrarosso (NIR) e visibile. L’obiettivo principale è quello di eseguire una classificazione dei liquidi nei dati acquisiti. La ricerca comprende diversi passaggi chiave, a partire dall’acquisizione accurata delle immagini del solvente in condizioni di illuminazione e messa a fuoco ottimali. I dati acquisiti vengono sottoposti a un pre-processing, che include la gestione degli effetti di vignettatura, la definizione di porzioni specifiche nelle immagini visibili e NIR e l’estrazione delle caratteristiche lungo la regione del "menisco" o all’interno delle porzioni liquide. Successivamente viene applicata un’Analisi delle Componenti Principali (PCA) per ridurre la dimensionalità. Una delle principali aree di interesse dello studio è stato esaminare se considerare il rapporto tra le informazioni NIR e visibili, rappresentato da una matrice apposita, porti a risultati migliori rispetto a considerarle separatamente. Questa nuova sezione viene inclusa nell’addestramento insieme alle altre caratteristiche e successivamente valutata per confrontarne le prestazioni. Le fondamenta teoriche di diversi classificatori vengono spiegate in uno dei capitoli, seguite dalla loro implementazione pratica e poi testati sul dataset per valutarne le prestazioni. Le prestazioni dei modelli sul dataset vengono ampiamente discusse e la loro efficacia viene analizzata. Infine, immagini aggiuntive vengono utilizzate per effettuare previsioni utilizzando i modelli addestrati al fine di verificare la robustezza e la generalizzabilità dei risultati ottenuti.
File allegati
File Dimensione Formato  
Thesis_Riccardi_sensor_VIS_IR.pdf

accessibile in internet solo dagli utenti autorizzati

Dimensione 3.88 MB
Formato Adobe PDF
3.88 MB Adobe PDF   Visualizza/Apri
Executive_Riccardi_sensor_VIS_IR.pdf

Open Access dal 04/07/2024

Dimensione 390.83 kB
Formato Adobe PDF
390.83 kB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/208623