This thesis focuses on the development of an algorithm for template recognition in an image. A template is an image used as a reference model for identifying objects of interest. The template detection process is crucial in image processing, as it involves detecting the presence and position of objects within a scene. Image processing plays an increasingly central role in various sectors, offering advanced solutions that facilitate the work of operators. This project fits into this dynamic context, focusing on the use of advanced algorithms for recognizing known figures in acquired im- ages, with potential applications in fields such as augmented reality, autonomous vehicles, and defect detection in industrial processes. Template detection presents challenges primarily related to perspective and photometric distortions caused by environmental factors such as perspective projections and lighting variations that can significantly alter the shape and color of objects in the image. Addi- tionally, partial occlusion of objects by other elements in the scene can further complicate the detection process. Other factors such as scale, rotation, and variations in object defor- mation pose additional challenges, requiring the implementation of techniques to ensure accurate correspondence between the template and the object in the image. The proposed method stands out for its geometric approach, which does not rely on deep learning methods. This method not only identifies the bounding box but also ac- curately determines the exact position of the template within the image, using geometric projections for affine and metric reconstruction. Furthermore, the method can adapt to the addition of new templates without the need to reformulate the model, maintaining high precision and reliability even in adverse conditions such as the presence of outliers, occlusions, and lighting variations.

Questa tesi si concentra sullo sviluppo di un algoritmo per il riconoscimento dei template in un’immagine. Un template è un’immagine utilizzata come modello di riferimento per l’identificazione di oggetti di interesse. Il processo di rilevamento dei template è cruciale nell’elaborazione delle immagini, poiché implica l’individuazione della presenza e della posizione degli oggetti all’interno di una scena. L’elaborazione delle immagini ha un ruolo sempre più centrale in vari settori, offrendo soluzioni avanzate che facilitano il lavoro degli operatori. Questo progetto si inserisce in questo contesto dinamico, focalizzandosi sull’utilizzo di algoritmi avanzati per il riconosci- mento di figure conosciute in immagini acquisite, con possibili applicazioni in settori come la realtà aumentata, i veicoli autonomi e il controllo di difetti nei processi industriali. Il rilevamento dei template presenta sfide legate principalmente a distorsioni prospettiche e fotometriche causate da fattori ambientali come proiezioni prospettiche e variazioni di illuminazione che possono alterare significativamente la forma e il colore degli oggetti nell’immagine. Inoltre, l’occlusione parziale degli oggetti da parte di altri elementi nella scena può complicare ulteriormente il processo di rilevamento Altri fattori come scala, rotazione e variazioni di deformazione degli oggetti pongono sfide aggiuntive, richiedendo l’implementazione di tecniche per garantire una corrispondenza accurata tra il template e l’oggetto nell’immagine. Il metodo proposto si distingue per il suo approccio geometrico, che non richiede l’uso di metodi di deep learning. Questo metodo non solo identifica il bounding box, ma determina anche con precisione la posizione esatta del template all’interno dell’immagine, utilizzando proiezioni geometriche per la ricostruzione affine e metrica. Inoltre, il metodo è in grado di adattarsi all’aggiunta di nuovi template senza la necessità di riformare il modello, mantenendo un’elevata precisione e affidabilità anche in condizioni avverse come la presenza di outlier, occlusioni e variazioni di illuminazione.

Image rectification with a known template

BARIN, MATTEO
2022/2023

Abstract

This thesis focuses on the development of an algorithm for template recognition in an image. A template is an image used as a reference model for identifying objects of interest. The template detection process is crucial in image processing, as it involves detecting the presence and position of objects within a scene. Image processing plays an increasingly central role in various sectors, offering advanced solutions that facilitate the work of operators. This project fits into this dynamic context, focusing on the use of advanced algorithms for recognizing known figures in acquired im- ages, with potential applications in fields such as augmented reality, autonomous vehicles, and defect detection in industrial processes. Template detection presents challenges primarily related to perspective and photometric distortions caused by environmental factors such as perspective projections and lighting variations that can significantly alter the shape and color of objects in the image. Addi- tionally, partial occlusion of objects by other elements in the scene can further complicate the detection process. Other factors such as scale, rotation, and variations in object defor- mation pose additional challenges, requiring the implementation of techniques to ensure accurate correspondence between the template and the object in the image. The proposed method stands out for its geometric approach, which does not rely on deep learning methods. This method not only identifies the bounding box but also ac- curately determines the exact position of the template within the image, using geometric projections for affine and metric reconstruction. Furthermore, the method can adapt to the addition of new templates without the need to reformulate the model, maintaining high precision and reliability even in adverse conditions such as the presence of outliers, occlusions, and lighting variations.
PORFIRI DAL CIN, ANDREA
ING - Scuola di Ingegneria Industriale e dell'Informazione
9-apr-2024
2022/2023
Questa tesi si concentra sullo sviluppo di un algoritmo per il riconoscimento dei template in un’immagine. Un template è un’immagine utilizzata come modello di riferimento per l’identificazione di oggetti di interesse. Il processo di rilevamento dei template è cruciale nell’elaborazione delle immagini, poiché implica l’individuazione della presenza e della posizione degli oggetti all’interno di una scena. L’elaborazione delle immagini ha un ruolo sempre più centrale in vari settori, offrendo soluzioni avanzate che facilitano il lavoro degli operatori. Questo progetto si inserisce in questo contesto dinamico, focalizzandosi sull’utilizzo di algoritmi avanzati per il riconosci- mento di figure conosciute in immagini acquisite, con possibili applicazioni in settori come la realtà aumentata, i veicoli autonomi e il controllo di difetti nei processi industriali. Il rilevamento dei template presenta sfide legate principalmente a distorsioni prospettiche e fotometriche causate da fattori ambientali come proiezioni prospettiche e variazioni di illuminazione che possono alterare significativamente la forma e il colore degli oggetti nell’immagine. Inoltre, l’occlusione parziale degli oggetti da parte di altri elementi nella scena può complicare ulteriormente il processo di rilevamento Altri fattori come scala, rotazione e variazioni di deformazione degli oggetti pongono sfide aggiuntive, richiedendo l’implementazione di tecniche per garantire una corrispondenza accurata tra il template e l’oggetto nell’immagine. Il metodo proposto si distingue per il suo approccio geometrico, che non richiede l’uso di metodi di deep learning. Questo metodo non solo identifica il bounding box, ma determina anche con precisione la posizione esatta del template all’interno dell’immagine, utilizzando proiezioni geometriche per la ricostruzione affine e metrica. Inoltre, il metodo è in grado di adattarsi all’aggiunta di nuovi template senza la necessità di riformare il modello, mantenendo un’elevata precisione e affidabilità anche in condizioni avverse come la presenza di outlier, occlusioni e variazioni di illuminazione.
File allegati
File Dimensione Formato  
TesiM_Barin_Matteo_2024_04.pdf

accessibile in internet per tutti

Dimensione 39.81 MB
Formato Adobe PDF
39.81 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/219756