The viewing graph is a mathematical structure in which nodes represent cameras, and edges connect pairs of cameras for which the fundamental matrix is known; it provides a compact representation of a multiview scene in the context of projective geometry. In recent years, considerable attention has been devoted to investigating the solvability of the viewing graph, that is, whether the fundamental matrices given in the graph are sufficient to uniquely reconstruct a projective camera configuration. So far most of the studies on solvability focused on calibrated and uncalibrated camera models, succesfully deriving a full characterization of the problem in the calibrated case; the uncalibrated case must be handled with more care as the formulation derived is harder to tackle. In this thesis, we investigate the solvability of the viewing graph in the case of affine cameras. The affine camera model is a type of uncalibrated camera introduced to reduce the perspective model by setting the focal length to infinity; because of this simplification, affine cameras are less complex to treat. Our underlying intuition is that working with simpler camera models may lead to a more tractable or more transparent characterization of the solvability problem. Starting from the previous work on solvability for calibrated and uncalibrated cameras, we extend the most notable results to the affine case, obtaining some similiar outcomes on necessary and fundamental conditions but a different characterization on more complex properties which allow us to derive, for every affine fundamental matrix in the graph, a linear system of 4 equations with camera parameters as unknowns. Collecting the equations coming from all the edges in the graph, and adding conditions to resolve the global ambiguity, we are able to write a precise and efficient solver to test if a viewing graph is solvable under affine camera conditions. The solver was used to compare affine solvability with solvability under calibrated/uncalibrated conditions, in hope to get more empirical evidence on our claim that affine solvability yields uncalibrated solvability. Finally, we raise a research question on the equivalence between affine solvability and 2D parallel rigidity.

Il grafo di visione è una struttura matematica in cui i nodi rappresentano telecamere, e gli archi connettono coppie di telecamere per le quali è nota la matrice fondamentale; esso fornisce una rappresentazione compatta di una scena multivista nel contesto della geometria proiettiva. Negli ultimi anni, è stata dedicata notevole attenzione allo studio della risolvibilità del grafo di visione, ovvero alla questione se le matrici fondamentali fornite nel grafo siano sufficienti a ricostruire univocamente una configurazione proiettiva delle telecamere. Finora, la maggior parte degli studi si è concentrata sui modelli di telecamera calibrata e non calibrata, ottenendo una caratterizzazione completa del problema nel caso calibrato; il caso non calibrato richiede maggiore cautela, poiché la formulazione ottenuta risulta più complessa da trattare. In questa tesi, indaghiamo la risolvibilità del grafo di visione nel caso delle telecamere affini. Il modello di telecamera affine è una variante di telecamera non calibrata introdotta per semplificare il modello prospettico, imponendo che la lunghezza focale sia infinita; grazie a questa semplificazione, le telecamere affini risultano meno complesse da analizzare. L’intuizione alla base di questo studio è che, lavorando con modelli di telecamera più semplici, si possa giungere a una caratterizzazione del problema di risolvibilità più trattabile o più trasparente. Partendo dalla letteratura esistente sulla risolvibilità per telecamere calibrate e non calibrate, estendiamo i risultati più significativi al caso affine, ottenendo un esito simile sulle condizioni necessarie e fondamentali, ma una diversa caratterizzazione su proprietà più complesse. Ciò ci consente di derivare, per ogni matrice fondamentale affine nel grafo, un sistema lineare di 4 equazioni con i parametri delle telecamere come incognite. Collezionando le equazioni provenienti da tutti gli archi del grafo, e aggiungendo condizioni per risolvere l’ambiguità globale, siamo in grado di scrivere un risolutore preciso ed efficiente per verificare se un grafo di visione è risolvibile nel caso affine. Il risolutore è stato utilizzato per confrontare la risolvibilità affine con quella calibrata e non calibrata, nella speranza di ottenere evidenze empiriche a sostegno della nostra ipotesi secondo cui la risolvibilità affine implichi quella non calibrata. Infine, solleviamo una questione di ricerca sull’equivalenza tra risolvibilità affine e rigidità parallela 2D.

Affine solvability of the viewing graph

PEDRONI, GABRIELE
2024/2025

Abstract

The viewing graph is a mathematical structure in which nodes represent cameras, and edges connect pairs of cameras for which the fundamental matrix is known; it provides a compact representation of a multiview scene in the context of projective geometry. In recent years, considerable attention has been devoted to investigating the solvability of the viewing graph, that is, whether the fundamental matrices given in the graph are sufficient to uniquely reconstruct a projective camera configuration. So far most of the studies on solvability focused on calibrated and uncalibrated camera models, succesfully deriving a full characterization of the problem in the calibrated case; the uncalibrated case must be handled with more care as the formulation derived is harder to tackle. In this thesis, we investigate the solvability of the viewing graph in the case of affine cameras. The affine camera model is a type of uncalibrated camera introduced to reduce the perspective model by setting the focal length to infinity; because of this simplification, affine cameras are less complex to treat. Our underlying intuition is that working with simpler camera models may lead to a more tractable or more transparent characterization of the solvability problem. Starting from the previous work on solvability for calibrated and uncalibrated cameras, we extend the most notable results to the affine case, obtaining some similiar outcomes on necessary and fundamental conditions but a different characterization on more complex properties which allow us to derive, for every affine fundamental matrix in the graph, a linear system of 4 equations with camera parameters as unknowns. Collecting the equations coming from all the edges in the graph, and adding conditions to resolve the global ambiguity, we are able to write a precise and efficient solver to test if a viewing graph is solvable under affine camera conditions. The solver was used to compare affine solvability with solvability under calibrated/uncalibrated conditions, in hope to get more empirical evidence on our claim that affine solvability yields uncalibrated solvability. Finally, we raise a research question on the equivalence between affine solvability and 2D parallel rigidity.
MADHAVAN, RAKSHITH
ING - Scuola di Ingegneria Industriale e dell'Informazione
22-lug-2025
2024/2025
Il grafo di visione è una struttura matematica in cui i nodi rappresentano telecamere, e gli archi connettono coppie di telecamere per le quali è nota la matrice fondamentale; esso fornisce una rappresentazione compatta di una scena multivista nel contesto della geometria proiettiva. Negli ultimi anni, è stata dedicata notevole attenzione allo studio della risolvibilità del grafo di visione, ovvero alla questione se le matrici fondamentali fornite nel grafo siano sufficienti a ricostruire univocamente una configurazione proiettiva delle telecamere. Finora, la maggior parte degli studi si è concentrata sui modelli di telecamera calibrata e non calibrata, ottenendo una caratterizzazione completa del problema nel caso calibrato; il caso non calibrato richiede maggiore cautela, poiché la formulazione ottenuta risulta più complessa da trattare. In questa tesi, indaghiamo la risolvibilità del grafo di visione nel caso delle telecamere affini. Il modello di telecamera affine è una variante di telecamera non calibrata introdotta per semplificare il modello prospettico, imponendo che la lunghezza focale sia infinita; grazie a questa semplificazione, le telecamere affini risultano meno complesse da analizzare. L’intuizione alla base di questo studio è che, lavorando con modelli di telecamera più semplici, si possa giungere a una caratterizzazione del problema di risolvibilità più trattabile o più trasparente. Partendo dalla letteratura esistente sulla risolvibilità per telecamere calibrate e non calibrate, estendiamo i risultati più significativi al caso affine, ottenendo un esito simile sulle condizioni necessarie e fondamentali, ma una diversa caratterizzazione su proprietà più complesse. Ciò ci consente di derivare, per ogni matrice fondamentale affine nel grafo, un sistema lineare di 4 equazioni con i parametri delle telecamere come incognite. Collezionando le equazioni provenienti da tutti gli archi del grafo, e aggiungendo condizioni per risolvere l’ambiguità globale, siamo in grado di scrivere un risolutore preciso ed efficiente per verificare se un grafo di visione è risolvibile nel caso affine. Il risolutore è stato utilizzato per confrontare la risolvibilità affine con quella calibrata e non calibrata, nella speranza di ottenere evidenze empiriche a sostegno della nostra ipotesi secondo cui la risolvibilità affine implichi quella non calibrata. Infine, solleviamo una questione di ricerca sull’equivalenza tra risolvibilità affine e rigidità parallela 2D.
File allegati
File Dimensione Formato  
2025_07_Pedroni_ExecutiveSummary.pdf

accessibile in internet per tutti

Descrizione: Executive Summary
Dimensione 464.87 kB
Formato Adobe PDF
464.87 kB Adobe PDF Visualizza/Apri
2025_07_Pedroni_Thesis.pdf

accessibile in internet per tutti

Descrizione: Thesis
Dimensione 6.71 MB
Formato Adobe PDF
6.71 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/240786