Historical maps provide useful information about past landscapes and human activities. However, their information is usually only available in map imagery. Therefore, they are not directly usable for Geographic Information Systems (GIS) analysis. This thesis proposes an end-to-end AI-based pipeline to detect building footprints from a georeferenced historical map and convert them into GIS-ready data to support the classification of contemporary building polygons. The workflow is demonstrated on the scanned historical map and vector dataset of contemporary building footprints of Stradella (Oltrepò Pavese, Lombardy). The historical map is first divided into fixed-size tiles to make the labeling and model training feasible. As a result, a small labeled dataset of 24 tiles is created to allow supervised fine-tuning on this specific problem. To select a suitable model, two models (YOLOv8 and MapSAM) are compared using a controlled split (20 training tiles, 4 test tiles). In this experiment, MapSAM achieves higher aggregate performance (precision 0.64, recall 0.76, IoU 0.51) than YOLOv8 (precision 0.56, recall 0.52, custom-calculated IoU 0.50). MapSAM also produces a single binary mask for each tile, making it more suitable compared to YOLOv8 for the next GIS workflow steps. After model selection, MapSAM is fine-tuned on all 24 labeled tiles and used for inference on the high-resolution GeoTIFF map, using a window-based approach that avoids loading the entire raster into memory. The output is a binary mask GeoTIFF with the same Coordinate Reference System (CRS) and affine transform as the input. Finally, a GIS post-processing step converts this information into per-building attributes to allow further visualization and analysis.
Le mappe storiche forniscono informazioni utili sui paesaggi passati e sulle attività umane. Tuttavia, le loro informazioni sono di solito disponibili solo sotto forma di immagini cartografiche. Pertanto, non sono direttamente utilizzabili per l'analisi in un Sistema Informativo Geografico (GIS). Questa tesi propone una pipeline end-to-end basata sull'AI per estrarre le impronte degli edifici da una mappa storica georeferenziata e convertirle in dati pronti per il GIS a supporto della classificazione dei poligoni degli edifici contemporanei. Il workflow è dimostrato sulla mappa storica scansionata e sul dataset vettoriale delle impronte degli edifici contemporanei di Stradella (Oltrepò Pavese, Lombardia). La mappa storica viene innanzitutto suddivisa in tile di dimensione fissa per rendere fattibili l'etichettatura e l'addestramento del modello. Di conseguenza, viene creato un piccolo dataset etichettato di 24 tile per consentire il fine-tuning supervisionato su questo problema specifico. Per selezionare un modello adatto, due modelli (YOLOv8 e MapSAM) vengono confrontati utilizzando una suddivisione controllata (20 tile di training, 4 tile di test). In questo esperimento, MapSAM ottiene prestazioni aggregate superiori (precisione 0.64, recall 0.76, IoU 0.51) rispetto a YOLOv8 (precisione 0.56, recall 0.52, IoU calcolata separatamente 0.50). MapSAM produce inoltre una singola maschera binaria per ciascun tile, risultando più adatto rispetto a YOLOv8 per i successivi passaggi del workflow GIS. Dopo la selezione del modello, MapSAM viene sottoposto a fine-tuning su tutte le 24 tile etichettate ed è utilizzato per l'inferenza sulla mappa GeoTIFF ad alta risoluzione, tramite un approccio basato su finestre che evita di caricare l'intero raster in memoria. L'output è un GeoTIFF di maschera binaria con lo stesso Sistema di Riferimento delle Coordinate (CRS) e la stessa trasformazione affine dell'input. Infine, un passaggio di post-processing GIS converte queste informazioni in attributi per edificio per consentire ulteriori visualizzazioni e analisi.
Detecting heritage in historical maps: an end-to-end ai-based pipeline
Hajizadeh Idloo, Ali
2025/2026
Abstract
Historical maps provide useful information about past landscapes and human activities. However, their information is usually only available in map imagery. Therefore, they are not directly usable for Geographic Information Systems (GIS) analysis. This thesis proposes an end-to-end AI-based pipeline to detect building footprints from a georeferenced historical map and convert them into GIS-ready data to support the classification of contemporary building polygons. The workflow is demonstrated on the scanned historical map and vector dataset of contemporary building footprints of Stradella (Oltrepò Pavese, Lombardy). The historical map is first divided into fixed-size tiles to make the labeling and model training feasible. As a result, a small labeled dataset of 24 tiles is created to allow supervised fine-tuning on this specific problem. To select a suitable model, two models (YOLOv8 and MapSAM) are compared using a controlled split (20 training tiles, 4 test tiles). In this experiment, MapSAM achieves higher aggregate performance (precision 0.64, recall 0.76, IoU 0.51) than YOLOv8 (precision 0.56, recall 0.52, custom-calculated IoU 0.50). MapSAM also produces a single binary mask for each tile, making it more suitable compared to YOLOv8 for the next GIS workflow steps. After model selection, MapSAM is fine-tuned on all 24 labeled tiles and used for inference on the high-resolution GeoTIFF map, using a window-based approach that avoids loading the entire raster into memory. The output is a binary mask GeoTIFF with the same Coordinate Reference System (CRS) and affine transform as the input. Finally, a GIS post-processing step converts this information into per-building attributes to allow further visualization and analysis.| File | Dimensione | Formato | |
|---|---|---|---|
|
2026_03_Hajizadeh Idloo.pdf
accessibile in internet per tutti
Descrizione: Thesis
Dimensione
74.36 MB
Formato
Adobe PDF
|
74.36 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/253688