The severity of the worldwide problems associated with waste management has favored the application of semi-automatic methodologies in this sector, at least since the 1970s. Problem within the problem for environmental and criminal implications is represented by illegal landfills and in particular by their identification. For this purpose, the combination of satellite images and geographic information systems (GIS) was first exploited. Despite the good results obtained, especially since 2000 when satellite images became available in greater numbers and quality, these methods still remain dependent on human expertise, with the associated problems. A decisive improvement towards fully automatic systems has been achieved with the adoption of deep learning techniques, in particular Convolutional Neural Networks (CNNs). In this context, current experiments focus on the automatic classification of images. The goal of this research is to significantly increase the classification performance of one of the neural networks (ResNet50) already used in this field. To achieve this result, the combination of spatial and semantic information was exploited. For this purpose, an architecture inspired by Feature Pyramid Network (FPN) which exploits the baseline architecture (ResNet50) as the backbone, has been implemented. This network allows to overcome the problem of multi-scale detection, that is the recognition of objects belonging to the same class represented at different scales. Multi-scale detection is one of the main constraints on the accuracy in the classification of images via CNNs. The experiments involved 12 different configurations of the ResNet50 + FPN architecture, overcoming some critical issues related to multi-scale detection. The proposed model manages to increase the F1 score from 0.865 to 0.882 and the classification accuracy from 92% to 93% with respect to the baseline architecture. The study also includes a final qualitative evaluation with the aim of identifying on the images the variables that contributed to this result.

La gravità dei problemi connessi alla gestione dei rifiuti a livello mondiale ha favorito in questo settore l’applicazione di metodologie semi-automatiche, almeno a partire dagli anni ‘70. Problema nel problema per i risvolti ambientali e criminali, è rappresentato dalle discariche illegali e in particolare dalla loro individuazione. Per questo obiettivo è stata sfruttata in un primo momento la combinazione di immagini satellitari e sistemi informativi geografici (GIS). Nonostante i buoni risultati ottenuti, soprattutto a partire dal 2000 quando le immagini satellitari sono diventate disponibili in maggior numero e qualità, tali metodi rimangono pur sempre dipendenti dall’intervento umano, con i problemi connessi. Un decisivo miglioramento verso sistemi completamente automatici si è ottenuto con l’adozione di tecniche di deep learning, in particolare le convolutional neural networks (CNNs). In questo ambito le sperimentazioni attuali si focalizzano sulla classificazione automatica delle immagini. L'obiettivo di questa ricerca è aumentare significativamente le prestazioni di classificazione di una delle reti neurali (ResNet50) già utilizzate in questo ambito. Per ottenere questo risultato, è stata sfruttata la combinazione di informazioni spaziali e semantiche. A tale scopo è stata implementata un'architettura ispirata a Feature Pyramid Network (FPN) che sfrutta l'architettura di base (ResNet50) come backbone. Questa rete permette di superare il problema del rilevamento multiscala, ovvero il riconoscimento di oggetti appartenenti alla stessa classe rappresentati a scale differenti. Il rilevamento multiscala è uno dei principali vincoli all'accuratezza nella classificazione delle immagini tramite CNNs. Gli esperimenti hanno coinvolto 12 diverse configurazioni dell'architettura ResNet50 + FPN, superando alcune criticità legate al rilevamento multiscala. Il modello proposto riesce ad aumentare l'F1 score da 0.865 a 0.882 e l'accuracy di classificazione dal 92% al 93% rispetto all'architettura di base. Lo studio prevede anche una valutazione qualitativa finale con l'obiettivo di identificare sulle immagini le variabili che hanno contribuito a tale risultato.

Multi-scale satellite images classification : the case of illegal landfills

Gelli, Marco
2019/2020

Abstract

The severity of the worldwide problems associated with waste management has favored the application of semi-automatic methodologies in this sector, at least since the 1970s. Problem within the problem for environmental and criminal implications is represented by illegal landfills and in particular by their identification. For this purpose, the combination of satellite images and geographic information systems (GIS) was first exploited. Despite the good results obtained, especially since 2000 when satellite images became available in greater numbers and quality, these methods still remain dependent on human expertise, with the associated problems. A decisive improvement towards fully automatic systems has been achieved with the adoption of deep learning techniques, in particular Convolutional Neural Networks (CNNs). In this context, current experiments focus on the automatic classification of images. The goal of this research is to significantly increase the classification performance of one of the neural networks (ResNet50) already used in this field. To achieve this result, the combination of spatial and semantic information was exploited. For this purpose, an architecture inspired by Feature Pyramid Network (FPN) which exploits the baseline architecture (ResNet50) as the backbone, has been implemented. This network allows to overcome the problem of multi-scale detection, that is the recognition of objects belonging to the same class represented at different scales. Multi-scale detection is one of the main constraints on the accuracy in the classification of images via CNNs. The experiments involved 12 different configurations of the ResNet50 + FPN architecture, overcoming some critical issues related to multi-scale detection. The proposed model manages to increase the F1 score from 0.865 to 0.882 and the classification accuracy from 92% to 93% with respect to the baseline architecture. The study also includes a final qualitative evaluation with the aim of identifying on the images the variables that contributed to this result.
TORRES, ROCIO NAHIME
ING - Scuola di Ingegneria Industriale e dell'Informazione
28-apr-2021
2019/2020
La gravità dei problemi connessi alla gestione dei rifiuti a livello mondiale ha favorito in questo settore l’applicazione di metodologie semi-automatiche, almeno a partire dagli anni ‘70. Problema nel problema per i risvolti ambientali e criminali, è rappresentato dalle discariche illegali e in particolare dalla loro individuazione. Per questo obiettivo è stata sfruttata in un primo momento la combinazione di immagini satellitari e sistemi informativi geografici (GIS). Nonostante i buoni risultati ottenuti, soprattutto a partire dal 2000 quando le immagini satellitari sono diventate disponibili in maggior numero e qualità, tali metodi rimangono pur sempre dipendenti dall’intervento umano, con i problemi connessi. Un decisivo miglioramento verso sistemi completamente automatici si è ottenuto con l’adozione di tecniche di deep learning, in particolare le convolutional neural networks (CNNs). In questo ambito le sperimentazioni attuali si focalizzano sulla classificazione automatica delle immagini. L'obiettivo di questa ricerca è aumentare significativamente le prestazioni di classificazione di una delle reti neurali (ResNet50) già utilizzate in questo ambito. Per ottenere questo risultato, è stata sfruttata la combinazione di informazioni spaziali e semantiche. A tale scopo è stata implementata un'architettura ispirata a Feature Pyramid Network (FPN) che sfrutta l'architettura di base (ResNet50) come backbone. Questa rete permette di superare il problema del rilevamento multiscala, ovvero il riconoscimento di oggetti appartenenti alla stessa classe rappresentati a scale differenti. Il rilevamento multiscala è uno dei principali vincoli all'accuratezza nella classificazione delle immagini tramite CNNs. Gli esperimenti hanno coinvolto 12 diverse configurazioni dell'architettura ResNet50 + FPN, superando alcune criticità legate al rilevamento multiscala. Il modello proposto riesce ad aumentare l'F1 score da 0.865 a 0.882 e l'accuracy di classificazione dal 92% al 93% rispetto all'architettura di base. Lo studio prevede anche una valutazione qualitativa finale con l'obiettivo di identificare sulle immagini le variabili che hanno contribuito a tale risultato.
File allegati
File Dimensione Formato  
Gelli_TESI.pdf

Open Access dal 08/04/2022

Dimensione 41.55 MB
Formato Adobe PDF
41.55 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/173946