Illegal landfills pose a significant threat to public health and the environment, as they contaminate underground waters with leachate and release toxic fumes after combustion. The risk of contamination and the resulting damage become more severe as these landfills remain undetected and untreated. Therefore, it is crucial to identify these illegal sites as soon as possible and take prompt action to safely dispose of the waste they contain. Since some materials may be harmless, while others could pose significant environmental and health risks, determining the composition of waste before deploying operators is essential to both accelerate intervention and reduce unnecessary costs. In this context, the application of Computer Vision technologies has shown considerable potential, particularly in identifying illegal landfills through satellite images. However, one of the main challenges is data scarcity, caused by the difficulty in obtaining positive samples of different classes of waste that represent real illegal dumpsites. Additionally, annotations are often lacking, as the annotation process is time-consuming and the number of available labels may not be sufficient. To address this issue, this thesis proposes two data augmentation methods based on the use of synthetic data, enabling the generation of a large number of images that contain instances of specific waste materials. The first approach involves using an inpainting model to generate synthetic waste, and the second approach uses the Cut and Paste method, which consists in cutting target waste objects from a source image and putting them on top of a destination background image. Experiments were conducted with both approaches, and slight improvements in performance were observed for the ResNet50 model in binary and multi-label classification.

Le discariche abusive rappresentano una minaccia significativa per la salute pubblica e l'ambiente, poiché contaminano le acque sotterranee con percolato e rilasciano fumi tossici dopo la combustione. Il rischio di contaminazione e i danni conseguenti diventano più gravi man mano che queste discariche rimangono non rilevate e non trattate. Pertanto, è cruciale identificare questi siti illegali il prima possibile e intraprendere azioni tempestive per smaltire in sicurezza i rifiuti contenuti. Poiché alcuni materiali possono essere innocui, mentre altri possono comportare gravi rischi per l’ambiente e la salute, determinare la composizione dei rifiuti prima di inviare gli operatori è essenziale sia per accelerare l’intervento sia per ridurre i costi superflui. In questo contesto, l'applicazione delle tecnologie di Computer Vision ha mostrato un notevole potenziale, in particolare nell'identificazione delle discariche illegali tramite immagini satellitari. Tuttavia, una delle principali sfide è la scarsità di dati, causata dalla difficoltà di ottenere campioni positivi di diverse classi di rifiuti che rappresentano discariche illegali reali. Inoltre, spesso mancano le annotazioni, poiché il processo di annotazione è dispendioso in termini di tempo e il numero di etichette disponibili potrebbe non essere sufficiente. Per affrontare questo problema, questa tesi propone due metodi di aumento dei dati basati sull'uso di dati sintetici, che consentono di generare un gran numero di immagini contenenti esempi di materiali di rifiuto specifici. Il primo approccio prevede l'uso di un modello di inpainting per generare rifiuti sintetici, mentre il secondo approccio utilizza il metodo Cut and Paste, che consiste nel ritagliare oggetti di rifiuto target da un'immagine sorgente e sovrapporli a un'immagine di sfondo di destinazione. Sono stati condotti esperimenti con entrambi gli approcci e sono stati osservati lievi miglioramenti nelle prestazioni del modello ResNet50 nella classificazione binaria e multi-etichetta.

Generating synthetic data for illegal landfill detection: a dual approach using inpainting and cut-and-paste

LAIN, LUCA
2023/2024

Abstract

Illegal landfills pose a significant threat to public health and the environment, as they contaminate underground waters with leachate and release toxic fumes after combustion. The risk of contamination and the resulting damage become more severe as these landfills remain undetected and untreated. Therefore, it is crucial to identify these illegal sites as soon as possible and take prompt action to safely dispose of the waste they contain. Since some materials may be harmless, while others could pose significant environmental and health risks, determining the composition of waste before deploying operators is essential to both accelerate intervention and reduce unnecessary costs. In this context, the application of Computer Vision technologies has shown considerable potential, particularly in identifying illegal landfills through satellite images. However, one of the main challenges is data scarcity, caused by the difficulty in obtaining positive samples of different classes of waste that represent real illegal dumpsites. Additionally, annotations are often lacking, as the annotation process is time-consuming and the number of available labels may not be sufficient. To address this issue, this thesis proposes two data augmentation methods based on the use of synthetic data, enabling the generation of a large number of images that contain instances of specific waste materials. The first approach involves using an inpainting model to generate synthetic waste, and the second approach uses the Cut and Paste method, which consists in cutting target waste objects from a source image and putting them on top of a destination background image. Experiments were conducted with both approaches, and slight improvements in performance were observed for the ResNet50 model in binary and multi-label classification.
GIBELLINI, FEDERICO
ING - Scuola di Ingegneria Industriale e dell'Informazione
3-apr-2025
2023/2024
Le discariche abusive rappresentano una minaccia significativa per la salute pubblica e l'ambiente, poiché contaminano le acque sotterranee con percolato e rilasciano fumi tossici dopo la combustione. Il rischio di contaminazione e i danni conseguenti diventano più gravi man mano che queste discariche rimangono non rilevate e non trattate. Pertanto, è cruciale identificare questi siti illegali il prima possibile e intraprendere azioni tempestive per smaltire in sicurezza i rifiuti contenuti. Poiché alcuni materiali possono essere innocui, mentre altri possono comportare gravi rischi per l’ambiente e la salute, determinare la composizione dei rifiuti prima di inviare gli operatori è essenziale sia per accelerare l’intervento sia per ridurre i costi superflui. In questo contesto, l'applicazione delle tecnologie di Computer Vision ha mostrato un notevole potenziale, in particolare nell'identificazione delle discariche illegali tramite immagini satellitari. Tuttavia, una delle principali sfide è la scarsità di dati, causata dalla difficoltà di ottenere campioni positivi di diverse classi di rifiuti che rappresentano discariche illegali reali. Inoltre, spesso mancano le annotazioni, poiché il processo di annotazione è dispendioso in termini di tempo e il numero di etichette disponibili potrebbe non essere sufficiente. Per affrontare questo problema, questa tesi propone due metodi di aumento dei dati basati sull'uso di dati sintetici, che consentono di generare un gran numero di immagini contenenti esempi di materiali di rifiuto specifici. Il primo approccio prevede l'uso di un modello di inpainting per generare rifiuti sintetici, mentre il secondo approccio utilizza il metodo Cut and Paste, che consiste nel ritagliare oggetti di rifiuto target da un'immagine sorgente e sovrapporli a un'immagine di sfondo di destinazione. Sono stati condotti esperimenti con entrambi gli approcci e sono stati osservati lievi miglioramenti nelle prestazioni del modello ResNet50 nella classificazione binaria e multi-etichetta.
File allegati
File Dimensione Formato  
2025_04_Lain_Thesis_01.pdf

accessibile in internet per tutti

Descrizione: Thesis
Dimensione 21.98 MB
Formato Adobe PDF
21.98 MB Adobe PDF Visualizza/Apri
2025_04_Lain_Executive_Summary_02.pdf

accessibile in internet per tutti

Descrizione: Executive Summary
Dimensione 4.56 MB
Formato Adobe PDF
4.56 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/235105