The continuous growth in solid waste generation constitutes a major challenge for modern waste management systems, particularly at the material sorting stage. Current sorting processes rely heavily on manual labor and supervised machine-vision systems, both of which struggle to operate reliably under real-world conditions including object deformation, contamination, occlusion, and changing packaging designs. This thesis proposes an unsupervised anomaly detection framework for automated waste sorting in which, instead of explicitly learning every possible incorrect material class, the proposed approach models the visual distribution of correctly sorted items and flags deviations from this distribution as anomalies. At the core of the proposed method is a "Vector Quantized Variational Autoencoder 2" (VQ-VAE-2), which learns a representation capable of capturing both global structure and fine-grained details. To enable object-level anomaly detection in multi-object scenes, the "Segment Anything Model" is employed to segment individual items. In addition, a spatial coherence loss is introduced, reducing false positives caused by illumination changes or background artifacts. The proposed framework is evaluated on the "MVTec AD" and "Seruso" datasets using standard anomaly detection metrics.
La continua crescita della produzione di rifiuti solidi rappresenta una sfida rilevante per i moderni sistemi di gestione dei rifiuti, in particolare nella fase di selezione dei materiali. Gli attuali processi di selezione si basano in larga misura sul lavoro manuale e su sistemi di visione artificiale supervisionati, entrambi caratterizzati da una limitata affidabilità in condizioni reali, dove gli oggetti possono risultare deformati, contaminati, parzialmente nascosti e soggetti a cambiamenti nei design degli imballaggi. Questa tesi propone un sistema di rilevamento delle anomalie non supervisionato per la selezione automatizzata dei rifiuti in cui, invece di apprendere esplicitamente tutte le possibili categorie di materiali non conformi, l’approccio proposto modella la distribuzione visiva degli oggetti correttamente selezionati e identifica come anomalie le deviazioni da tale distribuzione. Il metodo proposto si basa su "Vector Quantized Variational Autoencoder 2" (VQ-VAE-2), che apprende una rappresentazione capace di catturare sia la struttura globale degli oggetti sia i dettagli a grana fine. Per consentire il rilevamento delle anomalie a livello di singolo oggetto in immagini multi-oggetto, viene utilizzato il "Segment Anything Model" per segmentare i singoli elementi. Inoltre, viene introdotta una funzione di perdita di coerenza spaziale, che riduce i falsi positivi causati da variazioni di illuminazione o da artefatti di sfondo. Il sistema proposto viene valutato sui dataset "MVTec AD" e "Seruso" utilizzando metriche standard per il rilevamento delle anomalie.
Detection of anomalous objects for automated waste sorting
Rossi, Christian
2025/2026
Abstract
The continuous growth in solid waste generation constitutes a major challenge for modern waste management systems, particularly at the material sorting stage. Current sorting processes rely heavily on manual labor and supervised machine-vision systems, both of which struggle to operate reliably under real-world conditions including object deformation, contamination, occlusion, and changing packaging designs. This thesis proposes an unsupervised anomaly detection framework for automated waste sorting in which, instead of explicitly learning every possible incorrect material class, the proposed approach models the visual distribution of correctly sorted items and flags deviations from this distribution as anomalies. At the core of the proposed method is a "Vector Quantized Variational Autoencoder 2" (VQ-VAE-2), which learns a representation capable of capturing both global structure and fine-grained details. To enable object-level anomaly detection in multi-object scenes, the "Segment Anything Model" is employed to segment individual items. In addition, a spatial coherence loss is introduced, reducing false positives caused by illumination changes or background artifacts. The proposed framework is evaluated on the "MVTec AD" and "Seruso" datasets using standard anomaly detection metrics.| File | Dimensione | Formato | |
|---|---|---|---|
|
2026_03_Rossi_Executive_Summary.pdf
accessibile in internet solo dagli utenti autorizzati
Descrizione: Testo del sommario esecutivo
Dimensione
4.43 MB
Formato
Adobe PDF
|
4.43 MB | Adobe PDF | Visualizza/Apri |
|
2026_03_Rossi_Thesis.pdf
accessibile in internet solo dagli utenti autorizzati
Descrizione: Testo della tesi
Dimensione
33.56 MB
Formato
Adobe PDF
|
33.56 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/251553