A review on defect synthesis methods for industrial anomaly detection

Industrial Anomaly Detection data-driven approaches currently lack sufficient real-world defective samples, which makes model validation difficult. Traditional approaches in image-based inspection build a training dataset from normal images and reserve a small portion of defective images for the validation set. This thesis reviews the solution proposed by anomaly synthesis methods, which employ generated anomalous samples alongside normal samples during training. Ideally, substituting real anomalous examples with synthetic ones could boost the adoption of these methods across a wide range of real-world industrial scenarios. We evaluated State-Of-the-Art anomaly synthesis methods on the MVtec and VisA benchmark datasets, proposing a unified training context to enable a fair comparison; moreover, we designed different model selection strategies to better estimate models' true performance. The study compares image-level anomaly synthesis methods (NSA, RealNet), feature-level methods (SimpleNet, PBAS), and a hybrid one (GLASS). Through the extensive experimental results, we reveal the strengths and weaknesses of these algorithms. Finally, we propose extending the most promising algorithm, PBAS, to enhance performance and stability. Our modified version greatly improves training stability while also outperforming the original methods on the more complex categories of the benchmark datasets used.

Le metodologie data-driven per il rilevamento delle anomalie in contesto industriale attualmente mancano di sufficienti campioni difettosi, il che rende difficile la validazione dei modelli. Gli approcci tradizionali per l'ispezione delle immagini vengono addestrati a partire da immagini normali riservando una piccola porzione di immagini difettose per il set di validazione. Questa tesi esamina la soluzione proposta dai metodi di anomaly synthesis, che impiegano campioni anomali generati insieme a campioni normali durante l'addestramento. Idealmente, sostituire esempi anomali reali con quelli sintetici potrebbe aumentare l'utilizzo di questi metodi in un'ampia gamma di scenari industriali. Abbiamo valutato i metodi State-Of-the-Art di sintesi delle anomalie sui dataset di benchmark MVtec e VisA, proponendo un contesto di addestramento unificato per permettere un confronto equo; inoltre, abbiamo progettato diverse strategie di model selection per stimare in modo migliore le loro reali prestazioni. Lo studio confronta metodi di image-level anomaly synthesis (NSA, RealNet), metodi di features-level anomaly synthesis (SimpleNet, PBAS) e un modello ibrido (GLASS). Attraverso i risultati sperimentali, riveliamo i punti di forza e le debolezze degli algoritmi. In fine, proponiamo un'estensione di quello più promettente, PBAS, per migliorarne le prestazioni e la stabilità. Il nostro metodo migliora di molto la stabilità dell'addestramento mentre supera in prestazioni i metodi originali nelle più complesse categorie dei dataset di riferimento.