This thesis and the material presented have been developed in the manufacturing plant of STMicroelectronics located in Agrate Brianza, Italy during a 12 months internship in collaboration with the Politecnico di Milano. STMicroelectronics is one of the leading manufacturers in the sector of semiconductors. Integrated Circuits are produced in lots on circular wafers in di erent production lines, including many specialized steps. Wafers are constantly monitored by inspection machines for quality control. Such machines provide Wafer Defect Maps, which report the coordinates of the defects detected on each wafer. While it is normal to observe a few defects randomly spread on the wafer, defect patterns can arise due to speci c malfunctioning in the production line and should be promptly identi ed to solve the issue. Some classes of defect patterns are known to be caused by speci c problems, but new patterns might occur due to malfunctionings that have never been observed yet. In this thesis, we cast online wafer monitoring as an open-set recognition problem, where the aim is to recognize a certain number of known classes and detecting novelties, i.e. samples that do not belong to any known class. This is a realistic scenario where only a part of the classes have been already identi ed and included in the training set. We propose a method to deal with this kind of problem that leverages on the Gaussian Mixture Model (GMM). During the training phase, by adding a term for the GMM to the loss function, the model is trained also to separate the known classes since this helps the model distinguish the novelties from the known samples at test time. In our experiments, we test our model on a real-world dataset of WDMs acquired at STMicroelectronics. Our results show that our model can better distinguish the novelties from the known classes compared to the baselines in terms of threshold-independent metrics. However, when we set a threshold to guarantee a small percentage of false alarms, as might be necessary in an industrial monitoring scenario, in some cases baselines achieve better classi cation performance. This analysis is crucial when deploying an open-set recognition method in a real industrial scenario, but has never been proposed in the literature.

Questa tesi e il materiale presentato sono stati sviluppati nello stabilimento industriale di STMicrolectronics situato ad Agrate Brianza, Italia durante un tirocino di 12 mesi in collaborazione con il Politecnico di Milano. STMicrolectronics è uno dei produttori leader nel settore dei semiconduttori. I Circuiti Integrati vengono prodotti in lotti su wafer circolari in diverse linee di produzione implementando complessi step. I wafer sono costantemente monitorati usando Macchine di Ispezione per un controllo di qualità. L'ispezione produce delle Wafer Defect Maps, ognuna delle quali contiene le coordinate dei difetti rilevate su ciascun wafer. In condizioni di produzioni normali, i difetti sono distribuiti normalmente sulle Wafer Defect Maps. Tuttavia, può anche accadere che i difetti sulle Wafer Defect Maps compongano speci ci pattern riconducibili a malfunzionamenti nella linea di produzione, che dovrebbero essere identi cati per risolvere il problema. Per alcune classi di pattern di difetto la causa del problema è nota, ma nuovi pattern si possono manifestare a causa di malfunzionamenti che non sono stati ancora osservati. In questa tesi, il monitoraggio dei wafer è stato trattato come un problema di riconoscimento open-set, il cui obiettivo è quello di riconoscere un certo numero di classi conosciute e individuare le novelty, ovvero i sample che non appartengono a nessuna delle classi conosciute. Questo è uno scenario realistico dove solo una parte delle classi è già stata identi cata e inclusa nel set di training. Proponiamo un metodo che a ronti questo tipo di problema sfruttando la Gaussian Mixture Model (GMM). Durante la fase di allenamento, aggiungendo un termine per la GMM alla funzione di perdita, il modello viene addestrato anche per separare le classi conosciute visto che questo lo aiuta, in fase di testing, a distinguere le novelty dai sample conosciuti. Nei nostri esperimenti, testiamo il modello su un set realistico di WDM acquisite da STMicroelectronics. I risultati mostrano che il nostro modello distingue le novelty dalle classi conosciute in modo migliore rispetto alle baseline in termini di metriche indipendenti dalla soglia. Tuttavia, quando settiamo una soglia per garantire una piccola percentuale di falsi allarmi, che potrebbe essere necessario in uno scenario di monitoraggio industriale, in qualche caso le baseline raggiungono performance migliori. Questa analisi è cruciale quando si sviluppa un modello di riconoscimento open-set in uno scenario industriale, ma ciò non è mai stato proposto in letteratura.

Open-set recognition for silicon wafer production monitoring

ILARI, MATTEO
2020/2021

Abstract

This thesis and the material presented have been developed in the manufacturing plant of STMicroelectronics located in Agrate Brianza, Italy during a 12 months internship in collaboration with the Politecnico di Milano. STMicroelectronics is one of the leading manufacturers in the sector of semiconductors. Integrated Circuits are produced in lots on circular wafers in di erent production lines, including many specialized steps. Wafers are constantly monitored by inspection machines for quality control. Such machines provide Wafer Defect Maps, which report the coordinates of the defects detected on each wafer. While it is normal to observe a few defects randomly spread on the wafer, defect patterns can arise due to speci c malfunctioning in the production line and should be promptly identi ed to solve the issue. Some classes of defect patterns are known to be caused by speci c problems, but new patterns might occur due to malfunctionings that have never been observed yet. In this thesis, we cast online wafer monitoring as an open-set recognition problem, where the aim is to recognize a certain number of known classes and detecting novelties, i.e. samples that do not belong to any known class. This is a realistic scenario where only a part of the classes have been already identi ed and included in the training set. We propose a method to deal with this kind of problem that leverages on the Gaussian Mixture Model (GMM). During the training phase, by adding a term for the GMM to the loss function, the model is trained also to separate the known classes since this helps the model distinguish the novelties from the known samples at test time. In our experiments, we test our model on a real-world dataset of WDMs acquired at STMicroelectronics. Our results show that our model can better distinguish the novelties from the known classes compared to the baselines in terms of threshold-independent metrics. However, when we set a threshold to guarantee a small percentage of false alarms, as might be necessary in an industrial monitoring scenario, in some cases baselines achieve better classi cation performance. This analysis is crucial when deploying an open-set recognition method in a real industrial scenario, but has never been proposed in the literature.
CARRERA, DIEGO
FRITTOLI, LUCA
ROSSI, BEATRICE
ING - Scuola di Ingegneria Industriale e dell'Informazione
28-apr-2022
2020/2021
Questa tesi e il materiale presentato sono stati sviluppati nello stabilimento industriale di STMicrolectronics situato ad Agrate Brianza, Italia durante un tirocino di 12 mesi in collaborazione con il Politecnico di Milano. STMicrolectronics è uno dei produttori leader nel settore dei semiconduttori. I Circuiti Integrati vengono prodotti in lotti su wafer circolari in diverse linee di produzione implementando complessi step. I wafer sono costantemente monitorati usando Macchine di Ispezione per un controllo di qualità. L'ispezione produce delle Wafer Defect Maps, ognuna delle quali contiene le coordinate dei difetti rilevate su ciascun wafer. In condizioni di produzioni normali, i difetti sono distribuiti normalmente sulle Wafer Defect Maps. Tuttavia, può anche accadere che i difetti sulle Wafer Defect Maps compongano speci ci pattern riconducibili a malfunzionamenti nella linea di produzione, che dovrebbero essere identi cati per risolvere il problema. Per alcune classi di pattern di difetto la causa del problema è nota, ma nuovi pattern si possono manifestare a causa di malfunzionamenti che non sono stati ancora osservati. In questa tesi, il monitoraggio dei wafer è stato trattato come un problema di riconoscimento open-set, il cui obiettivo è quello di riconoscere un certo numero di classi conosciute e individuare le novelty, ovvero i sample che non appartengono a nessuna delle classi conosciute. Questo è uno scenario realistico dove solo una parte delle classi è già stata identi cata e inclusa nel set di training. Proponiamo un metodo che a ronti questo tipo di problema sfruttando la Gaussian Mixture Model (GMM). Durante la fase di allenamento, aggiungendo un termine per la GMM alla funzione di perdita, il modello viene addestrato anche per separare le classi conosciute visto che questo lo aiuta, in fase di testing, a distinguere le novelty dai sample conosciuti. Nei nostri esperimenti, testiamo il modello su un set realistico di WDM acquisite da STMicroelectronics. I risultati mostrano che il nostro modello distingue le novelty dalle classi conosciute in modo migliore rispetto alle baseline in termini di metriche indipendenti dalla soglia. Tuttavia, quando settiamo una soglia per garantire una piccola percentuale di falsi allarmi, che potrebbe essere necessario in uno scenario di monitoraggio industriale, in qualche caso le baseline raggiungono performance migliori. Questa analisi è cruciale quando si sviluppa un modello di riconoscimento open-set in uno scenario industriale, ma ciò non è mai stato proposto in letteratura.
File allegati
File Dimensione Formato  
Open-Set Recognition for Silicon Wafer Production Monitoring.pdf

accessibile in internet per tutti

Dimensione 1.88 MB
Formato Adobe PDF
1.88 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/186912