In this work Statistical and Machine Learning methods have been used in order to optimize the production process, in particular quality control, of microelectronics components. During the analysis of the data, widely known techniques have been used, like Random Forest, both as a classification method and a regression one; moreover a recently developed Machine Learning technique has been used: iRF. This method, used for the first time in genomics area and presented in a new field in this work, is an extension of Random Forest. iRF produces the same classification and regression models as Random Forest, but it also adds information about the importance of interactions between variables that are used during the decisional process. The data under investigation during the analysis present some critical issues: absence of some measurements of parameters calculated for microelectronics components and the unbalance of the classes predicted through classification methods. All the analysis performed in this work are focused on implementing an automatic method that could help identifying which components must be tested in the quality control phase and which instead could be released onto the market; if implemented, this procedure may optimize costs and times of production.

In questo lavoro di tesi si sono utilizzati metodi statistici e di Machine Learning al fine di automatizzare e ottimizzare il processo produttivo, in particolare il controllo qualità, di componenti microelettroniche. Durante il lavoro di analisi dei dati sono state usate tecniche ampiamente diffuse come PCA e Random Forest, sia come metodo per la classificazione che come metodo per la regressione; inoltre si è utilizzata una nuova tecnica di Machine Learning: iRF. Questo metodo, nato in ambito genomico e qui usato in un campo nuovo, risulta essere un'estensione di Random Forest. iRF, infatti, costruisce modelli di classificazione e regressione analoghi a quelli di Random Forest, ma in aggiunta tenta di chiarire l'importanza delle interazioni tra le variabili coinvolte nel processo decisionale. I dati aziendali su cui è stata condotta l'analisi presentavano alcune criticità: la mancanza di alcuni valori dei parametri misurati sulle componenti microelettroniche e lo sbilanciamento delle classi, oggetto dei modelli di classificazione. Tutte le analisi eseguite all'interno di questo lavoro di tesi hanno l'obiettivo di verificare la possibilità di implementare un metodo automatico che possa aiutare a identificare quali insiemi di componenti debbano eseguire i test del controllo qualità e quali invece possano essere rilasciati sul mercato; questa procedura permetterebbe di ottimizzare costi e tempi di produzione.

Automazione e ottimizzazione del controllo qualità di componenti microelettroniche mediante random forest

MISSERI, MARCO DAVIDE;URBINI, PAOLO
2019/2020

Abstract

In this work Statistical and Machine Learning methods have been used in order to optimize the production process, in particular quality control, of microelectronics components. During the analysis of the data, widely known techniques have been used, like Random Forest, both as a classification method and a regression one; moreover a recently developed Machine Learning technique has been used: iRF. This method, used for the first time in genomics area and presented in a new field in this work, is an extension of Random Forest. iRF produces the same classification and regression models as Random Forest, but it also adds information about the importance of interactions between variables that are used during the decisional process. The data under investigation during the analysis present some critical issues: absence of some measurements of parameters calculated for microelectronics components and the unbalance of the classes predicted through classification methods. All the analysis performed in this work are focused on implementing an automatic method that could help identifying which components must be tested in the quality control phase and which instead could be released onto the market; if implemented, this procedure may optimize costs and times of production.
VANTINI, SIMONE
ING - Scuola di Ingegneria Industriale e dell'Informazione
29-apr-2020
2019/2020
In questo lavoro di tesi si sono utilizzati metodi statistici e di Machine Learning al fine di automatizzare e ottimizzare il processo produttivo, in particolare il controllo qualità, di componenti microelettroniche. Durante il lavoro di analisi dei dati sono state usate tecniche ampiamente diffuse come PCA e Random Forest, sia come metodo per la classificazione che come metodo per la regressione; inoltre si è utilizzata una nuova tecnica di Machine Learning: iRF. Questo metodo, nato in ambito genomico e qui usato in un campo nuovo, risulta essere un'estensione di Random Forest. iRF, infatti, costruisce modelli di classificazione e regressione analoghi a quelli di Random Forest, ma in aggiunta tenta di chiarire l'importanza delle interazioni tra le variabili coinvolte nel processo decisionale. I dati aziendali su cui è stata condotta l'analisi presentavano alcune criticità: la mancanza di alcuni valori dei parametri misurati sulle componenti microelettroniche e lo sbilanciamento delle classi, oggetto dei modelli di classificazione. Tutte le analisi eseguite all'interno di questo lavoro di tesi hanno l'obiettivo di verificare la possibilità di implementare un metodo automatico che possa aiutare a identificare quali insiemi di componenti debbano eseguire i test del controllo qualità e quali invece possano essere rilasciati sul mercato; questa procedura permetterebbe di ottimizzare costi e tempi di produzione.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2020_04_Misseri_Urbini.pdf

non accessibile

Descrizione: Testo della tesi
Dimensione 4.04 MB
Formato Adobe PDF
4.04 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/154386