In an era where manufacturing efficiency and product quality are paramount, this thesis presents a pioneering exploration into the realm of machine learning (ML) models tailored for the semiconductor manufacturing sector, with an exceptional focus on model interpretability. Recognizing the critical need for predictive models that not only forecast product quality with high precision but also illuminate the contributing factors behind these predictions, the research aims to elevate operational excellence and foster informed decision-making processes. This approach not only anticipates potential quality issues before they manifest in the final product but also provides a transparent window into the 'why' and 'how' of model decisions, thereby empowering operational managers with the knowledge to make targeted improvements. Employing a methodical approach, the research initially engaged in exploratory data analysis to identify and subsequently address challenges such as high feature dimensionality and class imbalance. Through a judicious application of Mutual Information (MI), Recursive Feature Elimination (RFE), and Synthetic Minority Over-sampling Technique (SMOTE), the study not only enhanced the accuracy and efficiency of the predictive models but also significantly advanced their interpretability. A Random Forest Classifier, augmented with SHapley Additive exPlanations (SHAP) values, stood at the heart of the research methodology, offering insightful revelations into each feature's influence on model predictions. The incorporation of SHAP values marked a pivotal advancement, providing a granular and understandable explanation of model predictions. This breakthrough enabled a deep dive into the operational parameters influencing product quality, thereby streamlining the path toward strategic enhancements in manufacturing processes. The research's outcomes underscore the transformative potential of advanced data analytics and ML interpretability in the manufacturing sector. By integrating detailed data analysis with actionable insights, the study paves the way for a new era in manufacturing operations, where data-driven decisions and operational transparency are not just ideals but practical realities. Furthermore, the thesis outlines several avenues for future investigation, including the exploration of advanced feature selection algorithms, the application of the research findings across different domains, and the integration of deep learning models for complex data analysis. Moreover, it highlights the significance of exploration of additional interpretable machine learning models to compare the outcomes to further increase the effectiveness in manufacturing context. This research makes a substantial contribution to the predictive analytics and quality control domains within manufacturing, offering a comprehensive framework for developing interpretable ML models. It lays a solid foundation for future advancements, ensuring that manufacturing operations can harness the full spectrum of AI benefits to achieve quality improvement, operational efficiency, and strategic decision-making prowess.

In un'epoca in cui l'efficienza produttiva e la qualità del prodotto sono fondamentali, questa tesi presenta un'esplorazione pionieristica nel regno dei modelli di apprendimento automatico (ML) su misura per il settore della produzione di semiconduttori, con un focus eccezionale sull'interpretabilità del modello. Riconoscendo la necessità critica di modelli predittivi che non solo prevedano la qualità del prodotto con alta precisione ma anche chiariscano i fattori contribuenti dietro queste previsioni, la ricerca mira ad elevare l'eccellenza operativa e favorire processi decisionali informati. Questo approccio non solo anticipa potenziali problemi di qualità prima che si manifestino nel prodotto finale ma fornisce anche una finestra trasparente sul 'perché' e 'come' delle decisioni del modello, consentendo così ai manager operativi di effettuare miglioramenti mirati. Adottando un approccio metodico, la ricerca ha inizialmente impegnato nell'analisi esplorativa dei dati per identificare e successivamente affrontare sfide come l'alta dimensionalità delle caratteristiche e lo squilibrio delle classi. Attraverso un'applicazione giudiziosa dell'Informazione Mutua (MI), dell'Eliminazione Ricorsiva delle Caratteristiche (RFE) e della Tecnica di Sovracampionamento della Minoranza Sintetica (SMOTE), lo studio non solo ha migliorato l'accuratezza e l'efficienza dei modelli predittivi ma ha anche significativamente avanzato la loro interpretabilità. Un Classificatore Random Forest, potenziato con i valori SHapley Additive exPlanations (SHAP), è stato al centro della metodologia di ricerca, offrendo rivelazioni perspicaci sull'influenza di ogni caratteristica sulle previsioni del modello. L'incorporazione dei valori SHAP ha segnato un avanzamento fondamentale, fornendo una spiegazione granulare e comprensibile delle previsioni del modello. Questa svolta ha permesso un'immersione profonda nei parametri operativi che influenzano la qualità del prodotto, semplificando così il percorso verso miglioramenti strategici nei processi produttivi. Gli esiti della ricerca sottolineano il potenziale trasformativo dell'analisi dei dati avanzata e dell'interpretabilità del ML nel settore manifatturiero. Integrando un'analisi dei dati dettagliata con spunti pratici, lo studio apre la via a una nuova era nelle operazioni manifatturiere, dove le decisioni basate sui dati e la trasparenza operativa non sono solo ideali ma realtà pratiche. Inoltre, la tesi delinea diverse vie per future indagini, inclusa l'esplorazione di algoritmi avanzati di selezione delle caratteristiche, l'applicazione dei risultati della ricerca in diversi domini e l'integrazione di modelli di apprendimento profondo per l'analisi di dati complessi. Inoltre, evidenzia l’importanza dell’esplorazione di ulteriori modelli interpretabili di apprendimento automatico per confrontare i risultati e aumentare ulteriormente l’efficacia nel contesto produttivo Questa ricerca apporta un contributo sostanziale ai domini dell'analisi predittiva e del controllo della qualità nella produzione, offrendo un quadro completo per lo sviluppo di modelli ML interpretabili. Pone una base solida per futuri avanzamenti, garantendo che le operazioni manifatturiere possano sfruttare appieno i benefici dell'IA per raggiungere miglioramenti della qualità, efficienza operativa e capacità decisionale strategica.

Interpretable machine learning in the semiconductor industry: a SHAP application to the SECOM dataset

PUGGANWALA, MIAN ABDUL SATTAR MUSHTAQ
2023/2024

Abstract

In an era where manufacturing efficiency and product quality are paramount, this thesis presents a pioneering exploration into the realm of machine learning (ML) models tailored for the semiconductor manufacturing sector, with an exceptional focus on model interpretability. Recognizing the critical need for predictive models that not only forecast product quality with high precision but also illuminate the contributing factors behind these predictions, the research aims to elevate operational excellence and foster informed decision-making processes. This approach not only anticipates potential quality issues before they manifest in the final product but also provides a transparent window into the 'why' and 'how' of model decisions, thereby empowering operational managers with the knowledge to make targeted improvements. Employing a methodical approach, the research initially engaged in exploratory data analysis to identify and subsequently address challenges such as high feature dimensionality and class imbalance. Through a judicious application of Mutual Information (MI), Recursive Feature Elimination (RFE), and Synthetic Minority Over-sampling Technique (SMOTE), the study not only enhanced the accuracy and efficiency of the predictive models but also significantly advanced their interpretability. A Random Forest Classifier, augmented with SHapley Additive exPlanations (SHAP) values, stood at the heart of the research methodology, offering insightful revelations into each feature's influence on model predictions. The incorporation of SHAP values marked a pivotal advancement, providing a granular and understandable explanation of model predictions. This breakthrough enabled a deep dive into the operational parameters influencing product quality, thereby streamlining the path toward strategic enhancements in manufacturing processes. The research's outcomes underscore the transformative potential of advanced data analytics and ML interpretability in the manufacturing sector. By integrating detailed data analysis with actionable insights, the study paves the way for a new era in manufacturing operations, where data-driven decisions and operational transparency are not just ideals but practical realities. Furthermore, the thesis outlines several avenues for future investigation, including the exploration of advanced feature selection algorithms, the application of the research findings across different domains, and the integration of deep learning models for complex data analysis. Moreover, it highlights the significance of exploration of additional interpretable machine learning models to compare the outcomes to further increase the effectiveness in manufacturing context. This research makes a substantial contribution to the predictive analytics and quality control domains within manufacturing, offering a comprehensive framework for developing interpretable ML models. It lays a solid foundation for future advancements, ensuring that manufacturing operations can harness the full spectrum of AI benefits to achieve quality improvement, operational efficiency, and strategic decision-making prowess.
CANTINI, ALESSANDRA
PRESCIUTTINI, ANNA
ING - Scuola di Ingegneria Industriale e dell'Informazione
9-apr-2024
2023/2024
In un'epoca in cui l'efficienza produttiva e la qualità del prodotto sono fondamentali, questa tesi presenta un'esplorazione pionieristica nel regno dei modelli di apprendimento automatico (ML) su misura per il settore della produzione di semiconduttori, con un focus eccezionale sull'interpretabilità del modello. Riconoscendo la necessità critica di modelli predittivi che non solo prevedano la qualità del prodotto con alta precisione ma anche chiariscano i fattori contribuenti dietro queste previsioni, la ricerca mira ad elevare l'eccellenza operativa e favorire processi decisionali informati. Questo approccio non solo anticipa potenziali problemi di qualità prima che si manifestino nel prodotto finale ma fornisce anche una finestra trasparente sul 'perché' e 'come' delle decisioni del modello, consentendo così ai manager operativi di effettuare miglioramenti mirati. Adottando un approccio metodico, la ricerca ha inizialmente impegnato nell'analisi esplorativa dei dati per identificare e successivamente affrontare sfide come l'alta dimensionalità delle caratteristiche e lo squilibrio delle classi. Attraverso un'applicazione giudiziosa dell'Informazione Mutua (MI), dell'Eliminazione Ricorsiva delle Caratteristiche (RFE) e della Tecnica di Sovracampionamento della Minoranza Sintetica (SMOTE), lo studio non solo ha migliorato l'accuratezza e l'efficienza dei modelli predittivi ma ha anche significativamente avanzato la loro interpretabilità. Un Classificatore Random Forest, potenziato con i valori SHapley Additive exPlanations (SHAP), è stato al centro della metodologia di ricerca, offrendo rivelazioni perspicaci sull'influenza di ogni caratteristica sulle previsioni del modello. L'incorporazione dei valori SHAP ha segnato un avanzamento fondamentale, fornendo una spiegazione granulare e comprensibile delle previsioni del modello. Questa svolta ha permesso un'immersione profonda nei parametri operativi che influenzano la qualità del prodotto, semplificando così il percorso verso miglioramenti strategici nei processi produttivi. Gli esiti della ricerca sottolineano il potenziale trasformativo dell'analisi dei dati avanzata e dell'interpretabilità del ML nel settore manifatturiero. Integrando un'analisi dei dati dettagliata con spunti pratici, lo studio apre la via a una nuova era nelle operazioni manifatturiere, dove le decisioni basate sui dati e la trasparenza operativa non sono solo ideali ma realtà pratiche. Inoltre, la tesi delinea diverse vie per future indagini, inclusa l'esplorazione di algoritmi avanzati di selezione delle caratteristiche, l'applicazione dei risultati della ricerca in diversi domini e l'integrazione di modelli di apprendimento profondo per l'analisi di dati complessi. Inoltre, evidenzia l’importanza dell’esplorazione di ulteriori modelli interpretabili di apprendimento automatico per confrontare i risultati e aumentare ulteriormente l’efficacia nel contesto produttivo Questa ricerca apporta un contributo sostanziale ai domini dell'analisi predittiva e del controllo della qualità nella produzione, offrendo un quadro completo per lo sviluppo di modelli ML interpretabili. Pone una base solida per futuri avanzamenti, garantendo che le operazioni manifatturiere possano sfruttare appieno i benefici dell'IA per raggiungere miglioramenti della qualità, efficienza operativa e capacità decisionale strategica.
File allegati
File Dimensione Formato  
2024_04_Pugganwala.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: thesis text
Dimensione 4.71 MB
Formato Adobe PDF
4.71 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/218929