A stochastic, deep learning-based approach to polysilicon mechanical properties prediction

In this work, the polysilicon movable structure used in micro-electromechanical systems (MEMS) characterizations are defined using a deep-learning-based approach. The data of stochastically two-dimensional representative images of polycrystalline films are used for the characterizations. These polysilicon representative images are generated by Voronoi tessellation and the Monte Carlo method to deal with the stochastic characteristic of the morphology of polysilicon. In this case, the stochastic variables govern the grain boundary network's topology and each grain's lattice orientation. Further details of the mechanical stiffness (here, Young’s modulus, E) of each microstructure are obtained using finite element (FE) simulations. This information represents ground truth data (labels) during the supervised learning process of a CNN-based model. A certain number of these realizations and their corresponding labels are fed as the input to the convolutional neural network, and training takes place. Next, the regression model is used to make predictions of E for the unseen microstructures. At first, the model is trained with only one size realizations, and other realizations with different sizes are predicted. In the second part, the smallest and biggest realizations are fed as training to see whether the model can predict the unseen realizations with the size between these two, or not. In the last part, the two small-sized realizations are used as a training dataset, and the model is used to predict Young’s modulus of the unseen larger realizations. In all cases, three different architectures (ResNet, DenseNet, and standard convolutional neural network) have been trained for comparison. All three architectures show good results in predicting the smaller size realizations respect to the training realizations size. However, only the deepest architecture (ResNet) is capable of predicting the larger size realizations. Also, the effect of batch size and the learning rate has been discussed. In lower learning rates, a larger batch size gives a better result and more waiting time is needed.

In questo studio, la struttura mobile in polisilicio utilizzata nelle caratterizzazioni dei sistemi micro-elettromeccanici viene definita utilizzando un approccio basato sull'apprendimento profondo. I dati delle immagini rappresentative stocasticamente bidimensionali di pellicole policristalline sono utilizzati per le caratterizzazioni. Queste immagini rappresentative sono generate dalla tassellazione di Voronoi e dal metodo di Monte Carlo per affrontare la caratteristica stocastica della morfologia del polisilicio. In questo caso, le variabili stocastiche governano la topologia della rete dei limiti di grano e l'orientamento del reticolo di ogni grano. Ulteriori dettagli sulla rigidezza meccanica (qui, modulo di Young, E) di ogni microstruttura sono ottenuti utilizzando simulazioni agli elementi finiti. Un certo numero di queste realizzazioni e le loro etichette corrispondenti vengono alimentate come input alla rete neurale convoluzionale, e l'addestramento avviene. Successivamente, il modello di regressione viene utilizzato per fare previsioni di E per le microstrutture invisibili. Nel primo caso, il modello è addestrato con una dimensione di realizzazione, quindi altre dimensioni sono previste. La seconda parte verifica la capacità del modello di prevedere le realizzazioni con dimensioni tra le più piccole e le più grandi. Nell'ultima parte, le due realizzazioni di piccole dimensioni sono utilizzate come set di dati di allenamento, e il modello viene utilizzato per prevedere il E delle realizzazioni più grandi invisibili. In tutti i casi, tre diverse architetture (ResNet, DenseNet e rete neurale convoluzionale standard) sono state addestrate per il confronto. Tutte e tre le architetture mostrano buoni risultati nel prevedere le realizzazioni di dimensioni più piccole rispetto alle dimensioni delle realizzazioni di formazione. Tuttavia, solo l'architettura più profonda (ResNet) è in grado di prevedere le realizzazioni più grandi dimensioni. Inoltre, l'effetto della dimensione del lotto e il tasso di apprendimento è stato discusso. Nei tassi di apprendimento più bassi, una maggiore dimensione del lotto dà un risultato migliore e più tempo di attesa è necessario.