Graph Learning for Process Discovery

Process Discovery is the field of Process Mining devoted to find the description of a process starting from the events generated by its execution, grouped in logs. This description (known as model) is usually given in form of Petri Nets, and their analysis allows practitioners to study, optimize and check the process under examination. Process Discovery has been traditionally tackled algorithmically, by looking for patterns in a log according to some predefined rules. Recently, Deep Learning has been introduced in the field to mitigate the impact that a priori assumptions on such patterns have on the resulting model, with the work by D. Sommers opening the path for new research in the use of Neural Networks for the discovery of process models. In this thesis, we investigated a different way of using Deep Learning for the discovery task by changing the way the resulting Petri Net is constructed. Instead of conditioning the presence of a place in the resulting Petri net on the places chosen so far, we have decided to base the choice of the places on the order in which events appear in the different sequences included in the log. This approach, although generally effective on synthetic data, proved not to be as powerful as the one proposed by D. Sommers and the other algorithmic methods that constitute the State-of-the-Art in this field, especially when run on real-life logs.

Il Process Discovery è il settore del Process Mining che si occupa di descrivere processi a partire dagli eventi generati dalla loro esecuzione, raggruppati in log. Queste descrizioni (note come modelli) vengono solitamente fornite sotto forma di reti di Petri, la cui analisi consente ai professionisti di studiare, ottimizzare e controllare il processo in esame. Il Process Discovery è stato tradizionalmente affrontato algoritmicamente, individuando all’interno dei log dei pattern definiti sulla base di alcune regole prestabilite. Recentemente, il Deep Learning è stato introdotto nel settore per mitigare l'impatto che le ipotesi sulla natura di questi pattern hanno sul modello risultante, con il lavoro di D. Sommers che apre la strada a nuove ricerche sull’uso delle Reti Neurali per la costruzione del modello di un processo. In questa tesi, abbiamo studiato un modo diverso di utilizzare il Deep Learning per la costruzione del modello di un processo, modificando il modo in cui viene costruita la rete di Petri risultante. Invece di condizionare la presenza di un posto, all’interno della rete, ai posti scelti in precedenza, abbiamo deciso di scegliere i posti che dovrebbero essere inclusi nella rete di Petri risultante, in base all'ordine in cui i diversi eventi compaiono all’interno delle sequenze incluse in un log. Questo approccio, sebbene generalmente efficace sui log artificiali, si è rivelato non essere all’altezza di quello proposto da D. Sommers e degli altri metodi algoritmici che costituiscono lo stato dell'arte in questo settore, specialmente se usato su log reali.