Process Discovery is the field of Process Mining devoted to find the description of a process starting from the events generated by its execution, grouped in logs. This description (known as model) is usually given in form of Petri Nets, and their analysis allows practitioners to study, optimize and check the process under examination. Process Discovery has been traditionally tackled algorithmically, by looking for patterns in a log according to some predefined rules. Recently, Deep Learning has been introduced in the field to mitigate the impact that a priori assumptions on such patterns have on the resulting model, with the work by D. Sommers opening the path for new research in the use of Neural Networks for the discovery of process models. In this thesis, we investigated a different way of using Deep Learning for the discovery task by changing the way the resulting Petri Net is constructed. Instead of conditioning the presence of a place in the resulting Petri net on the places chosen so far, we have decided to base the choice of the places on the order in which events appear in the different sequences included in the log. This approach, although generally effective on synthetic data, proved not to be as powerful as the one proposed by D. Sommers and the other algorithmic methods that constitute the State-of-the-Art in this field, especially when run on real-life logs.

Il Process Discovery è il settore del Process Mining che si occupa di descrivere processi a partire dagli eventi generati dalla loro esecuzione, raggruppati in log. Queste descrizioni (note come modelli) vengono solitamente fornite sotto forma di reti di Petri, la cui analisi consente ai professionisti di studiare, ottimizzare e controllare il processo in esame. Il Process Discovery è stato tradizionalmente affrontato algoritmicamente, individuando all’interno dei log dei pattern definiti sulla base di alcune regole prestabilite. Recentemente, il Deep Learning è stato introdotto nel settore per mitigare l'impatto che le ipotesi sulla natura di questi pattern hanno sul modello risultante, con il lavoro di D. Sommers che apre la strada a nuove ricerche sull’uso delle Reti Neurali per la costruzione del modello di un processo. In questa tesi, abbiamo studiato un modo diverso di utilizzare il Deep Learning per la costruzione del modello di un processo, modificando il modo in cui viene costruita la rete di Petri risultante. Invece di condizionare la presenza di un posto, all’interno della rete, ai posti scelti in precedenza, abbiamo deciso di scegliere i posti che dovrebbero essere inclusi nella rete di Petri risultante, in base all'ordine in cui i diversi eventi compaiono all’interno delle sequenze incluse in un log. Questo approccio, sebbene generalmente efficace sui log artificiali, si è rivelato non essere all’altezza di quello proposto da D. Sommers e degli altri metodi algoritmici che costituiscono lo stato dell'arte in questo settore, specialmente se usato su log reali.

Graph Learning for Process Discovery

BADENCHINI, MATTEO
2021/2022

Abstract

Process Discovery is the field of Process Mining devoted to find the description of a process starting from the events generated by its execution, grouped in logs. This description (known as model) is usually given in form of Petri Nets, and their analysis allows practitioners to study, optimize and check the process under examination. Process Discovery has been traditionally tackled algorithmically, by looking for patterns in a log according to some predefined rules. Recently, Deep Learning has been introduced in the field to mitigate the impact that a priori assumptions on such patterns have on the resulting model, with the work by D. Sommers opening the path for new research in the use of Neural Networks for the discovery of process models. In this thesis, we investigated a different way of using Deep Learning for the discovery task by changing the way the resulting Petri Net is constructed. Instead of conditioning the presence of a place in the resulting Petri net on the places chosen so far, we have decided to base the choice of the places on the order in which events appear in the different sequences included in the log. This approach, although generally effective on synthetic data, proved not to be as powerful as the one proposed by D. Sommers and the other algorithmic methods that constitute the State-of-the-Art in this field, especially when run on real-life logs.
PORTOLANI, PIETRO
ING - Scuola di Ingegneria Industriale e dell'Informazione
20-dic-2022
2021/2022
Il Process Discovery è il settore del Process Mining che si occupa di descrivere processi a partire dagli eventi generati dalla loro esecuzione, raggruppati in log. Queste descrizioni (note come modelli) vengono solitamente fornite sotto forma di reti di Petri, la cui analisi consente ai professionisti di studiare, ottimizzare e controllare il processo in esame. Il Process Discovery è stato tradizionalmente affrontato algoritmicamente, individuando all’interno dei log dei pattern definiti sulla base di alcune regole prestabilite. Recentemente, il Deep Learning è stato introdotto nel settore per mitigare l'impatto che le ipotesi sulla natura di questi pattern hanno sul modello risultante, con il lavoro di D. Sommers che apre la strada a nuove ricerche sull’uso delle Reti Neurali per la costruzione del modello di un processo. In questa tesi, abbiamo studiato un modo diverso di utilizzare il Deep Learning per la costruzione del modello di un processo, modificando il modo in cui viene costruita la rete di Petri risultante. Invece di condizionare la presenza di un posto, all’interno della rete, ai posti scelti in precedenza, abbiamo deciso di scegliere i posti che dovrebbero essere inclusi nella rete di Petri risultante, in base all'ordine in cui i diversi eventi compaiono all’interno delle sequenze incluse in un log. Questo approccio, sebbene generalmente efficace sui log artificiali, si è rivelato non essere all’altezza di quello proposto da D. Sommers e degli altri metodi algoritmici che costituiscono lo stato dell'arte in questo settore, specialmente se usato su log reali.
File allegati
File Dimensione Formato  
matteo_badenchini_2022_thesis.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Thesis
Dimensione 15.73 MB
Formato Adobe PDF
15.73 MB Adobe PDF   Visualizza/Apri
matteo_badenchini_2022_executive_summary.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Executive Summary
Dimensione 663.11 kB
Formato Adobe PDF
663.11 kB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/197892