In the context of pervasive digitalisation, every process around us could be recorded and investigated for insights, predictions, better decision making and optimisation possibilities. Variability is always present in real-world processes and it is crucial to take it into consideration during the analysis and the development of solutions. Process attributes could explain part of the process variability, steering the process towards specific variants in presence of determined characteristics; it is therefore crucial to insert them into the process investigation. At the same time, a certain degree of stochasticity will always permeate a process being a source of variability. Process mining is a recently rising field that provides tools to extract knowledge about the process from data recorded by information systems. Process mining techniques are able to create process models, predict process behaviour as well as establishing the adherence of a model to specific data. Machine learning is another scientific field that has revolutionised many areas of our lives in recent times. It can automatically learn complex patterns linking an input to an output of a given system or detect similarities and relations inside data. In this thesis we investigate the use of machine learning techniques to deal with the process variability, taking into consideration process attributes and stochasticity inside the process mining analysis. Specifically, in the first part we study the uncertainty hidden in the forecast of neural networks in the next activity prediction task. Due to the hard explainability of neural networks, in the second part the thesis focuses on methods related to explicit process models. In particular, it proposes a novel approach to trace clustering and to decision discovery in a given model. The thesis also developed an extension to a state-of-the-art method to compose a stochastic process model that considers process attributes and activities previously executed during an instance execution. The developed approaches are then applied to an industrial case study to predict the most probable activities needed to produce a specific item in a highly flexible manufacturing process.

Nel contesto della digitalizzazione pervasiva in cui viviamo, ogni processo che ci circonda può essere registrato e analizzato per ottenere approfondimenti, effettuare previsioni, migliorare il processo decisionale e individuare possibilità di ottimizzazione. La variabilità è sempre presente nei processi del mondo reale ed è fondamentale tenerne conto durante l'analisi e lo sviluppo di soluzioni. Le caratteristiche di un processo possono spiegare parte della sua variabilità, indirizzandolo verso specifiche varianti in presenza di determinati attributi; è quindi essenziale includerli nell'analisi del processo stesso. Allo stesso tempo, sarà sempre presente un certo grado di stocasticità che costituisce una seconda fonte di variabilità. Il Process Mining è un campo emergente che fornisce strumenti per indagare e conoscere i processi a partire dai dati registrati dai sistemi informativi durante la loro esecuzione. Le tecniche di Process Mining consentono di creare modelli di processo, prevederne il comportamento e valutare l'aderenza di un modello a specifici dati. Il Machine Learning è un altro ambito scientifico che recentemente ha rivoluzionato molte aree della nostra vita. Questa disciplina permette di apprendere automaticamente schemi complessi che collegano un input ad un output di un determinato sistema o di individuare somiglianze e relazioni all'interno dei dati. In questa tesi, si indaga l'uso di tecniche di Machine Learning per gestire la variabilità dei processi, considerando gli attributi di processo e la stocasticità nell'analisi basata sul Process Mining. In particolare, nella prima parte si studia l'incertezza insita negli output delle reti neurali impiegate nella predizione delle attività in una sequenza. A causa della difficile interpretabilità delle reti neurali, nella seconda parte la tesi si concentra su metodi basati su modelli di processo espliciti. In particolare, viene proposta una nuova metodologia per il clustering delle tracce e per la scoperta delle decisioni all'interno di un dato modello. Inoltre, è stata sviluppata un'estensione di un metodo all'avanguardia per la composizione di un modello di processo stocastico, che tiene conto degli attributi di processo e delle attività precedentemente eseguite durante l'istanza in esecuzione. Gli approcci sviluppati sono stati applicati a un caso di studio industriale per prevedere le attività più probabili necessarie alla produzione di un determinato articolo in un processo di produzione altamente flessibile.

Machine learning for probabilistic and attribute-aware process mining

PORTOLANI, PIETRO
2024/2025

Abstract

In the context of pervasive digitalisation, every process around us could be recorded and investigated for insights, predictions, better decision making and optimisation possibilities. Variability is always present in real-world processes and it is crucial to take it into consideration during the analysis and the development of solutions. Process attributes could explain part of the process variability, steering the process towards specific variants in presence of determined characteristics; it is therefore crucial to insert them into the process investigation. At the same time, a certain degree of stochasticity will always permeate a process being a source of variability. Process mining is a recently rising field that provides tools to extract knowledge about the process from data recorded by information systems. Process mining techniques are able to create process models, predict process behaviour as well as establishing the adherence of a model to specific data. Machine learning is another scientific field that has revolutionised many areas of our lives in recent times. It can automatically learn complex patterns linking an input to an output of a given system or detect similarities and relations inside data. In this thesis we investigate the use of machine learning techniques to deal with the process variability, taking into consideration process attributes and stochasticity inside the process mining analysis. Specifically, in the first part we study the uncertainty hidden in the forecast of neural networks in the next activity prediction task. Due to the hard explainability of neural networks, in the second part the thesis focuses on methods related to explicit process models. In particular, it proposes a novel approach to trace clustering and to decision discovery in a given model. The thesis also developed an extension to a state-of-the-art method to compose a stochastic process model that considers process attributes and activities previously executed during an instance execution. The developed approaches are then applied to an industrial case study to predict the most probable activities needed to produce a specific item in a highly flexible manufacturing process.
PIRODDI, LUIGI
MARTINENGHI, DAVIDE
4-mar-2025
Machine learning for probabilistic and attribute-aware process mining
Nel contesto della digitalizzazione pervasiva in cui viviamo, ogni processo che ci circonda può essere registrato e analizzato per ottenere approfondimenti, effettuare previsioni, migliorare il processo decisionale e individuare possibilità di ottimizzazione. La variabilità è sempre presente nei processi del mondo reale ed è fondamentale tenerne conto durante l'analisi e lo sviluppo di soluzioni. Le caratteristiche di un processo possono spiegare parte della sua variabilità, indirizzandolo verso specifiche varianti in presenza di determinati attributi; è quindi essenziale includerli nell'analisi del processo stesso. Allo stesso tempo, sarà sempre presente un certo grado di stocasticità che costituisce una seconda fonte di variabilità. Il Process Mining è un campo emergente che fornisce strumenti per indagare e conoscere i processi a partire dai dati registrati dai sistemi informativi durante la loro esecuzione. Le tecniche di Process Mining consentono di creare modelli di processo, prevederne il comportamento e valutare l'aderenza di un modello a specifici dati. Il Machine Learning è un altro ambito scientifico che recentemente ha rivoluzionato molte aree della nostra vita. Questa disciplina permette di apprendere automaticamente schemi complessi che collegano un input ad un output di un determinato sistema o di individuare somiglianze e relazioni all'interno dei dati. In questa tesi, si indaga l'uso di tecniche di Machine Learning per gestire la variabilità dei processi, considerando gli attributi di processo e la stocasticità nell'analisi basata sul Process Mining. In particolare, nella prima parte si studia l'incertezza insita negli output delle reti neurali impiegate nella predizione delle attività in una sequenza. A causa della difficile interpretabilità delle reti neurali, nella seconda parte la tesi si concentra su metodi basati su modelli di processo espliciti. In particolare, viene proposta una nuova metodologia per il clustering delle tracce e per la scoperta delle decisioni all'interno di un dato modello. Inoltre, è stata sviluppata un'estensione di un metodo all'avanguardia per la composizione di un modello di processo stocastico, che tiene conto degli attributi di processo e delle attività precedentemente eseguite durante l'istanza in esecuzione. Gli approcci sviluppati sono stati applicati a un caso di studio industriale per prevedere le attività più probabili necessarie alla produzione di un determinato articolo in un processo di produzione altamente flessibile.
File allegati
File Dimensione Formato  
portolani_phd_thesis.pdf

accessibile in internet per tutti

Dimensione 14.24 MB
Formato Adobe PDF
14.24 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/233432