Over the past decade process mining has emerged as a new analytical discipline able to answer a variety of questions based on event data. Event logs have a very particular structure; events have timestamps, refer to activities and resources, and need to be correlated to form process instances. Moreover, event logs may be huge and may need to be decomposed and distributed for analysis. These aspects make it very cumbersome to analyze event logs manually therefore Process mining should be repeatable and automated. A process model is a representation of a real-world process, where a visual process model is commonly defined as a process diagram. On the other hand, process models can also be non-visual, for example, they might specify process execution semantics. Process diagrams can form a good basis for business process management activities since they enable process representation, observation and analysis. Based on the results of the analysis, existing processes can be changed, where the applied changes can be simulated or observed to see if they gain any improvements. If these activities perform continuously, processes undergo permanent improvements with positive impacts on the efficiency and effectiveness of an organization. This cycle of process improvement activities is commonly known as the PDCA (plan–do–check–adjust), an iterative four-step management method used in business for the control and continuous improvement of processes and products. After modeling the processes, it is time for the role-playing of Process Mining. Process Mining is a process analysis method that aims to discover, monitor and improve real processes (processes not assumed) by extracting knowledge easily from available event logs in the systems of current information of an organization. It goes beyond the pure presentation of the key data of the process, recognizing the contextual relationships of the processes, presenting them in the form of graphic analysis in order to diagnose problems and suggest improvements in the quality of the process models. With Process Mining it will be possible to detect or diagnose problems based on facts and not on conjectures or intuitions. Process mining seeks the confrontation between event data (observed behavior) and process models (hand-made or automatically discovered). Through the pairing of event data and process models, it will be possible to check compliance, detect deviations, predict delays, support decision making and recommend process redesigns. This Thesina aims at developing a tool which writes randomly generated log files (execution history) compliant with the user’s requests for a previously defined process Model. Log file well then be used to test process mining algorithms. The document is summarized with discussion, personal experience and challenges faced during the development and implementation process.

Negli ultimi dieci anni il processo di “mining” sta iniziando ad essere concepito come una nuova disciplina analitica in grado di rispondere a una varietà di domande basate su dati transazionali. I registri eventi hanno una struttura molto particolare; gli eventi hanno una marca temporale, fanno riferimento ad attività e risorse e devono essere correlati in modo da formare esempi di processo. Inoltre, i registri eventi possono essere vastissimi e devono essere scomposti e distribuiti per l'analisi. Questi aspetti rendono molto complicato analizzare manualmente i registri eventi, pertanto il processo di mining dovrebbe essere ripetibile e automatizzato. Un modello di processo è una rappresentazione di un processo del mondo reale, in cui un modello di processo visivo è comunemente definito come un diagramma di processo. D'altra parte, i modelli di processo possono anche essere non visivi, ad esempio potrebbero dettagliare la semantica dell'esecuzione del processo. I diagrammi di processo possono costituire una buona base delle attività di gestione dei processi aziendali poiché consentono la rappresentazione, l'osservazione e l'analisi dei processi. Sulla base dei risultati dell'analisi, è possibile modificare i processi esistenti, in cui è possibile simulare o osservare le modifiche applicate per vedere se si ottengono miglioramenti. Se queste attività si svolgono continuamente, i processi subiscono miglioramenti permanenti con impatti positivi sull'efficienza e l'efficacia di un'organizzazione. Questo ciclo di attività di miglioramento dei processi è comunemente noto come PDCA (plan-do-check-adjust), un metodo di gestione ripetitivo in quattro fasi utilizzato nelle attività commerciali per il controllo e il miglioramento continuo di processi e prodotti. Dopo aver modellato i processi, è il momento di interpretare il processo di mining. Il mining è un metodo di analisi dei processi che mira a scoprire, monitorare e migliorare i processi reali (processi non ipotizzati) estraendo facilmente la conoscenza dai registri eventi disponibili nei sistemi di informazioni correnti di un'organizzazione. Va oltre la pura presentazione dei dati chiave del processo, riconoscendo le relazioni contestuali dei processi, presentandoli sotto forma di analisi grafica al fine di diagnosticare i problemi e suggerire miglioramenti nella qualità dei modelli di processo. Con il processo di mining sarebbe possibile rilevare o diagnosticare problemi basati su fatti e non su congetture o intuizioni. Il mining cerca il confronto tra i dati sugli eventi (comportamento osservato) e i modelli di processo (creati a mano o scoperti automaticamente). Attraverso l'associazione di dati di eventi e modelli di processo, sarà possibile verificare la conformità, rilevare deviazioni, prevedere ritardi, supportare il processo decisionale e raccomandare le riprogettazioni del processo. Questa tesi mira a sviluppare uno strumento che scrive i file di registro generati casualmente (cronologia di esecuzione) delle attività conforme alle richieste dell'utente per un modello di processo precedentemente definito. Il file di registro può essere utilizzato per testare algoritmi di mining di processo. Il documento è sintetizzato con discussione, esperienza personale e sfide affrontate durante il processo di sviluppo e implementazione.

Generating log files for business process model mining

ARAGHIZADEH, ROYA
2018/2019

Abstract

Over the past decade process mining has emerged as a new analytical discipline able to answer a variety of questions based on event data. Event logs have a very particular structure; events have timestamps, refer to activities and resources, and need to be correlated to form process instances. Moreover, event logs may be huge and may need to be decomposed and distributed for analysis. These aspects make it very cumbersome to analyze event logs manually therefore Process mining should be repeatable and automated. A process model is a representation of a real-world process, where a visual process model is commonly defined as a process diagram. On the other hand, process models can also be non-visual, for example, they might specify process execution semantics. Process diagrams can form a good basis for business process management activities since they enable process representation, observation and analysis. Based on the results of the analysis, existing processes can be changed, where the applied changes can be simulated or observed to see if they gain any improvements. If these activities perform continuously, processes undergo permanent improvements with positive impacts on the efficiency and effectiveness of an organization. This cycle of process improvement activities is commonly known as the PDCA (plan–do–check–adjust), an iterative four-step management method used in business for the control and continuous improvement of processes and products. After modeling the processes, it is time for the role-playing of Process Mining. Process Mining is a process analysis method that aims to discover, monitor and improve real processes (processes not assumed) by extracting knowledge easily from available event logs in the systems of current information of an organization. It goes beyond the pure presentation of the key data of the process, recognizing the contextual relationships of the processes, presenting them in the form of graphic analysis in order to diagnose problems and suggest improvements in the quality of the process models. With Process Mining it will be possible to detect or diagnose problems based on facts and not on conjectures or intuitions. Process mining seeks the confrontation between event data (observed behavior) and process models (hand-made or automatically discovered). Through the pairing of event data and process models, it will be possible to check compliance, detect deviations, predict delays, support decision making and recommend process redesigns. This Thesina aims at developing a tool which writes randomly generated log files (execution history) compliant with the user’s requests for a previously defined process Model. Log file well then be used to test process mining algorithms. The document is summarized with discussion, personal experience and challenges faced during the development and implementation process.
ING - Scuola di Ingegneria Industriale e dell'Informazione
17-dic-2019
2018/2019
Negli ultimi dieci anni il processo di “mining” sta iniziando ad essere concepito come una nuova disciplina analitica in grado di rispondere a una varietà di domande basate su dati transazionali. I registri eventi hanno una struttura molto particolare; gli eventi hanno una marca temporale, fanno riferimento ad attività e risorse e devono essere correlati in modo da formare esempi di processo. Inoltre, i registri eventi possono essere vastissimi e devono essere scomposti e distribuiti per l'analisi. Questi aspetti rendono molto complicato analizzare manualmente i registri eventi, pertanto il processo di mining dovrebbe essere ripetibile e automatizzato. Un modello di processo è una rappresentazione di un processo del mondo reale, in cui un modello di processo visivo è comunemente definito come un diagramma di processo. D'altra parte, i modelli di processo possono anche essere non visivi, ad esempio potrebbero dettagliare la semantica dell'esecuzione del processo. I diagrammi di processo possono costituire una buona base delle attività di gestione dei processi aziendali poiché consentono la rappresentazione, l'osservazione e l'analisi dei processi. Sulla base dei risultati dell'analisi, è possibile modificare i processi esistenti, in cui è possibile simulare o osservare le modifiche applicate per vedere se si ottengono miglioramenti. Se queste attività si svolgono continuamente, i processi subiscono miglioramenti permanenti con impatti positivi sull'efficienza e l'efficacia di un'organizzazione. Questo ciclo di attività di miglioramento dei processi è comunemente noto come PDCA (plan-do-check-adjust), un metodo di gestione ripetitivo in quattro fasi utilizzato nelle attività commerciali per il controllo e il miglioramento continuo di processi e prodotti. Dopo aver modellato i processi, è il momento di interpretare il processo di mining. Il mining è un metodo di analisi dei processi che mira a scoprire, monitorare e migliorare i processi reali (processi non ipotizzati) estraendo facilmente la conoscenza dai registri eventi disponibili nei sistemi di informazioni correnti di un'organizzazione. Va oltre la pura presentazione dei dati chiave del processo, riconoscendo le relazioni contestuali dei processi, presentandoli sotto forma di analisi grafica al fine di diagnosticare i problemi e suggerire miglioramenti nella qualità dei modelli di processo. Con il processo di mining sarebbe possibile rilevare o diagnosticare problemi basati su fatti e non su congetture o intuizioni. Il mining cerca il confronto tra i dati sugli eventi (comportamento osservato) e i modelli di processo (creati a mano o scoperti automaticamente). Attraverso l'associazione di dati di eventi e modelli di processo, sarà possibile verificare la conformità, rilevare deviazioni, prevedere ritardi, supportare il processo decisionale e raccomandare le riprogettazioni del processo. Questa tesi mira a sviluppare uno strumento che scrive i file di registro generati casualmente (cronologia di esecuzione) delle attività conforme alle richieste dell'utente per un modello di processo precedentemente definito. Il file di registro può essere utilizzato per testare algoritmi di mining di processo. Il documento è sintetizzato con discussione, esperienza personale e sfide affrontate durante il processo di sviluppo e implementazione.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
ARAGHIZADEH-Roya-TesinaMSc.pdf

accessibile in internet per tutti

Descrizione: ARAGHIZADEH-Roya-TesinaMSc; Generating Log File for Process Model Mining
Dimensione 4.48 MB
Formato Adobe PDF
4.48 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/150621