Nowadays companies all around the world are moving towards a digital universe, this means that they can record many aspects of their activity, in a particular way their relationship with customers and what happens during their interaction. This new kind of data, deriving from the digital evolution opens the horizons to new possibilities of improvements, among them there are the ones highlighted during this thesis. This information is collected in the form of an event log and among these events, there may be some of them which are “critical”, like complaints or contracts ending that the company wants to avoid. The studies performed in this thesis have culminated with the development of a pipeline able to exploit at its best and innovatively those data made accessible by companies. The core of the pipeline is a machine learning module used to predict critical events and assess the goodness of results; more importantly the model provides an interpretation of the causes of the critical event. The fundamental idea is to refactor the event logs in input to have to face a classification problem with traces as elements, a trace can be seen as the path that the customer crosses during their experience with the company. This procedure does not involve the modeling of the whole process, a task which instead is the main focus of approaches found in the literature. Every company can make different choices when it comes to recording data, for instance, they can choose if a client should be associated with a single trace or if he must have one trace for each session he performs. To have a correct interpretation of results, the traces meaning should be clear to the pipeline user but, from a technical point of view, this doesn’t affect the approach or the operations that will be executed. All the phases of feature engineering, feature reduction, and model choice are internal to the pipeline and transparent to the company.

Al giorno d’oggi le aziende di tutto il mondo si stanno muovendo verso un universo digitale, ciò vuol dire che sono in grado di registrare molti aspetti della loro attività, in particolar modo le relazioni e le interazioni con i clienti. Questa nuova tipologia di dati derivante dall’evoluzione digitale apre gli orizzonti per nuove possibilità di miglioramento, tra cui quelle evidenziate nel corso di questa tesi. Queste informazioni sono salvate sotto forma di log di eventi e tra questi ce ne sono alcuni “critici”, come reclami e terminazioni di contratto, che le aziende vogliono evitare. Gli studi svolti nel corso di questa tesi sono culminati con la realizzazione di una pipeline atta a sfruttare al meglio e in maniera innovativa questi dati messi a disposizione dalle aziende. Il cuore della pipeline è un modulo di machine learning che ha lo scopo di prevedere gli eventi critici e per capire la bontà dei risultati; ma soprattutto il modello fornisce un’interpretazione delle cause che hanno portato al verificarsi dell’evento critico. L’idea fondamentale è quella di ristrutturare i log di eventi forniti in input così da dover affrontare un problema di classificazione in cui le tracce sono gli elementi fondanti, una traccia può essere vista come un percorso che il cliente percorre durante la sua esperienza con l’azienda. Questa procedura non prevede la modellazione dell’intero processo, un aspetto considerato invece cruciale per gli approcci presenti in letteratura. Ogni azienda può compiere diverse scelte nella registrazione dei dati, come ad esempio scegliere se ciascun utente ha una sola traccia o ne possiede una per ciascuna sua sessione. Per poter dare una corretta interpretazione dei risultati, il significato delle tracce deve essere chiaro all’utilizzatore della pipeline, ma da un punto di vista meramente tecnico, non influenza l’approccio e le operazioni che vengono eseguite. Tutte le fasi di feature engineering, feature reduction e scelta del modello sono interne alla pipeline e trasparenti all’azienda utilizzatrice.

Root cause analysis in process mining

FRANTUMA, ELIA
2021/2022

Abstract

Nowadays companies all around the world are moving towards a digital universe, this means that they can record many aspects of their activity, in a particular way their relationship with customers and what happens during their interaction. This new kind of data, deriving from the digital evolution opens the horizons to new possibilities of improvements, among them there are the ones highlighted during this thesis. This information is collected in the form of an event log and among these events, there may be some of them which are “critical”, like complaints or contracts ending that the company wants to avoid. The studies performed in this thesis have culminated with the development of a pipeline able to exploit at its best and innovatively those data made accessible by companies. The core of the pipeline is a machine learning module used to predict critical events and assess the goodness of results; more importantly the model provides an interpretation of the causes of the critical event. The fundamental idea is to refactor the event logs in input to have to face a classification problem with traces as elements, a trace can be seen as the path that the customer crosses during their experience with the company. This procedure does not involve the modeling of the whole process, a task which instead is the main focus of approaches found in the literature. Every company can make different choices when it comes to recording data, for instance, they can choose if a client should be associated with a single trace or if he must have one trace for each session he performs. To have a correct interpretation of results, the traces meaning should be clear to the pipeline user but, from a technical point of view, this doesn’t affect the approach or the operations that will be executed. All the phases of feature engineering, feature reduction, and model choice are internal to the pipeline and transparent to the company.
LUI, ANDREA
ING - Scuola di Ingegneria Industriale e dell'Informazione
22-lug-2022
2021/2022
Al giorno d’oggi le aziende di tutto il mondo si stanno muovendo verso un universo digitale, ciò vuol dire che sono in grado di registrare molti aspetti della loro attività, in particolar modo le relazioni e le interazioni con i clienti. Questa nuova tipologia di dati derivante dall’evoluzione digitale apre gli orizzonti per nuove possibilità di miglioramento, tra cui quelle evidenziate nel corso di questa tesi. Queste informazioni sono salvate sotto forma di log di eventi e tra questi ce ne sono alcuni “critici”, come reclami e terminazioni di contratto, che le aziende vogliono evitare. Gli studi svolti nel corso di questa tesi sono culminati con la realizzazione di una pipeline atta a sfruttare al meglio e in maniera innovativa questi dati messi a disposizione dalle aziende. Il cuore della pipeline è un modulo di machine learning che ha lo scopo di prevedere gli eventi critici e per capire la bontà dei risultati; ma soprattutto il modello fornisce un’interpretazione delle cause che hanno portato al verificarsi dell’evento critico. L’idea fondamentale è quella di ristrutturare i log di eventi forniti in input così da dover affrontare un problema di classificazione in cui le tracce sono gli elementi fondanti, una traccia può essere vista come un percorso che il cliente percorre durante la sua esperienza con l’azienda. Questa procedura non prevede la modellazione dell’intero processo, un aspetto considerato invece cruciale per gli approcci presenti in letteratura. Ogni azienda può compiere diverse scelte nella registrazione dei dati, come ad esempio scegliere se ciascun utente ha una sola traccia o ne possiede una per ciascuna sua sessione. Per poter dare una corretta interpretazione dei risultati, il significato delle tracce deve essere chiaro all’utilizzatore della pipeline, ma da un punto di vista meramente tecnico, non influenza l’approccio e le operazioni che vengono eseguite. Tutte le fasi di feature engineering, feature reduction e scelta del modello sono interne alla pipeline e trasparenti all’azienda utilizzatrice.
File allegati
File Dimensione Formato  
Thesis_Elia_Frantuma.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Unico documento di tesi
Dimensione 2.28 MB
Formato Adobe PDF
2.28 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/190622