In recent years there has been an exponential growth of digital data that has led to the term Big Data . Big Data have created new challenges and new technologies to extract as much value as possible from the available data. Often, companies who want to extract useful information from their data don't have the resources to invest in an on-premises infrastructure needed to analyze Big Data and use platforms and services in the Cloud. One of the main areas where Big Data analysis is applied is Web Analytics to analyze user behavior in Web Applications. In this thesis we analyzed user interactions in Web Applications designed using a Model-Driven approach where its models are generated using the Interaction Flow Modeling Language (IFML) through the WebRatio platform. The analysis process is based on the analysis of Application server logs, WebRatio runtime logs, integrating them with the Application models and the data instances from the Database with the purpose to have a deeper understanding of user behavior. The whole analysis process has been implemented in the Microsoft Azure Platform in Cloud with HDInsight service, using a Spark cluster as technology to compute the desired analysis. The result of this work is to improve the state of the art by analyzing user interactions not only at the page and clicked links level but enriching them with the content and structure of the Web Application itself.

Negli ultimi anni si è assistito a una crescita esponenziale dei dati digitali che ha portato al introduzione del termine Big Data . I Big Data hanno creato nuove s de e nuove tecnologie per estrarre più valore possibile dai dati che si hanno a disposizione. Spesso le aziende che vogliono estrarre informazioni utili dai loro dati non hanno la possibilità di acquistare un'infrastruttura propretaria neccessaria per poter analizzare i Big Data e utilizzano piattaforme e servizi in Cloud. Una delle aree in cui maggiormente viene applicata l'analisi di Big Data è la Web Analytics per analizzare il comportamento degli utenti in Applicazioni Web. Lo scopo di questa tesi è di analizzare le interazioni degli utenti in Applicazioni Web progettate utilizzando un approccio Model-Driven, in cui i modelli sono generati utilizzando l'Interaction Flow Modeling Language(IFML) tramite la piattaformaWebRatio. Il processo di analisi si basa sull'analisi dei log del Application server, i log generati a runtime da WebRatio, integrandoli con i modelli dell'Applicazione e con le istanze dei dati provenienti dal Database con lo scopo di avere una comprensione piu profonda del comportamento degli utenti. L'intero processo di analisi è stato implementato con il servizio HDInisight della Piattaforma di Microsoft Azure, utilizzando un cluster Spark come tecnologia Big Data per il calcolo delle analisi desiderate. Il risultato di questo lavoro è di migliorare lo stato dell'arte analizzando l'interazione degli utenti non solo a livello di pagine e link clickati, ma arrichendolo con il contenuto e la struttura della Applicazione Web stessa.

A big data analysis framework for model-driven Web analytics

KOKA, THANAS
2016/2017

Abstract

In recent years there has been an exponential growth of digital data that has led to the term Big Data . Big Data have created new challenges and new technologies to extract as much value as possible from the available data. Often, companies who want to extract useful information from their data don't have the resources to invest in an on-premises infrastructure needed to analyze Big Data and use platforms and services in the Cloud. One of the main areas where Big Data analysis is applied is Web Analytics to analyze user behavior in Web Applications. In this thesis we analyzed user interactions in Web Applications designed using a Model-Driven approach where its models are generated using the Interaction Flow Modeling Language (IFML) through the WebRatio platform. The analysis process is based on the analysis of Application server logs, WebRatio runtime logs, integrating them with the Application models and the data instances from the Database with the purpose to have a deeper understanding of user behavior. The whole analysis process has been implemented in the Microsoft Azure Platform in Cloud with HDInsight service, using a Spark cluster as technology to compute the desired analysis. The result of this work is to improve the state of the art by analyzing user interactions not only at the page and clicked links level but enriching them with the content and structure of the Web Application itself.
MAURI, ANDREA
ING - Scuola di Ingegneria Industriale e dell'Informazione
22-dic-2017
2016/2017
Negli ultimi anni si è assistito a una crescita esponenziale dei dati digitali che ha portato al introduzione del termine Big Data . I Big Data hanno creato nuove s de e nuove tecnologie per estrarre più valore possibile dai dati che si hanno a disposizione. Spesso le aziende che vogliono estrarre informazioni utili dai loro dati non hanno la possibilità di acquistare un'infrastruttura propretaria neccessaria per poter analizzare i Big Data e utilizzano piattaforme e servizi in Cloud. Una delle aree in cui maggiormente viene applicata l'analisi di Big Data è la Web Analytics per analizzare il comportamento degli utenti in Applicazioni Web. Lo scopo di questa tesi è di analizzare le interazioni degli utenti in Applicazioni Web progettate utilizzando un approccio Model-Driven, in cui i modelli sono generati utilizzando l'Interaction Flow Modeling Language(IFML) tramite la piattaformaWebRatio. Il processo di analisi si basa sull'analisi dei log del Application server, i log generati a runtime da WebRatio, integrandoli con i modelli dell'Applicazione e con le istanze dei dati provenienti dal Database con lo scopo di avere una comprensione piu profonda del comportamento degli utenti. L'intero processo di analisi è stato implementato con il servizio HDInisight della Piattaforma di Microsoft Azure, utilizzando un cluster Spark come tecnologia Big Data per il calcolo delle analisi desiderate. Il risultato di questo lavoro è di migliorare lo stato dell'arte analizzando l'interazione degli utenti non solo a livello di pagine e link clickati, ma arrichendolo con il contenuto e la struttura della Applicazione Web stessa.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2017_12_Koka.pdf

solo utenti autorizzati dal 30/11/2018

Descrizione: Testo della tesi
Dimensione 2.83 MB
Formato Adobe PDF
2.83 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/138769