The Web is a distributed environment populated by resources and agents that identify, represent, and interact with them. The decentralised nature of Web applications is one of the reasons for the popularity of the Web. Nevertheless, the Web results in an unbounded and noisy environment populated by heterogeneous resources. As part of the Web environment, applications must take resource heterogeneity into account. The Web of Data is the Web extension that addresses this challenge, known as Data Variety, using a stack of semantic technologies that include RDF, SPARQL, and OWL. Recently, a new generation of Web applications is showing the need for taming Data Velocity, i.e., processing data as soon as they arrive and before it is too late. New protocols are emerging to improve the Web's data infrastructure. Web Sockets and Server-Sent Events respectively enable continuous and reactive data access. Data velocity is related to the whole data infrastructure, and new abstractions are required, i.e., streams and events that are the fundamental entities of the stream processing. Although seminal work on Stream Reasoning and RDF Stream Processing paved the road for addressing Velocity on the Web, the following research question remains unanswered: Can we identify, represent, and interact with heterogeneous streams and events coming from a variety of Web sources? This PhD thesis investigates how to represent and interact with streams and events on the Web, assuming that existing technologies for identification are sufficiently mature to be used in this innovative context and they do not need further investigation yet. The investigation follows the structure of design science research projects. It identifies design problems and knowledge questions and solves them according to the Design Science methodology. In particular, this PhD thesis elicits two research problems from the research question: the representation problem and the processing problem. The former problem calls for an improvement in the Web of Data by representing streams, events, and to audit the provenance of Web stream transformations. The latter problem calls for an improvement in the Web of Data by enabling expressive yet efficient processing of Web streams and events. This PhD thesis breaks these two problems into feasible sub-problems, and it presents the formulation, the investigation, and the validation of the proposed solution. Moreover, this PhD thesis identifies yet another problem related to validation research in the context of the processing problem. The problem is named validation problem, and it calls for an improvement in comparative research for stream and event processing on the Web. This PhD thesis ends identifying the assumptions that limit the generality of the investigation. These assumptions are then relaxed, endeavouring to envision alternative research directions and future works.

Il Web è un sistema distribuito e popolato da risorse e agenti che le identificano, le rappresentano, e interagiscono con esse. La sua natura decentralizzata è alla base della popolarità del Web. Tuttavia, questo rende l'ambiente Web estremamente vasto ed eterogeneo. E, per questo motivo, le applicazioni Web devono considerare la eterogeneità del dato. Il Web of Data è una estensione del Web extension che ambisce a risolvere il problema dell'interoperabilità conseguente alla eterogeneità del dato. Alla base del Web of Data ci sono le tecnologie semantiche, e.g., RDF, SPARQL, and OWL. Recentemente, le applicazioni Web hanno iniziato a considerare un'altra importante dimensione del dato, nota come Data Velocity nel mondo Big Data Data Velocity è una dimensione che indica la necessità di processare il dato prima che sia troppo tardi. Per risolvere questo problema, l'architettura Web è stata estesa con nuovi protocolli come Web Sockets e Server-Sent Events. Tuttavia, la Data velocity impatta l'intera infrastruttura Web e non solo la sua architettura. Sono necessarie nuove astrazioni tipiche del mondo stream processing: streams e events. In questo contesto, è rilevante il lavoro su Stream Reasoning e RDF Stream Processing, il quale ha aperto la strata per risolvere il problema della data Velocity sul Web. La domanda di ricerca è quindi: è possibile identificare, rappresentare e interagire con stream e eventi caratterizzati da eterogeneità e provenienti da varie sorgenti Web? Questa tesi di dottorato investiga come rispondere alla domanda appena formulata. In particolare, questa tesi di dottorato identifica due research problems dalla domanda di ricerca: the representation problem and the processing problem. È importante sottolineare che questa tesi assume risolto il problema di identificare stream ed eventi sul Web. Quindi, la tesi si focalizza su i rimanenti problemi di rappresentazione e interazione. Inoltre, la tesi identifica un ulteriore problema che riguarda la validazione nel contesto del processing problem. Il "validation problem" richiede di sistematizzare la ricerca in modo comparativo. Il progetto di ricerca della tesi segue la struttura tipica della Design Science. Essa identifica problemi di design e Knoweldge Questions e li risolve seguendo Design Science methodology. In conclusione, la tesi identifica le assunzioni che possono essere rilassate e presenta possibili lavori futuri.

Velocity on the web

TOMMASINI, RICCARDO

Abstract

The Web is a distributed environment populated by resources and agents that identify, represent, and interact with them. The decentralised nature of Web applications is one of the reasons for the popularity of the Web. Nevertheless, the Web results in an unbounded and noisy environment populated by heterogeneous resources. As part of the Web environment, applications must take resource heterogeneity into account. The Web of Data is the Web extension that addresses this challenge, known as Data Variety, using a stack of semantic technologies that include RDF, SPARQL, and OWL. Recently, a new generation of Web applications is showing the need for taming Data Velocity, i.e., processing data as soon as they arrive and before it is too late. New protocols are emerging to improve the Web's data infrastructure. Web Sockets and Server-Sent Events respectively enable continuous and reactive data access. Data velocity is related to the whole data infrastructure, and new abstractions are required, i.e., streams and events that are the fundamental entities of the stream processing. Although seminal work on Stream Reasoning and RDF Stream Processing paved the road for addressing Velocity on the Web, the following research question remains unanswered: Can we identify, represent, and interact with heterogeneous streams and events coming from a variety of Web sources? This PhD thesis investigates how to represent and interact with streams and events on the Web, assuming that existing technologies for identification are sufficiently mature to be used in this innovative context and they do not need further investigation yet. The investigation follows the structure of design science research projects. It identifies design problems and knowledge questions and solves them according to the Design Science methodology. In particular, this PhD thesis elicits two research problems from the research question: the representation problem and the processing problem. The former problem calls for an improvement in the Web of Data by representing streams, events, and to audit the provenance of Web stream transformations. The latter problem calls for an improvement in the Web of Data by enabling expressive yet efficient processing of Web streams and events. This PhD thesis breaks these two problems into feasible sub-problems, and it presents the formulation, the investigation, and the validation of the proposed solution. Moreover, this PhD thesis identifies yet another problem related to validation research in the context of the processing problem. The problem is named validation problem, and it calls for an improvement in comparative research for stream and event processing on the Web. This PhD thesis ends identifying the assumptions that limit the generality of the investigation. These assumptions are then relaxed, endeavouring to envision alternative research directions and future works.
PERNICI, BARBARA
PRADELLA, MATTEO
3-feb-2020
Il Web è un sistema distribuito e popolato da risorse e agenti che le identificano, le rappresentano, e interagiscono con esse. La sua natura decentralizzata è alla base della popolarità del Web. Tuttavia, questo rende l'ambiente Web estremamente vasto ed eterogeneo. E, per questo motivo, le applicazioni Web devono considerare la eterogeneità del dato. Il Web of Data è una estensione del Web extension che ambisce a risolvere il problema dell'interoperabilità conseguente alla eterogeneità del dato. Alla base del Web of Data ci sono le tecnologie semantiche, e.g., RDF, SPARQL, and OWL. Recentemente, le applicazioni Web hanno iniziato a considerare un'altra importante dimensione del dato, nota come Data Velocity nel mondo Big Data Data Velocity è una dimensione che indica la necessità di processare il dato prima che sia troppo tardi. Per risolvere questo problema, l'architettura Web è stata estesa con nuovi protocolli come Web Sockets e Server-Sent Events. Tuttavia, la Data velocity impatta l'intera infrastruttura Web e non solo la sua architettura. Sono necessarie nuove astrazioni tipiche del mondo stream processing: streams e events. In questo contesto, è rilevante il lavoro su Stream Reasoning e RDF Stream Processing, il quale ha aperto la strata per risolvere il problema della data Velocity sul Web. La domanda di ricerca è quindi: è possibile identificare, rappresentare e interagire con stream e eventi caratterizzati da eterogeneità e provenienti da varie sorgenti Web? Questa tesi di dottorato investiga come rispondere alla domanda appena formulata. In particolare, questa tesi di dottorato identifica due research problems dalla domanda di ricerca: the representation problem and the processing problem. È importante sottolineare che questa tesi assume risolto il problema di identificare stream ed eventi sul Web. Quindi, la tesi si focalizza su i rimanenti problemi di rappresentazione e interazione. Inoltre, la tesi identifica un ulteriore problema che riguarda la validazione nel contesto del processing problem. Il "validation problem" richiede di sistematizzare la ricerca in modo comparativo. Il progetto di ricerca della tesi segue la struttura tipica della Design Science. Essa identifica problemi di design e Knoweldge Questions e li risolve seguendo Design Science methodology. In conclusione, la tesi identifica le assunzioni che possono essere rilassate e presenta possibili lavori futuri.
Tesi di dottorato
File allegati
File Dimensione Formato  
thesis.pdf

accessibile in internet per tutti

Dimensione 5.45 MB
Formato Adobe PDF
5.45 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/152616