Alla fine degli anni ’90, la comunità delle basi di dati pose la sua attenzione sugli stream di dati e pose le basi della ricerca sui Data Stream Managment Systems (DSMS). Oggi, dopo un decennio di ricerca accademica e numerose startup HiTech,i DSMS si possono dire una realtà affermata. Al contrario la comunità del Semantic Web sembra aver quasi ignorato la dinamicità del Web e, soprattutto, il crescente uso di stream di dati. Continuous-SPARQL (o semplicemente C-SPARQL) è un primo tentativo di applicare tecniche tipiche dei DSMS al Semantic Web. C-SPARQL estende SPARQL con un nuovo tipo di dato, lo stream RDF, e con la possibilità di registrare query continue in un apposito motore di esecuzione di interrogazioni C-SPARQL. Tale motore, sviluppato al Politecnico di Milano, è composto da un DSMS e da un motore SPARQL. Oggetto di questa tesi è stato quello di progettare, implementare e validare un traduttore automatico che consentisse verificare la correttezza sintattica e semantica di un’interrogazione C-SPARQL e, poi, di generare due due interrogazioni: una per il DSMS e una per il motore SPARQL. Per verificare la correttezza sintattica e semantica di un’interrogazione C-SPARQL si è definita la grammatica C-SPARQL e si è proceduto a generarne il parser utilizzando ANTLR. Per quanto riguarda, poi, la traduzione, sono stati progettati e implementati due traduttori che recuperano le informazioni necessarie dall’albero sintattico prodotto dal parser a partire dall’interrogazione C-SPARQL. L’approccio scelto è caratterizzato da un’alta flessibilità: consente di trattare i due aspetti di C-SPARQL separatamente, permette di gestire l’evoluzione dei due sottocomponenti di un motore C-SPARQL in modo indipendente, abilita la sostituzione di Esper con un altro DSMS e l’utilizzo di motori SPARQL non standard. Non da ultimo, permetterà di sviluppare ottimizzatori di interrogazioni C-SPARQL che sfruttino la diversa selettività degli operatori C-SPARQL e l’intrinseco parallelismo degli stream di dati.

Traduzione automatica di interrogazioni Continuous-SPARQL su stream RDF in EPL e SPARQL

REGALDO, MARCO
2009/2010

Abstract

Alla fine degli anni ’90, la comunità delle basi di dati pose la sua attenzione sugli stream di dati e pose le basi della ricerca sui Data Stream Managment Systems (DSMS). Oggi, dopo un decennio di ricerca accademica e numerose startup HiTech,i DSMS si possono dire una realtà affermata. Al contrario la comunità del Semantic Web sembra aver quasi ignorato la dinamicità del Web e, soprattutto, il crescente uso di stream di dati. Continuous-SPARQL (o semplicemente C-SPARQL) è un primo tentativo di applicare tecniche tipiche dei DSMS al Semantic Web. C-SPARQL estende SPARQL con un nuovo tipo di dato, lo stream RDF, e con la possibilità di registrare query continue in un apposito motore di esecuzione di interrogazioni C-SPARQL. Tale motore, sviluppato al Politecnico di Milano, è composto da un DSMS e da un motore SPARQL. Oggetto di questa tesi è stato quello di progettare, implementare e validare un traduttore automatico che consentisse verificare la correttezza sintattica e semantica di un’interrogazione C-SPARQL e, poi, di generare due due interrogazioni: una per il DSMS e una per il motore SPARQL. Per verificare la correttezza sintattica e semantica di un’interrogazione C-SPARQL si è definita la grammatica C-SPARQL e si è proceduto a generarne il parser utilizzando ANTLR. Per quanto riguarda, poi, la traduzione, sono stati progettati e implementati due traduttori che recuperano le informazioni necessarie dall’albero sintattico prodotto dal parser a partire dall’interrogazione C-SPARQL. L’approccio scelto è caratterizzato da un’alta flessibilità: consente di trattare i due aspetti di C-SPARQL separatamente, permette di gestire l’evoluzione dei due sottocomponenti di un motore C-SPARQL in modo indipendente, abilita la sostituzione di Esper con un altro DSMS e l’utilizzo di motori SPARQL non standard. Non da ultimo, permetterà di sviluppare ottimizzatori di interrogazioni C-SPARQL che sfruttino la diversa selettività degli operatori C-SPARQL e l’intrinseco parallelismo degli stream di dati.
BARBIERI, DAVIDE FRANCESCO
BRAGA, DANIELE
ING V - Facolta' di Ingegneria dell'Informazione
21-lug-2010
2009/2010
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
tesi.pdf

accessibile in internet per tutti

Descrizione: Testo tesi completo
Dimensione 1.34 MB
Formato Adobe PDF
1.34 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/803