Traduzione automatica di interrogazioni Continuous-SPARQL su stream RDF in EPL e SPARQL

Alla fine degli anni ’90, la comunità delle basi di dati pose la sua attenzione sugli stream di dati e pose le basi della ricerca sui Data Stream Managment Systems (DSMS). Oggi, dopo un decennio di ricerca accademica e numerose startup HiTech,i DSMS si possono dire una realtà affermata. Al contrario la comunità del Semantic Web sembra aver quasi ignorato la dinamicità del Web e, soprattutto, il crescente uso di stream di dati. Continuous-SPARQL (o semplicemente C-SPARQL) è un primo tentativo di applicare tecniche tipiche dei DSMS al Semantic Web. C-SPARQL estende SPARQL con un nuovo tipo di dato, lo stream RDF, e con la possibilità di registrare query continue in un apposito motore di esecuzione di interrogazioni C-SPARQL. Tale motore, sviluppato al Politecnico di Milano, è composto da un DSMS e da un motore SPARQL. Oggetto di questa tesi è stato quello di progettare, implementare e validare un traduttore automatico che consentisse verificare la correttezza sintattica e semantica di un’interrogazione C-SPARQL e, poi, di generare due due interrogazioni: una per il DSMS e una per il motore SPARQL. Per verificare la correttezza sintattica e semantica di un’interrogazione C-SPARQL si è definita la grammatica C-SPARQL e si è proceduto a generarne il parser utilizzando ANTLR. Per quanto riguarda, poi, la traduzione, sono stati progettati e implementati due traduttori che recuperano le informazioni necessarie dall’albero sintattico prodotto dal parser a partire dall’interrogazione C-SPARQL. L’approccio scelto è caratterizzato da un’alta flessibilità: consente di trattare i due aspetti di C-SPARQL separatamente, permette di gestire l’evoluzione dei due sottocomponenti di un motore C-SPARQL in modo indipendente, abilita la sostituzione di Esper con un altro DSMS e l’utilizzo di motori SPARQL non standard. Non da ultimo, permetterà di sviluppare ottimizzatori di interrogazioni C-SPARQL che sfruttino la diversa selettività degli operatori C-SPARQL e l’intrinseco parallelismo degli stream di dati.

Traduzione automatica di interrogazioni Continuous-SPARQL su stream RDF in EPL e SPARQL

REGALDO, MARCO

2009/2010

Abstract

Alla fine degli anni ’90, la comunità delle basi di dati pose la sua attenzione sugli stream di dati e pose le basi della ricerca sui Data Stream Managment Systems (DSMS). Oggi, dopo un decennio di ricerca accademica e numerose startup HiTech,i DSMS si possono dire una realtà affermata. Al contrario la comunità del Semantic Web sembra aver quasi ignorato la dinamicità del Web e, soprattutto, il crescente uso di stream di dati. Continuous-SPARQL (o semplicemente C-SPARQL) è un primo tentativo di applicare tecniche tipiche dei DSMS al Semantic Web. C-SPARQL estende SPARQL con un nuovo tipo di dato, lo stream RDF, e con la possibilità di registrare query continue in un apposito motore di esecuzione di interrogazioni C-SPARQL. Tale motore, sviluppato al Politecnico di Milano, è composto da un DSMS e da un motore SPARQL. Oggetto di questa tesi è stato quello di progettare, implementare e validare un traduttore automatico che consentisse verificare la correttezza sintattica e semantica di un’interrogazione C-SPARQL e, poi, di generare due due interrogazioni: una per il DSMS e una per il motore SPARQL. Per verificare la correttezza sintattica e semantica di un’interrogazione C-SPARQL si è definita la grammatica C-SPARQL e si è proceduto a generarne il parser utilizzando ANTLR. Per quanto riguarda, poi, la traduzione, sono stati progettati e implementati due traduttori che recuperano le informazioni necessarie dall’albero sintattico prodotto dal parser a partire dall’interrogazione C-SPARQL. L’approccio scelto è caratterizzato da un’alta flessibilità: consente di trattare i due aspetti di C-SPARQL separatamente, permette di gestire l’evoluzione dei due sottocomponenti di un motore C-SPARQL in modo indipendente, abilita la sostituzione di Esper con un altro DSMS e l’utilizzo di motori SPARQL non standard. Non da ultimo, permetterà di sviluppare ottimizzatori di interrogazioni C-SPARQL che sfruttino la diversa selettività degli operatori C-SPARQL e l’intrinseco parallelismo degli stream di dati.

Scheda breve

Scheda completa

	Relatore
	
				DELLA VALLE, EMANUELE
			
	Correlatore/i
	
				BARBIERI, DAVIDE FRANCESCO
BRAGA, DANIELE
			
	Scuola / Dip.
	
				ING V - Facolta' di Ingegneria dell'Informazione
			
	Data
	
				21-lug-2010
			
	Anno accademico
	
				2009/2010
			
	Tipo di documento
	
				Tesi di laurea Magistrale
			
	Appare nelle tipologie:
	
				Tesi di laurea Magistrale

File allegati

File	Dimensione	Formato
tesi.pdf accessibile in internet per tutti Descrizione: Testo tesi completo Dimensione 1.34 MB Formato Adobe PDF Visualizza/Apri	1.34 MB	Adobe PDF	Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/803