A distributed relational query serving system based on the actor model

Biblioteche e Archivi
POLITesi - Archivio digitale delle tesi di laurea e di dottorato

We present an implementation of a distributed relational Query Serving System targeted towards ETL and Decision Support use cases. Our system mainly focuses on bulk updates and low latency reads targeted towards descriptive analysis. The complexity of the distributed deployment is tackled by relying on the Data Parallel Actor (DPA) model, a variation of the Actor Model of computation that accounts for data-centric requirements by focusing specifically on parallel cross-actor operations while also guaranteeing consistent data updates. We defined a declarative API that enables the user to define complex compositional queries. Each of those can be executed either on-read or on-write, enabling the user to shift the computational load at write time to improve read performances of frequent queries. We implemented our system starting from Uniserve, a runtime for DPA, which has been heavily modified to support our queries and to define actors as a result of other computations, enabling query-on-write execution.

Presentiamo un’implementazione di un Query Serving System relazionale per applicazioni di supporto decisionale ed ETL. Il sistema si concentra principalmente su applicazioni che necessitano di bulk updates e letture a bassa latenza finalizzate ad analisi descrittiva. Il sistema implementa il modello Data Parallel Actor (DPA), una variante del modello ad attori pensato per il design di applicazioni data-centric. A differenza del modello ad attori, il modello DPA si concentra principalmente sull’esecuzione parallela di operazioni che coinvolgono più attori, garantendo al contempo aggiornamenti consistenti dei dati. Il sistema offre un’API dichiarativa che consente all’utente di definire query complesse in uno stile composizionale. Ciascuna di queste può essere eseguita sia in lettura che in scrittura, consentendo di spostare il carico computazionale a write-time. Abbiamo implementato il nostro sistema a partire da Uniserve, un runtime per il modello DPA. Uniserve è stato modificato per eseguire in modo trasparente query innestate e per definire attori come risultato di altre interrogazioni, consentendo l’esecuzione di query in scrittura.

A distributed relational query serving system based on the actor model

ZEZZA, VITO SAVERIO

2022/2023

Abstract

We present an implementation of a distributed relational Query Serving System targeted towards ETL and Decision Support use cases. Our system mainly focuses on bulk updates and low latency reads targeted towards descriptive analysis. The complexity of the distributed deployment is tackled by relying on the Data Parallel Actor (DPA) model, a variation of the Actor Model of computation that accounts for data-centric requirements by focusing specifically on parallel cross-actor operations while also guaranteeing consistent data updates. We defined a declarative API that enables the user to define complex compositional queries. Each of those can be executed either on-read or on-write, enabling the user to shift the computational load at write time to improve read performances of frequent queries. We implemented our system starting from Uniserve, a runtime for DPA, which has been heavily modified to support our queries and to define actors as a result of other computations, enabling query-on-write execution.

Scheda breve

Scheda completa

	Relatore
	
				MARGARA, ALESSANDRO
			
	Scuola / Dip.
	
				ING  - Scuola di Ingegneria Industriale e dell'Informazione
			
	Data
	
				19-dic-2023
			
	Anno accademico
	
				2022/2023
			
	Abstract in italiano
	
				Presentiamo un’implementazione di un Query Serving System relazionale per applicazioni
di supporto decisionale ed ETL. Il sistema si concentra principalmente su applicazioni che
necessitano di bulk updates e letture a bassa latenza finalizzate ad analisi descrittiva.
Il sistema implementa il modello Data Parallel Actor (DPA), una variante del modello
ad attori pensato per il design di applicazioni data-centric. A differenza del modello ad
attori, il modello DPA si concentra principalmente sull’esecuzione parallela di operazioni
che coinvolgono più attori, garantendo al contempo aggiornamenti consistenti dei dati.
Il sistema offre un’API dichiarativa che consente all’utente di definire query complesse
in uno stile composizionale. Ciascuna di queste può essere eseguita sia in lettura che in
scrittura, consentendo di spostare il carico computazionale a write-time.
Abbiamo implementato il nostro sistema a partire da Uniserve, un runtime per il modello
DPA. Uniserve è stato modificato per eseguire in modo trasparente query innestate e per
definire attori come risultato di altre interrogazioni, consentendo l’esecuzione di query in
scrittura.
			
	Appare nelle tipologie:
	
				Tesi di laurea Magistrale

File allegati

File	Dimensione	Formato
2023_12_Zezza_Tesi_01.pdf accessibile in internet solo dagli utenti autorizzati Descrizione: Tesi Dimensione 1.63 MB Formato Adobe PDF Visualizza/Apri	1.63 MB	Adobe PDF	Visualizza/Apri
2023_12_Zezza_Executive_Summary_02.pdf accessibile in internet solo dagli utenti autorizzati Descrizione: Executive Summary Dimensione 438.17 kB Formato Adobe PDF Visualizza/Apri	438.17 kB	Adobe PDF	Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/215135