We present an implementation of a distributed relational Query Serving System targeted towards ETL and Decision Support use cases. Our system mainly focuses on bulk updates and low latency reads targeted towards descriptive analysis. The complexity of the distributed deployment is tackled by relying on the Data Parallel Actor (DPA) model, a variation of the Actor Model of computation that accounts for data-centric requirements by focusing specifically on parallel cross-actor operations while also guaranteeing consistent data updates. We defined a declarative API that enables the user to define complex compositional queries. Each of those can be executed either on-read or on-write, enabling the user to shift the computational load at write time to improve read performances of frequent queries. We implemented our system starting from Uniserve, a runtime for DPA, which has been heavily modified to support our queries and to define actors as a result of other computations, enabling query-on-write execution.

Presentiamo un’implementazione di un Query Serving System relazionale per applicazioni di supporto decisionale ed ETL. Il sistema si concentra principalmente su applicazioni che necessitano di bulk updates e letture a bassa latenza finalizzate ad analisi descrittiva. Il sistema implementa il modello Data Parallel Actor (DPA), una variante del modello ad attori pensato per il design di applicazioni data-centric. A differenza del modello ad attori, il modello DPA si concentra principalmente sull’esecuzione parallela di operazioni che coinvolgono più attori, garantendo al contempo aggiornamenti consistenti dei dati. Il sistema offre un’API dichiarativa che consente all’utente di definire query complesse in uno stile composizionale. Ciascuna di queste può essere eseguita sia in lettura che in scrittura, consentendo di spostare il carico computazionale a write-time. Abbiamo implementato il nostro sistema a partire da Uniserve, un runtime per il modello DPA. Uniserve è stato modificato per eseguire in modo trasparente query innestate e per definire attori come risultato di altre interrogazioni, consentendo l’esecuzione di query in scrittura.

A distributed relational query serving system based on the actor model

ZEZZA, VITO SAVERIO
2022/2023

Abstract

We present an implementation of a distributed relational Query Serving System targeted towards ETL and Decision Support use cases. Our system mainly focuses on bulk updates and low latency reads targeted towards descriptive analysis. The complexity of the distributed deployment is tackled by relying on the Data Parallel Actor (DPA) model, a variation of the Actor Model of computation that accounts for data-centric requirements by focusing specifically on parallel cross-actor operations while also guaranteeing consistent data updates. We defined a declarative API that enables the user to define complex compositional queries. Each of those can be executed either on-read or on-write, enabling the user to shift the computational load at write time to improve read performances of frequent queries. We implemented our system starting from Uniserve, a runtime for DPA, which has been heavily modified to support our queries and to define actors as a result of other computations, enabling query-on-write execution.
ING - Scuola di Ingegneria Industriale e dell'Informazione
19-dic-2023
2022/2023
Presentiamo un’implementazione di un Query Serving System relazionale per applicazioni di supporto decisionale ed ETL. Il sistema si concentra principalmente su applicazioni che necessitano di bulk updates e letture a bassa latenza finalizzate ad analisi descrittiva. Il sistema implementa il modello Data Parallel Actor (DPA), una variante del modello ad attori pensato per il design di applicazioni data-centric. A differenza del modello ad attori, il modello DPA si concentra principalmente sull’esecuzione parallela di operazioni che coinvolgono più attori, garantendo al contempo aggiornamenti consistenti dei dati. Il sistema offre un’API dichiarativa che consente all’utente di definire query complesse in uno stile composizionale. Ciascuna di queste può essere eseguita sia in lettura che in scrittura, consentendo di spostare il carico computazionale a write-time. Abbiamo implementato il nostro sistema a partire da Uniserve, un runtime per il modello DPA. Uniserve è stato modificato per eseguire in modo trasparente query innestate e per definire attori come risultato di altre interrogazioni, consentendo l’esecuzione di query in scrittura.
File allegati
File Dimensione Formato  
2023_12_Zezza_Tesi_01.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Tesi
Dimensione 1.63 MB
Formato Adobe PDF
1.63 MB Adobe PDF   Visualizza/Apri
2023_12_Zezza_Executive_Summary_02.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Executive Summary
Dimensione 438.17 kB
Formato Adobe PDF
438.17 kB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/215135