In recent years, data have become increasingly heterogeneous so, the old monolithic and centralized data platforms, such as the data warehouses and the data lakes, showed their limitations. The new paradigm of the Data Mesh data architecture, introduced by Zhamak Dehghani in 2019, tries to overcome these limitations. The core concept of the Data Mesh is considering the data as a product. Each domain team, inside a Data Mesh, is responsible for the data provided and manages it in order to make it available to other domain teams. Being a recent topic, the literature offers few works about it and some aspects must be better clarified. In our work, we want to investigate how can be possible to define and manage security policies to access the data in the federated context of the Data Mesh. We will provide models to design a security framework, with the related components to access the data and tools to run the policies. The models proposed, regulate the interactions between data consumers and data products. We will adopt Open Policy Agent (OPA) as the policy decision point (PDP) to test the policies that we will define.

Negli ultimi anni, i dati sono diventati sempre più eterogenei e di conseguenza le vecchie piattaforme di contenimento dei dati, monolitiche e centralizzate, come le data warehouses e i data lakes, hanno mostrato i loro limiti. Il nuovo paradigma dell’architettura dati del Data Mesh, introdotto da Zhamak Dehghani nel 2019, prova a superare questi limiti. Il concetto centrale del Data Mesh è considerare il dato come un prodotto. Ogni team di dominio, all’interno di un Data Mesh, è responsabile dei dati forniti e li rende disponibili ad altri team di dominio. Trattandosi di un argomento recente, lo stato dell’arte offre pochi articoli a riguardo e alcuni aspetti dovrebbero essere chiariti meglio. In questo lavoro di tesi, vogliamo indagare come sia possibile definire e gestire delle politiche di sicurezza per accedere ai dati, nel contesto federato del Data Mesh. Forniremo modelli per definire i componenti coinvolti nell’accesso dei dati e gli strumenti per eseguire le politiche. I modelli proposti regolano la relazione tra consumatori e dati. Adotteremo Open Policy Agent (OPA) come decisore di politiche (PDP) per testare le politiche che definiremo.

A framework to manage access control policies in federated Data Mesh

CARONNI, DIEGO
2022/2023

Abstract

In recent years, data have become increasingly heterogeneous so, the old monolithic and centralized data platforms, such as the data warehouses and the data lakes, showed their limitations. The new paradigm of the Data Mesh data architecture, introduced by Zhamak Dehghani in 2019, tries to overcome these limitations. The core concept of the Data Mesh is considering the data as a product. Each domain team, inside a Data Mesh, is responsible for the data provided and manages it in order to make it available to other domain teams. Being a recent topic, the literature offers few works about it and some aspects must be better clarified. In our work, we want to investigate how can be possible to define and manage security policies to access the data in the federated context of the Data Mesh. We will provide models to design a security framework, with the related components to access the data and tools to run the policies. The models proposed, regulate the interactions between data consumers and data products. We will adopt Open Policy Agent (OPA) as the policy decision point (PDP) to test the policies that we will define.
SALNITRI, MATTIA
ING - Scuola di Ingegneria Industriale e dell'Informazione
18-lug-2023
2022/2023
Negli ultimi anni, i dati sono diventati sempre più eterogenei e di conseguenza le vecchie piattaforme di contenimento dei dati, monolitiche e centralizzate, come le data warehouses e i data lakes, hanno mostrato i loro limiti. Il nuovo paradigma dell’architettura dati del Data Mesh, introdotto da Zhamak Dehghani nel 2019, prova a superare questi limiti. Il concetto centrale del Data Mesh è considerare il dato come un prodotto. Ogni team di dominio, all’interno di un Data Mesh, è responsabile dei dati forniti e li rende disponibili ad altri team di dominio. Trattandosi di un argomento recente, lo stato dell’arte offre pochi articoli a riguardo e alcuni aspetti dovrebbero essere chiariti meglio. In questo lavoro di tesi, vogliamo indagare come sia possibile definire e gestire delle politiche di sicurezza per accedere ai dati, nel contesto federato del Data Mesh. Forniremo modelli per definire i componenti coinvolti nell’accesso dei dati e gli strumenti per eseguire le politiche. I modelli proposti regolano la relazione tra consumatori e dati. Adotteremo Open Policy Agent (OPA) come decisore di politiche (PDP) per testare le politiche che definiremo.
File allegati
File Dimensione Formato  
2023_07_Caronni.pdf

accessibile in internet per tutti

Descrizione: testo tesi Diego Caronni
Dimensione 934.09 kB
Formato Adobe PDF
934.09 kB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/209884