This project is an implementation of an ETL pipeline using semantic technologies. The goal is to demonstrate how an enterprise can adopt these technologies within their current data architecture without shifting to specific semantic based architectures. This demonstration was achieved by means of three typical business use cases. The conclusions from a technical standpoint are that the Open World Assumption in OWL inference is a limitation to implement certain use cases and that OWL inference is hard to debug, an important aspect for technology adoption in companies. On the non-technical side, the conclusions are that semantic technologies are not yet a mainstream technology, lacking experienced experts and more mature open source projects.

Questo progetto propone un'implementazione di una pipeline ETL che utilizza tecnologie semantiche. L'obiettivo è dimostrare come un'azienda può adottare queste tecnologie all'interno della propria architettura dati attuale senza passare a specifiche architetture basate sulla semantica. Questa dimostrazione è stata ottenuta mediante tre casi d'uso aziendali tipici. Le conclusioni da un punto di vista tecnico sono che l'ipotesi del mondo aperto nell'inferenza OWL è una limitazione all’implementazione di determinati casi d'uso e che è difficile da eseguire il debug delle inferenze OWL , un aspetto importante per l'adozione della tecnologia nelle aziende. Da un punto di vista più generale, le conclusioni sono che le tecnologie semantiche non costituiscono ancora una tecnologia mainstream, dato che c’è carenza di esperti e di progetti open source più maturi.

Semantic ETL. An extract, transform, load pipeline implementation using semantic technologies

SCHEJTMAN, NICOLAS
2020/2021

Abstract

This project is an implementation of an ETL pipeline using semantic technologies. The goal is to demonstrate how an enterprise can adopt these technologies within their current data architecture without shifting to specific semantic based architectures. This demonstration was achieved by means of three typical business use cases. The conclusions from a technical standpoint are that the Open World Assumption in OWL inference is a limitation to implement certain use cases and that OWL inference is hard to debug, an important aspect for technology adoption in companies. On the non-technical side, the conclusions are that semantic technologies are not yet a mainstream technology, lacking experienced experts and more mature open source projects.
ING - Scuola di Ingegneria Industriale e dell'Informazione
7-ott-2021
2020/2021
Questo progetto propone un'implementazione di una pipeline ETL che utilizza tecnologie semantiche. L'obiettivo è dimostrare come un'azienda può adottare queste tecnologie all'interno della propria architettura dati attuale senza passare a specifiche architetture basate sulla semantica. Questa dimostrazione è stata ottenuta mediante tre casi d'uso aziendali tipici. Le conclusioni da un punto di vista tecnico sono che l'ipotesi del mondo aperto nell'inferenza OWL è una limitazione all’implementazione di determinati casi d'uso e che è difficile da eseguire il debug delle inferenze OWL , un aspetto importante per l'adozione della tecnologia nelle aziende. Da un punto di vista più generale, le conclusioni sono che le tecnologie semantiche non costituiscono ancora una tecnologia mainstream, dato che c’è carenza di esperti e di progetti open source più maturi.
File allegati
File Dimensione Formato  
thesis_nicolas_schejtman.pdf

accessibile in internet per tutti

Descrizione: Full thesis file
Dimensione 751.27 kB
Formato Adobe PDF
751.27 kB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/179434