Knowledge graphs are an essential ingredient of modern information systems; they enable semantic search and are widely used both in the scientific world and by large companies, such as Google and Amazon. Graph databases are emerging as leading technology for supporting knowledge graphs; however, they currently lack semantic support; at most, their nodes and edges can include simple properties, yielding to so-called property graphs. The scientific community is proposing the addition of schemas and keys to property graphs. This thesis makes another step in this direction, and proposed adding reactive rules to property graphs. Reactive Knowledge Rules follow a classical event-condition-action paradigm. While events are simple (node creations and deletions), this thesis introduces two new concepts, Guard and Alert, for expressing the condition and action parts of knowledge rule. The Guard detects knowledge contexts that require further investigation. The Alert globally considers the context; when it reveals a critical condition that may require further analysis, it produces a new node, also labeled Alert, carrying enough information extracted from the knowledge graph to enable a knowledge modification action. Such action is outside the scope of the thesis. We also assume that knowledge graphs are partitioned into knowledge hubs, each managed by a different scientific community. The graph includes edges between knowledge hubs, that allow bridging knowledge; in addition, alerts nodes may contain information that bridge different knowledge hubs. Finally, the thesis considers how notions of new and old state, which are classical aspects of database triggers, can be supported in the context of knowledge rules. The thesis is built bottom-up, from a concrete example, monitoring of the spreading of the COVID-19 virus over a geographical region. It also includes a proof-of-concept, implemented upon the Neo4j system and query language Cypher. Many functions need to be implemented outside of Cypher, as part of the APOC library. The results of this thesis can therefore be considered as a starting point for a new research, with many aspects that deserve further investigation.

I grafi di conoscenza sono un ingrediente essenziale dei moderni sistemi informativi; consentono la ricerca semantica e sono ampiamente utilizzati sia nel mondo scientifico che dalle grandi aziende, come Google e Amazon. I database a grafo stanno emergendo come tecnologia leader per supportare i grafi di conoscenza; tuttavia, attualmente mancano di supporto semantico; al massimo, i loro nodi e archi possono includere proprietà semplici, dando luogo ai cosiddetti grafi di proprietà. La comunità scientifica sta proponendo l'aggiunta di schemi e chiavi ai grafi di proprietà. Questa tesi fa un altro passo in questa direzione e propone l'aggiunta di regole reattive ai grafi di proprietà. Le Regole di Conoscenza Reattiva seguono un paradigma classico evento-condizione-azione. Mentre gli eventi sono semplici (creazione e cancellazione di nodi), questa tesi introduce due nuovi concetti, Guard e Alert, per esprimere le parti di condizione e azione della regola di conoscenza. La Guard rileva i contesti di conoscenza che richiedono ulteriori indagini. L'Alert considera globalmente il contesto; quando rileva una condizione critica che potrebbe richiedere ulteriori analisi, produce un nuovo nodo, anch'esso etichettato Alert, che porta sufficienti informazioni estratte dal grafo di conoscenza per consentire un'azione di modifica della conoscenza. Tale azione è al di fuori del campo di questa tesi. Assumiamo inoltre che i grafi di conoscenza possano essere suddivisi in hub di conoscenza, ognuno gestito da una diversa comunità scientifica. Il grafo include archi tra gli hub di conoscenza, che consentono di collegare la conoscenza; inoltre, i nodi Alert possono contenere informazioni che collegano diversi hub di conoscenza. Infine, la tesi considera come le nozioni di stato nuovo e vecchio, che sono aspetti classici dei trigger del database, possano essere supportate nel contesto delle regole di conoscenza. La tesi è costruita dal basso verso l'alto, partendo da un esempio concreto, il monitoraggio della diffusione del virus COVID-19 su una regione geografica. Include anche una prova di fattibilità, implementata sul sistema Neo4j e sul linguaggio di interrogazione Cypher. Molte funzioni devono essere implementate al di fuori di Cypher, come parte della libreria APOC. I risultati di questa tesi possono quindi essere considerati come un punto di partenza per una nuova ricerca, con molti aspetti che meritano ulteriori indagini.

Building reactive processing rules for knowledge graphs

Gagliardi, Alessia
2021/2022

Abstract

Knowledge graphs are an essential ingredient of modern information systems; they enable semantic search and are widely used both in the scientific world and by large companies, such as Google and Amazon. Graph databases are emerging as leading technology for supporting knowledge graphs; however, they currently lack semantic support; at most, their nodes and edges can include simple properties, yielding to so-called property graphs. The scientific community is proposing the addition of schemas and keys to property graphs. This thesis makes another step in this direction, and proposed adding reactive rules to property graphs. Reactive Knowledge Rules follow a classical event-condition-action paradigm. While events are simple (node creations and deletions), this thesis introduces two new concepts, Guard and Alert, for expressing the condition and action parts of knowledge rule. The Guard detects knowledge contexts that require further investigation. The Alert globally considers the context; when it reveals a critical condition that may require further analysis, it produces a new node, also labeled Alert, carrying enough information extracted from the knowledge graph to enable a knowledge modification action. Such action is outside the scope of the thesis. We also assume that knowledge graphs are partitioned into knowledge hubs, each managed by a different scientific community. The graph includes edges between knowledge hubs, that allow bridging knowledge; in addition, alerts nodes may contain information that bridge different knowledge hubs. Finally, the thesis considers how notions of new and old state, which are classical aspects of database triggers, can be supported in the context of knowledge rules. The thesis is built bottom-up, from a concrete example, monitoring of the spreading of the COVID-19 virus over a geographical region. It also includes a proof-of-concept, implemented upon the Neo4j system and query language Cypher. Many functions need to be implemented outside of Cypher, as part of the APOC library. The results of this thesis can therefore be considered as a starting point for a new research, with many aspects that deserve further investigation.
BERNASCONI, ANNA
ING - Scuola di Ingegneria Industriale e dell'Informazione
4-mag-2023
2021/2022
I grafi di conoscenza sono un ingrediente essenziale dei moderni sistemi informativi; consentono la ricerca semantica e sono ampiamente utilizzati sia nel mondo scientifico che dalle grandi aziende, come Google e Amazon. I database a grafo stanno emergendo come tecnologia leader per supportare i grafi di conoscenza; tuttavia, attualmente mancano di supporto semantico; al massimo, i loro nodi e archi possono includere proprietà semplici, dando luogo ai cosiddetti grafi di proprietà. La comunità scientifica sta proponendo l'aggiunta di schemi e chiavi ai grafi di proprietà. Questa tesi fa un altro passo in questa direzione e propone l'aggiunta di regole reattive ai grafi di proprietà. Le Regole di Conoscenza Reattiva seguono un paradigma classico evento-condizione-azione. Mentre gli eventi sono semplici (creazione e cancellazione di nodi), questa tesi introduce due nuovi concetti, Guard e Alert, per esprimere le parti di condizione e azione della regola di conoscenza. La Guard rileva i contesti di conoscenza che richiedono ulteriori indagini. L'Alert considera globalmente il contesto; quando rileva una condizione critica che potrebbe richiedere ulteriori analisi, produce un nuovo nodo, anch'esso etichettato Alert, che porta sufficienti informazioni estratte dal grafo di conoscenza per consentire un'azione di modifica della conoscenza. Tale azione è al di fuori del campo di questa tesi. Assumiamo inoltre che i grafi di conoscenza possano essere suddivisi in hub di conoscenza, ognuno gestito da una diversa comunità scientifica. Il grafo include archi tra gli hub di conoscenza, che consentono di collegare la conoscenza; inoltre, i nodi Alert possono contenere informazioni che collegano diversi hub di conoscenza. Infine, la tesi considera come le nozioni di stato nuovo e vecchio, che sono aspetti classici dei trigger del database, possano essere supportate nel contesto delle regole di conoscenza. La tesi è costruita dal basso verso l'alto, partendo da un esempio concreto, il monitoraggio della diffusione del virus COVID-19 su una regione geografica. Include anche una prova di fattibilità, implementata sul sistema Neo4j e sul linguaggio di interrogazione Cypher. Molte funzioni devono essere implementate al di fuori di Cypher, come parte della libreria APOC. I risultati di questa tesi possono quindi essere considerati come un punto di partenza per una nuova ricerca, con molti aspetti che meritano ulteriori indagini.
File allegati
File Dimensione Formato  
Executive_Summary.pdf

Open Access dal 17/04/2024

Descrizione: Executive Summary
Dimensione 481.02 kB
Formato Adobe PDF
481.02 kB Adobe PDF Visualizza/Apri
Reactive_Knowledge_Graphs.pdf

Open Access dal 17/04/2024

Descrizione: Tesi
Dimensione 14.24 MB
Formato Adobe PDF
14.24 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/204513