Data integration is a research branch that was born together with the database theory and the first data storage systems. In this research branch, actually open and always in evolution, one of the most recently proposed data integration methods is the use of domain and context ontologies mediated integration methods mediated through domain - and context - ontologies, which represents our research field. The ultimate purpose of this thesis work is to complete the Context- ADDICT platform with an algorithm able to distribute all the queries pro- duced by the already existing rewriting engine in order to execute them over multiple data-sources. All the algorithms that we are going to expose in this thesis have the purpose of distributing queries to datasources and integrate the resultset that they give back to the system, in order to give, in the shortest time possible, the best achievable results to the final user, who issued the original query to the system. In the whole process the properties of soundness and completeness of the process must be guaranteed.

L’integrazione dei dati ́e un settore di ricerca presente sin dalla nascita dei primi sistemi per lo storage dei dati, agli albori della teoria delle basi di dati. In questa branca di ricerca, tutt’ora aperta ed in evoluzione, una delle ultime innovazioni proposte ́e l’integrazione dei dati mediata da ontologie di dominio e di contesto, che rappresentano l’ambiente in cui ́e nata e si sviluppa la nostra ricerca. Scopo di questo lavoro di tesi ́e stato quello di completare la piattaforma Context-ADDICT con un algoritmo in grado di distribuire le varie query prodotte dal modulo di riscrittura (gia ́ implementato in un precedente lavoro) in modo da renderne possibile l’esecuzione sulle varie sorgenti di dati, cosa che al momento non era possibile fare. Gli algoritmi che verranno presentati si occupano quindi in sostanza della distribuzione delle query sulle varie sorgenti e dell’integrazione dei risultati ricevuti da esse, in modo da fornire, nel piu ́ ristretto tempo possibile, i miglio- ri risultati possibili all’utente che aveva composto l’interrogazione iniziale al sistema, mantenendo durante tutto il processo la correttezza e la completezza dell’insieme di query che andranno distribuite sulle sorgenti.

A query distribution algorithm for the context-addict system

PANIGATI, EMANUELE
2009/2010

Abstract

Data integration is a research branch that was born together with the database theory and the first data storage systems. In this research branch, actually open and always in evolution, one of the most recently proposed data integration methods is the use of domain and context ontologies mediated integration methods mediated through domain - and context - ontologies, which represents our research field. The ultimate purpose of this thesis work is to complete the Context- ADDICT platform with an algorithm able to distribute all the queries pro- duced by the already existing rewriting engine in order to execute them over multiple data-sources. All the algorithms that we are going to expose in this thesis have the purpose of distributing queries to datasources and integrate the resultset that they give back to the system, in order to give, in the shortest time possible, the best achievable results to the final user, who issued the original query to the system. In the whole process the properties of soundness and completeness of the process must be guaranteed.
ORSI, GIORGIO
ING V - Facolta' di Ingegneria dell'Informazione
22-ott-2010
2009/2010
L’integrazione dei dati ́e un settore di ricerca presente sin dalla nascita dei primi sistemi per lo storage dei dati, agli albori della teoria delle basi di dati. In questa branca di ricerca, tutt’ora aperta ed in evoluzione, una delle ultime innovazioni proposte ́e l’integrazione dei dati mediata da ontologie di dominio e di contesto, che rappresentano l’ambiente in cui ́e nata e si sviluppa la nostra ricerca. Scopo di questo lavoro di tesi ́e stato quello di completare la piattaforma Context-ADDICT con un algoritmo in grado di distribuire le varie query prodotte dal modulo di riscrittura (gia ́ implementato in un precedente lavoro) in modo da renderne possibile l’esecuzione sulle varie sorgenti di dati, cosa che al momento non era possibile fare. Gli algoritmi che verranno presentati si occupano quindi in sostanza della distribuzione delle query sulle varie sorgenti e dell’integrazione dei risultati ricevuti da esse, in modo da fornire, nel piu ́ ristretto tempo possibile, i miglio- ri risultati possibili all’utente che aveva composto l’interrogazione iniziale al sistema, mantenendo durante tutto il processo la correttezza e la completezza dell’insieme di query che andranno distribuite sulle sorgenti.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2010_10_Panigati.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 2.51 MB
Formato Adobe PDF
2.51 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/5641