Measuring and enhancing linear top-k queries' ability to discover the skyline

Biblioteche e Archivi
POLITesi - Archivio digitale delle tesi di laurea e di dottorato

Linear top-k queries are the most commonly implemented type of ranking query, being fast to execute and able to suit the user's needs. Despite its advantages, this approach to multi-objective optimization isn't always optimal, often failing to highlight some relevant records present inside the collection that is being searched. These records can instead be identified by skyline queries, which are optimal but also slow and unpractical. In this thesis, the ability of linear top-k queries of discovering optimal solutions will be analyzed, first using appropriate metrics and indicators on real data and then through a more rigorous, theoretical methodology. Later on, an original query, the Var-k query, will be proposed. Expanding the common formulation of top-k to take into account the variance of tuples, var-k will be shown able to retrieve any potentially optimal point while retaining the properties that made top-k so widespread in the field.

Le query top-k lineari sono il più tipo di ranking query più comunemente implementato, essendo sia veloci da eseguire che capaci di soddisfare i bisogni dell'utente. Nonostante i suoi vantaggi, questo approccio alla ottimizzazione multi-obiettivo non è sempre ottimale, fallendo spesso nell'evidenziare tuple interessanti presenti all'interno della base di dati che sta venendo analizzata. Queste tuple posso essere identificate da un'altro tipo di query, le skyline query, che sono però lente e poco funzionali. In questa tesi, la capacità delle query top-k lineari nell'individuare tuple ottimali verrà analizzata, dapprima mediante appropriate metriche e indicatori calcolati su dati reali e poi attraverso un approccio teorico più rigoroso. Dopodichè, un nuovo tipo di query, la query Var-k, verrà proposta. Questa espande la comune formulazione delle query top-k prendendo in considerazione la varianza delle tuple e verrà dimostrato come sia capace di recuperare ogni punto potenzialmente ottimale pur mantenendo le proprietà che hanno reso le query top-k così largamente utilizzate in questo campo.

Measuring and enhancing linear top-k queries' ability to discover the skyline

SOMASCHINI, MARCO

2021/2022

Abstract

Linear top-k queries are the most commonly implemented type of ranking query, being fast to execute and able to suit the user's needs. Despite its advantages, this approach to multi-objective optimization isn't always optimal, often failing to highlight some relevant records present inside the collection that is being searched. These records can instead be identified by skyline queries, which are optimal but also slow and unpractical. In this thesis, the ability of linear top-k queries of discovering optimal solutions will be analyzed, first using appropriate metrics and indicators on real data and then through a more rigorous, theoretical methodology. Later on, an original query, the Var-k query, will be proposed. Expanding the common formulation of top-k to take into account the variance of tuples, var-k will be shown able to retrieve any potentially optimal point while retaining the properties that made top-k so widespread in the field.

Scheda breve

Scheda completa

	Relatore
	
				MARTINENGHI, DAVIDE
			
	Correlatore/i
	
				CIACCIA, PAOLO
			
	Scuola / Dip.
	
				ING  - Scuola di Ingegneria Industriale e dell'Informazione
			
	Data
	
				20-dic-2022
			
	Anno accademico
	
				2021/2022
			
	Abstract in italiano
	
				Le query top-k lineari sono il più tipo di ranking query più comunemente implementato, essendo sia veloci da eseguire che capaci di soddisfare i bisogni dell'utente. Nonostante i suoi vantaggi, questo approccio alla ottimizzazione multi-obiettivo non è sempre ottimale, fallendo spesso nell'evidenziare tuple interessanti presenti all'interno della base di dati che sta venendo analizzata. Queste tuple posso essere identificate da un'altro tipo di query, le skyline query, che sono però lente e poco funzionali. In questa tesi, la capacità delle query top-k lineari nell'individuare tuple ottimali verrà analizzata, dapprima mediante appropriate metriche e indicatori calcolati su dati reali e poi attraverso un approccio teorico più rigoroso. Dopodichè, un nuovo tipo di query, la query Var-k, verrà proposta. Questa espande la comune formulazione delle query top-k prendendo in considerazione la varianza delle tuple e verrà dimostrato come sia capace di recuperare ogni punto potenzialmente ottimale pur mantenendo le proprietà che hanno reso le query top-k così largamente utilizzate in questo campo.
			
	Appare nelle tipologie:
	
				Tesi di laurea Magistrale

File allegati

File	Dimensione	Formato
Executive_Summary.pdf solo utenti autorizzati dal 03/12/2023 Descrizione: Sommario Dimensione 381.86 kB Formato Adobe PDF Visualizza/Apri	381.86 kB	Adobe PDF	Visualizza/Apri
Thesis.pdf solo utenti autorizzati dal 03/12/2023 Descrizione: Tesi Dimensione 4.89 MB Formato Adobe PDF Visualizza/Apri	4.89 MB	Adobe PDF	Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/198174