Linear top-k queries are the most commonly implemented type of ranking query, being fast to execute and able to suit the user's needs. Despite its advantages, this approach to multi-objective optimization isn't always optimal, often failing to highlight some relevant records present inside the collection that is being searched. These records can instead be identified by skyline queries, which are optimal but also slow and unpractical. In this thesis, the ability of linear top-k queries of discovering optimal solutions will be analyzed, first using appropriate metrics and indicators on real data and then through a more rigorous, theoretical methodology. Later on, an original query, the Var-k query, will be proposed. Expanding the common formulation of top-k to take into account the variance of tuples, var-k will be shown able to retrieve any potentially optimal point while retaining the properties that made top-k so widespread in the field.

Le query top-k lineari sono il più tipo di ranking query più comunemente implementato, essendo sia veloci da eseguire che capaci di soddisfare i bisogni dell'utente. Nonostante i suoi vantaggi, questo approccio alla ottimizzazione multi-obiettivo non è sempre ottimale, fallendo spesso nell'evidenziare tuple interessanti presenti all'interno della base di dati che sta venendo analizzata. Queste tuple posso essere identificate da un'altro tipo di query, le skyline query, che sono però lente e poco funzionali. In questa tesi, la capacità delle query top-k lineari nell'individuare tuple ottimali verrà analizzata, dapprima mediante appropriate metriche e indicatori calcolati su dati reali e poi attraverso un approccio teorico più rigoroso. Dopodichè, un nuovo tipo di query, la query Var-k, verrà proposta. Questa espande la comune formulazione delle query top-k prendendo in considerazione la varianza delle tuple e verrà dimostrato come sia capace di recuperare ogni punto potenzialmente ottimale pur mantenendo le proprietà che hanno reso le query top-k così largamente utilizzate in questo campo.

Measuring and enhancing linear top-k queries' ability to discover the skyline

SOMASCHINI, MARCO
2021/2022

Abstract

Linear top-k queries are the most commonly implemented type of ranking query, being fast to execute and able to suit the user's needs. Despite its advantages, this approach to multi-objective optimization isn't always optimal, often failing to highlight some relevant records present inside the collection that is being searched. These records can instead be identified by skyline queries, which are optimal but also slow and unpractical. In this thesis, the ability of linear top-k queries of discovering optimal solutions will be analyzed, first using appropriate metrics and indicators on real data and then through a more rigorous, theoretical methodology. Later on, an original query, the Var-k query, will be proposed. Expanding the common formulation of top-k to take into account the variance of tuples, var-k will be shown able to retrieve any potentially optimal point while retaining the properties that made top-k so widespread in the field.
CIACCIA, PAOLO
ING - Scuola di Ingegneria Industriale e dell'Informazione
20-dic-2022
2021/2022
Le query top-k lineari sono il più tipo di ranking query più comunemente implementato, essendo sia veloci da eseguire che capaci di soddisfare i bisogni dell'utente. Nonostante i suoi vantaggi, questo approccio alla ottimizzazione multi-obiettivo non è sempre ottimale, fallendo spesso nell'evidenziare tuple interessanti presenti all'interno della base di dati che sta venendo analizzata. Queste tuple posso essere identificate da un'altro tipo di query, le skyline query, che sono però lente e poco funzionali. In questa tesi, la capacità delle query top-k lineari nell'individuare tuple ottimali verrà analizzata, dapprima mediante appropriate metriche e indicatori calcolati su dati reali e poi attraverso un approccio teorico più rigoroso. Dopodichè, un nuovo tipo di query, la query Var-k, verrà proposta. Questa espande la comune formulazione delle query top-k prendendo in considerazione la varianza delle tuple e verrà dimostrato come sia capace di recuperare ogni punto potenzialmente ottimale pur mantenendo le proprietà che hanno reso le query top-k così largamente utilizzate in questo campo.
File allegati
File Dimensione Formato  
Executive_Summary.pdf

solo utenti autorizzati dal 03/12/2023

Descrizione: Sommario
Dimensione 381.86 kB
Formato Adobe PDF
381.86 kB Adobe PDF   Visualizza/Apri
Thesis.pdf

solo utenti autorizzati dal 03/12/2023

Descrizione: Tesi
Dimensione 4.89 MB
Formato Adobe PDF
4.89 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/198174