This paper aims to show that there are certain points in the skyline that cannot be found using a top-1 linear function but are interesting to consider from a human standpoint. The skyline represents the set of points that are not dominated by any other point in the dataset. A data point say A is said to dominate another data point B if A is not worse than B on all the attributes and A is strictly better than B in at least one of the attributes. The set of points not dominated forms the skyline of a dataset. The main objective here is to find those skyline points that provide a good choice from the user’s perspective and to show that such points exist in the skyline. In order to prove that such points exist, the skyline of the dataset is calculated using the Block Nested Loop Algorithm. New indicators – Grid Strength, Increase in Domination Volume, Concavity Index and Maxrank are being introduced. These indicators are calculated for the skyline points present in several datasets. We make conclusions on the nature of the skyline points based on the values of the above indicators. In addition to the various experiments, we deduce the possible relationship between the different indicators and find a correlation between them that would help further explain the nature of the skyline points. Datasets of varying dimensions and size are analyzed. Through our experiments and the results obtained we try to find these interesting points and pave way for a deeper investigation of these skyline points in the dataset. Key-words: Grid Strength, Domination Volume, Maxrank, Concavity Index

Questo articolo mira a mostrare che ci sono alcuni punti dello skyline che non possono essere trovati utilizzando una funzione lineare top-1, ma sono interessanti da considerare dal punto di vista umano. Lo skyline rappresenta l'insieme di punti che non sono dominati da nessun altro punto nel set di dati. Si dice che un punto dati dica che A domini un altro punto dati B se A non è peggiore di B su tutti gli attributi e A è rigorosamente migliore di B in almeno uno degli attributi. L'insieme dei punti non dominati forma lo skyline di un dataset. L'obiettivo principale qui è trovare quei punti dello skyline che forniscono una buona scelta dal punto di vista dell'utente e mostrare che tali punti esistono nello skyline. Per dimostrare che tali punti esistono, lo skyline del set di dati viene calcolato utilizzando l'algoritmo Block Nested Loop. Nuovi indicatori: vengono introdotti la forza della griglia, l'aumento del volume di dominazione, l'indice di concavità e il rango massimo. Questi indicatori sono calcolati per i punti dello skyline presenti in diversi dataset. Traiamo conclusioni sulla natura dei punti dello skyline in base ai valori degli indicatori di cui sopra. Oltre ai vari esperimenti, deduciamo la possibile relazione tra i diversi indicatori e troviamo una correlazione tra loro che aiuterebbe a spiegare ulteriormente la natura dei punti dello skyline. Vengono analizzati set di dati di dimensioni e dimensioni variabili. Attraverso i nostri esperimenti e i risultati ottenuti cerchiamo di trovare questi punti interessanti e di aprire la strada a un'indagine più approfondita di questi punti dello skyline nel set di dati. Parole chiave: Forza della griglia, Volume di dominazione, Maxrank, Indice di concavità

Characterizing skyline points through Indicators

Viraktamath, Nitish Kashinath
2021/2022

Abstract

This paper aims to show that there are certain points in the skyline that cannot be found using a top-1 linear function but are interesting to consider from a human standpoint. The skyline represents the set of points that are not dominated by any other point in the dataset. A data point say A is said to dominate another data point B if A is not worse than B on all the attributes and A is strictly better than B in at least one of the attributes. The set of points not dominated forms the skyline of a dataset. The main objective here is to find those skyline points that provide a good choice from the user’s perspective and to show that such points exist in the skyline. In order to prove that such points exist, the skyline of the dataset is calculated using the Block Nested Loop Algorithm. New indicators – Grid Strength, Increase in Domination Volume, Concavity Index and Maxrank are being introduced. These indicators are calculated for the skyline points present in several datasets. We make conclusions on the nature of the skyline points based on the values of the above indicators. In addition to the various experiments, we deduce the possible relationship between the different indicators and find a correlation between them that would help further explain the nature of the skyline points. Datasets of varying dimensions and size are analyzed. Through our experiments and the results obtained we try to find these interesting points and pave way for a deeper investigation of these skyline points in the dataset. Key-words: Grid Strength, Domination Volume, Maxrank, Concavity Index
ING - Scuola di Ingegneria Industriale e dell'Informazione
6-ott-2022
2021/2022
Questo articolo mira a mostrare che ci sono alcuni punti dello skyline che non possono essere trovati utilizzando una funzione lineare top-1, ma sono interessanti da considerare dal punto di vista umano. Lo skyline rappresenta l'insieme di punti che non sono dominati da nessun altro punto nel set di dati. Si dice che un punto dati dica che A domini un altro punto dati B se A non è peggiore di B su tutti gli attributi e A è rigorosamente migliore di B in almeno uno degli attributi. L'insieme dei punti non dominati forma lo skyline di un dataset. L'obiettivo principale qui è trovare quei punti dello skyline che forniscono una buona scelta dal punto di vista dell'utente e mostrare che tali punti esistono nello skyline. Per dimostrare che tali punti esistono, lo skyline del set di dati viene calcolato utilizzando l'algoritmo Block Nested Loop. Nuovi indicatori: vengono introdotti la forza della griglia, l'aumento del volume di dominazione, l'indice di concavità e il rango massimo. Questi indicatori sono calcolati per i punti dello skyline presenti in diversi dataset. Traiamo conclusioni sulla natura dei punti dello skyline in base ai valori degli indicatori di cui sopra. Oltre ai vari esperimenti, deduciamo la possibile relazione tra i diversi indicatori e troviamo una correlazione tra loro che aiuterebbe a spiegare ulteriormente la natura dei punti dello skyline. Vengono analizzati set di dati di dimensioni e dimensioni variabili. Attraverso i nostri esperimenti e i risultati ottenuti cerchiamo di trovare questi punti interessanti e di aprire la strada a un'indagine più approfondita di questi punti dello skyline nel set di dati. Parole chiave: Forza della griglia, Volume di dominazione, Maxrank, Indice di concavità
File allegati
File Dimensione Formato  
Skyline Queries (6)_removed.pdf

accessibile in internet per tutti

Dimensione 2.16 MB
Formato Adobe PDF
2.16 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/195036