Similarity detection seeks to identify items which resemble other items without being identical to them, sometimes over relatively large collections of multivariate items. Oftentimes, similarity cannot be defined computationally over a dataset, leading to a need for visual analysis. Such situations arise commonly in the analysis of ensemble simulations, of multiple computational models, of patient data repositories, or of geospatial data. In this research, we examine, in the context of similarity detection, the effectiveness of several visual encodings for multivariate data. We conducted a user study with 40 participants to measure similarity detection accuracy and response time under two conditions: moderate-scale (16 items) and large-scale (36 items). Our analysis shows that there are significant differences in performance between encodings, especially as the number of items increases. In all settings, we found that plain parallel coordinate plots are slower to read and lead to lower accuracy than juxtaposed star glyph approaches. We further found that use of color-cues to encode similarity significantly improved users' response time, and decrease error as the number of items increased. Overall, and in contrast to existing guidelines, we found that filled contour star plots (Kiviat diagrams) outperformed other encodings in terms of scalability and error, and are therefore suitable for similarity identification when dealing with moderate multivariate datasets.
Lo scopo della Similarity detection è di identificare items che somigliano ad altri items senza però esserne identici, spesso in una una grande collezione di multivariate data points. A volte, la Similarity non può essere definita computazionalmente in un dataset, e questo comporta la necessità della visual analysis. Situazioni di questo tipo si trovano comunemente nell'analisi di ensemble simulations, modelli computazionali, dati di pazienti, o dati geospaziali. In questa ricerca, esaminiamo, nel contesto della Similarity detection, l'efficacia di diversi visual encodings per multivariate data. Abbiamo condotto uno user study con 40 partecipanti per misurare l'accuracy e tempo di risposta nei task di similarity detection in due condizioni: media scala (16 items) e grande scala (36 items). La nostra analisi mostra che ci sono differenze significative in performance tra encoding diversi, specialmente quando il numero di items aumenta. In entrambe le condizioni, abbiamo scoperto che i Parallel Coordinate Plots semplici sono più lenti da leggere e portano ad una minore accuracy rispetto agli approcci che utilizzano star glyphs giustapposti. Abbiamo inoltre scoperto che l'uso del colore per codificare similarità migliora significativamente il tempo di risposta e diminuisce l'errore quando gli items sono aumentati. Complessivamente, e in contrasto con linee guida esistenti, abbiamo scoperto che gli star plots con contorno pieno (Kiviat Diagrams) superano gli altri encodings in termini di scalabilità e errore, e sono quindi adatti per task di similarity detection nel contesto di multivariate datasets di modeste dimensioni.
Analysis of visual encodings effectiveness for multivariate data similarity identification
MANTOVANI, MIRKO
2018/2019
Abstract
Similarity detection seeks to identify items which resemble other items without being identical to them, sometimes over relatively large collections of multivariate items. Oftentimes, similarity cannot be defined computationally over a dataset, leading to a need for visual analysis. Such situations arise commonly in the analysis of ensemble simulations, of multiple computational models, of patient data repositories, or of geospatial data. In this research, we examine, in the context of similarity detection, the effectiveness of several visual encodings for multivariate data. We conducted a user study with 40 participants to measure similarity detection accuracy and response time under two conditions: moderate-scale (16 items) and large-scale (36 items). Our analysis shows that there are significant differences in performance between encodings, especially as the number of items increases. In all settings, we found that plain parallel coordinate plots are slower to read and lead to lower accuracy than juxtaposed star glyph approaches. We further found that use of color-cues to encode similarity significantly improved users' response time, and decrease error as the number of items increased. Overall, and in contrast to existing guidelines, we found that filled contour star plots (Kiviat diagrams) outperformed other encodings in terms of scalability and error, and are therefore suitable for similarity identification when dealing with moderate multivariate datasets.File | Dimensione | Formato | |
---|---|---|---|
2020_04_Mantovani.pdf
accessibile in internet solo dagli utenti autorizzati
Descrizione: Testo della tesi
Dimensione
12.36 MB
Formato
Adobe PDF
|
12.36 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/154186