This thesis is about the exploration of “rich” datasets, where by “exploration” user sessions where the goal can vary from sense-making to deep understanding (rather than specific item search) and by “rich” datasets items characterized by a multi-faceted semantics are meant. The purpose of this work is to investigate how the notion of “relevance” can support deeper and more effective exploratory sessions. After a thorough literature review on fuzzy conceptual modeling (the mechanics of which is the closest to this work), different interpretations of the notion of relevance have been identified, leading to the “CPN (Characterization, Prevalence and Noteworthiness) model”, composed by data structures and abstract functions that can be instantiated to collect and measure relevance of items and attributes (treated as Fuzzy ones) using different relevance interpretations. The model has been tested against two real-life case studies: one is the dataset of the Museum of Musical Instruments at Castello Sforzesco, the other is a set of experiences’ reports collected within the frame of a national research project (EDOC), where the impact of technology on education has been surveyed. For the Museum case, 75 keyboard instruments have been analyzed, with a focus on the materials in the active and the passive parts of the instruments: over 2000 relevance values have been identified. For the EDOC case, 113 educational experiences have been analyzed, for 21 facet-values in 3 different relevance interpretations. Data from both case studies have been used in a simulated environment to test the capability of the model to support sense-making and understanding. Test results show how the several types of data readings from CPN-enhanced repositories can provide more accurate insights than the ones from data models where “object X has/doesn’t have attribute Y” only holds. This has also been confirmed by field experts that analyzed data provided by the redesigned database. Future works would focus on the aspect of the implementation of algorithms in exploratory portals and on the user interface, that should provide a non trivial mass of information to start and not disrupt the user dialog.

Questa tesi si colloca nell’ambito dell’esplorazione dei “rich datasets”, dove con esplorazione si intende una sessione utente in cui l’obiettivo spazia dall’intuire all’approfondire la conoscenza (piuttosto che specificatamente ricercare) e per “rich datasets” si intende una collezione di dati caratterizzati da una semantica multi-sfaccettata. L’obiettivo è indagare come la nozione di “rilevanza” supporti approfondite ed efficaci sessioni esplorative. Dopo un esteso studio sul Fuzzy Conceptual Modeling (le cui meccaniche assomigliano a quelle usate qui), sono state identificate diverse interpretazioni del concetto di rilevanza, che sono confluite nel modello “CPN (Characterization, Prevalence, Noteworthy)”, le cui strutture dati e funzioni astratte possono essere usate per raccogliere e misurare la rilevanza di oggetti e attributi (trattati come Fuzzy) secondo le diverse interpretazioni. Il modello è stato testato in due casi di studio reali: uno rappresentato dalla collezione del Museo degli Strumenti Musicali del Castello Sforzesco, l’altro dalle esperienze didattiche svolte nel progetto di ricerca nazionale EDOC, che ha analizzato l’impatto della tecnologia sull’educazione. Nel caso del Museo sono stati analizzati 75 strumenti a tastiera, considerando i materiali delle parti attive e passive dello strumento: oltre 2000 valori di rilevanza sono stati identificati. Per il caso EDOC sono state analizzate 113 esperienze, con 21 sfaccettature possibili in 3 differenti interpretazioni di rilevanza. I dati di entrambi i casi sono stati usati in simulazioni per verificare la capacità del modello di supportare l’esplorazione dei dati. I risultati mostrano come le letture dei dati supportati da CPN possano fornire informazioni più accurate rispetto a quelle ottenute da modelli dove un attributo Y può appartenere ad un oggetto X in maniera booleana. Le conferme arrivano da esperti del settore che hanno osservato i dati provenienti dai database riprogettati. I lavori futuri si concentreranno sull’implementazione degli algoritmi nei portali esplorativi e sull’interfaccia utente, che deve fornire una notevole quantità di dati per iniziare ed alimentare il dialogo con l’utente.

The notion of relevance : modeling for an exploratory approach

NESI, DARIO
2014/2015

Abstract

This thesis is about the exploration of “rich” datasets, where by “exploration” user sessions where the goal can vary from sense-making to deep understanding (rather than specific item search) and by “rich” datasets items characterized by a multi-faceted semantics are meant. The purpose of this work is to investigate how the notion of “relevance” can support deeper and more effective exploratory sessions. After a thorough literature review on fuzzy conceptual modeling (the mechanics of which is the closest to this work), different interpretations of the notion of relevance have been identified, leading to the “CPN (Characterization, Prevalence and Noteworthiness) model”, composed by data structures and abstract functions that can be instantiated to collect and measure relevance of items and attributes (treated as Fuzzy ones) using different relevance interpretations. The model has been tested against two real-life case studies: one is the dataset of the Museum of Musical Instruments at Castello Sforzesco, the other is a set of experiences’ reports collected within the frame of a national research project (EDOC), where the impact of technology on education has been surveyed. For the Museum case, 75 keyboard instruments have been analyzed, with a focus on the materials in the active and the passive parts of the instruments: over 2000 relevance values have been identified. For the EDOC case, 113 educational experiences have been analyzed, for 21 facet-values in 3 different relevance interpretations. Data from both case studies have been used in a simulated environment to test the capability of the model to support sense-making and understanding. Test results show how the several types of data readings from CPN-enhanced repositories can provide more accurate insights than the ones from data models where “object X has/doesn’t have attribute Y” only holds. This has also been confirmed by field experts that analyzed data provided by the redesigned database. Future works would focus on the aspect of the implementation of algorithms in exploratory portals and on the user interface, that should provide a non trivial mass of information to start and not disrupt the user dialog.
ING - Scuola di Ingegneria Industriale e dell'Informazione
18-dic-2015
2014/2015
Questa tesi si colloca nell’ambito dell’esplorazione dei “rich datasets”, dove con esplorazione si intende una sessione utente in cui l’obiettivo spazia dall’intuire all’approfondire la conoscenza (piuttosto che specificatamente ricercare) e per “rich datasets” si intende una collezione di dati caratterizzati da una semantica multi-sfaccettata. L’obiettivo è indagare come la nozione di “rilevanza” supporti approfondite ed efficaci sessioni esplorative. Dopo un esteso studio sul Fuzzy Conceptual Modeling (le cui meccaniche assomigliano a quelle usate qui), sono state identificate diverse interpretazioni del concetto di rilevanza, che sono confluite nel modello “CPN (Characterization, Prevalence, Noteworthy)”, le cui strutture dati e funzioni astratte possono essere usate per raccogliere e misurare la rilevanza di oggetti e attributi (trattati come Fuzzy) secondo le diverse interpretazioni. Il modello è stato testato in due casi di studio reali: uno rappresentato dalla collezione del Museo degli Strumenti Musicali del Castello Sforzesco, l’altro dalle esperienze didattiche svolte nel progetto di ricerca nazionale EDOC, che ha analizzato l’impatto della tecnologia sull’educazione. Nel caso del Museo sono stati analizzati 75 strumenti a tastiera, considerando i materiali delle parti attive e passive dello strumento: oltre 2000 valori di rilevanza sono stati identificati. Per il caso EDOC sono state analizzate 113 esperienze, con 21 sfaccettature possibili in 3 differenti interpretazioni di rilevanza. I dati di entrambi i casi sono stati usati in simulazioni per verificare la capacità del modello di supportare l’esplorazione dei dati. I risultati mostrano come le letture dei dati supportati da CPN possano fornire informazioni più accurate rispetto a quelle ottenute da modelli dove un attributo Y può appartenere ad un oggetto X in maniera booleana. Le conferme arrivano da esperti del settore che hanno osservato i dati provenienti dai database riprogettati. I lavori futuri si concentreranno sull’implementazione degli algoritmi nei portali esplorativi e sull’interfaccia utente, che deve fornire una notevole quantità di dati per iniziare ed alimentare il dialogo con l’utente.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Master thesis.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 5.47 MB
Formato Adobe PDF
5.47 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/114981