The ample accessibility to large amounts of data has already exceeded the human ability for comprehension without data analysis tools. As a result of the natural evolution of information technology, the need for turning such data into useful information and knowledge arises. The concept of relevance constitutes the key point in the purpose of retrieving data that is truly useful to the user, reducing as much as possible the retrieval of information noise. Considering the impact of contexts in the decision making process and the interdependence between those and the relative importance of the information to the user, a methodology, and a system, called PREMINE has previously been proposed in a research performed at the Department of Electronics and Information of the Politecnico di Milano. It uses data mining to infer contextual preferences from former user querying activity, generating a personalized tailored view of the database the user is interacting with. Given the difficulties to obtain information regarding user interactions with a certain application, especially those relating contexts, the first purpose of this project was to provide a valid user log to allow tests on PREMINE. A dataset, containing real user interaction activity including context information, was gathered using the contents of a relational database holding information about films. After considering different strategies to achieve this goal, a web application was design and implemented to offer users the easiest and most adequate way to access data and express their preferences about movies in different contexts. All querying and selecting user activity was recorded appropriately in five different logs, which support the mining procedures described by PREMINE to infer contextual preferences and implement the data tailoring according to them. Once the logs are successfully created, a study of the problem of contextual view personalization in the case of new users entering the system is performed. After researching a variety of methodologies used in different scenarios to solve related problems, such as the cold-start problem in recommender systems, a suitable approach is proposed to overcome this problem within the existent system.

L’ampia accessibilità a grandi quantità di dati ha già superato la capacità umana di comprensione, senza l’ausilio di strumenti di analisi dei dati. Come risultato dell’evoluzione naturale della tecnologia dell’informazione, si presenta la necessità di trasformare tali dati in informazioni utili per l’utente. Il concetto di rilevanza costituisce il punto chiave ai fini del recupero di dati che siano veramente utili all'utente, riducendo il piú possibile la quantità di rumore presente assieme all’informazione interessante. Considerando l’impatto della nozione di contesto nel processo decisionale e la interdipendenza tra questi e l'importanza relativa dell’informazione per l’utente, una metodologia e un sistema, chiamato PREMINE è stato proposto in un progetto di ricerca sviluppato presso il Dipartimento di Elettronica e Informazione. Esso utilizza il data mining per inferire preferenze contestuali dalla storia delle attività degli utenti con i dati e in particolare, dai risultati di interrogazioni precedenti, generando una vista contestuale e personalizzata della base di dati con cui l'utente interagisce. Data la difficoltà nell’ottenere informazioni sulle interazioni degli utente con una certa applicazione, in particolare quelli relativi ai contesti, il primo scopo di questo progetto è stato quello di fornire un log di utente valido che consentisse prove per dimostrare l’efficacia di PREMINE. Un set di dati, contenenti vera e propria attività di interazione, tra cui informazioni di contesto, è stato raccolto utilizzando una base di dati relazionale contenente informazioni su film. Dopo aver esaminato diverse strategie per raggiungere questo obiettivo, è stata progettata e implementata un’applicazione web per offrire agli utenti il modo più semplice e adeguato di accedere ai dati ed esprimere le loro preferenze su i film in diversi contesti. Tutte le attività di interrogazione e selezione degli utenti sono state registrate in modo adeguato in cinque diversi registri, che supportano le procedure di data mining descritte da PREMINE per inferire le preferenze contestuale e applicare il rispettivo data tailoring. Una volta che i log sono stati creati con successo, viene eseguito uno studio del problema di creazione della vista contestuale personalizzata nel caso di nuovi utenti che entrano nel sistema. Dopo aver analizzato una varietà di metodologie utilizzate in diversi scenari per risolvere problemi correlati, come il problema di cold-start in sistemi di raccomandazione, si propone un approccio adeguato per affrontare questo problema nel sistema esistente.

Mining contextual preferences : a case study for PREMINE

MOLINA VARGAS, DALIA LORENA
2010/2011

Abstract

The ample accessibility to large amounts of data has already exceeded the human ability for comprehension without data analysis tools. As a result of the natural evolution of information technology, the need for turning such data into useful information and knowledge arises. The concept of relevance constitutes the key point in the purpose of retrieving data that is truly useful to the user, reducing as much as possible the retrieval of information noise. Considering the impact of contexts in the decision making process and the interdependence between those and the relative importance of the information to the user, a methodology, and a system, called PREMINE has previously been proposed in a research performed at the Department of Electronics and Information of the Politecnico di Milano. It uses data mining to infer contextual preferences from former user querying activity, generating a personalized tailored view of the database the user is interacting with. Given the difficulties to obtain information regarding user interactions with a certain application, especially those relating contexts, the first purpose of this project was to provide a valid user log to allow tests on PREMINE. A dataset, containing real user interaction activity including context information, was gathered using the contents of a relational database holding information about films. After considering different strategies to achieve this goal, a web application was design and implemented to offer users the easiest and most adequate way to access data and express their preferences about movies in different contexts. All querying and selecting user activity was recorded appropriately in five different logs, which support the mining procedures described by PREMINE to infer contextual preferences and implement the data tailoring according to them. Once the logs are successfully created, a study of the problem of contextual view personalization in the case of new users entering the system is performed. After researching a variety of methodologies used in different scenarios to solve related problems, such as the cold-start problem in recommender systems, a suitable approach is proposed to overcome this problem within the existent system.
RABOSIO, EMANUELE
ING V - Facolta' di Ingegneria dell'Informazione
31-mar-2011
2010/2011
L’ampia accessibilità a grandi quantità di dati ha già superato la capacità umana di comprensione, senza l’ausilio di strumenti di analisi dei dati. Come risultato dell’evoluzione naturale della tecnologia dell’informazione, si presenta la necessità di trasformare tali dati in informazioni utili per l’utente. Il concetto di rilevanza costituisce il punto chiave ai fini del recupero di dati che siano veramente utili all'utente, riducendo il piú possibile la quantità di rumore presente assieme all’informazione interessante. Considerando l’impatto della nozione di contesto nel processo decisionale e la interdipendenza tra questi e l'importanza relativa dell’informazione per l’utente, una metodologia e un sistema, chiamato PREMINE è stato proposto in un progetto di ricerca sviluppato presso il Dipartimento di Elettronica e Informazione. Esso utilizza il data mining per inferire preferenze contestuali dalla storia delle attività degli utenti con i dati e in particolare, dai risultati di interrogazioni precedenti, generando una vista contestuale e personalizzata della base di dati con cui l'utente interagisce. Data la difficoltà nell’ottenere informazioni sulle interazioni degli utente con una certa applicazione, in particolare quelli relativi ai contesti, il primo scopo di questo progetto è stato quello di fornire un log di utente valido che consentisse prove per dimostrare l’efficacia di PREMINE. Un set di dati, contenenti vera e propria attività di interazione, tra cui informazioni di contesto, è stato raccolto utilizzando una base di dati relazionale contenente informazioni su film. Dopo aver esaminato diverse strategie per raggiungere questo obiettivo, è stata progettata e implementata un’applicazione web per offrire agli utenti il modo più semplice e adeguato di accedere ai dati ed esprimere le loro preferenze su i film in diversi contesti. Tutte le attività di interrogazione e selezione degli utenti sono state registrate in modo adeguato in cinque diversi registri, che supportano le procedure di data mining descritte da PREMINE per inferire le preferenze contestuale e applicare il rispettivo data tailoring. Una volta che i log sono stati creati con successo, viene eseguito uno studio del problema di creazione della vista contestuale personalizzata nel caso di nuovi utenti che entrano nel sistema. Dopo aver analizzato una varietà di metodologie utilizzate in diversi scenari per risolvere problemi correlati, come il problema di cold-start in sistemi di raccomandazione, si propone un approccio adeguato per affrontare questo problema nel sistema esistente.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2011_03_Molina.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Thesis text
Dimensione 3.13 MB
Formato Adobe PDF
3.13 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/17882