Find a hotel in Milan close to a concert venue, a museum and a good restaurant? This information is available on the Web, but no software system can accept such queries nor compute the answer. Search computing as the new multi-disciplinary science which provides the abstractions, foundations, methods, and tools required to answer these and many similar questions. Due to the combinatorial nature of results, good entity instances (e.g., five stars hotels) tend to appear repeatedly in top-ranked combinations. To improve the quality of the result set, it is important to balance relevance (i.e., high values of the ranking function) with diversity, which promotes different, yet almost equally relevant, entities in the top-k combinations. This thesis explores three different notions of diversity (categorical, quantitative and mixture of categorical and quantitative) for multi-domain result sets, compares experimentally alternative algorithms for the trade-off between relevance and diversity, and performs a user study for evaluating the utility of diversification in multi-domain queries.

Dove posso trovare un albergo a Milano, vicino ad una sala concerti, un museo e un buon ristorante? Queste informazioni sono disponibili sul Web, ma nessun sistema software è in grado di accettare tali query, né di calcolare la risposta. Il search computing si puo definire come una nuova scienza multidisciplinare che fornisce le astrazioni, le fondamenta, i metodi e gli strumenti necessari per rispondere a queste e molte domande simili. A causa della natura combinatoria dei risultati, le istanze di entità rilevanti (per esempio, alberghi a cinque stelle) tendono a comparire più volte tra le prime combinazioni prodotte in risposta a una query multi-dominio. Per migliorare la qualità dei risultati, è importante equilibrare pertinenza (cioè, valori elevati della funzione di rango) con diversità, che promuove entità diverse, ma quasi egualmente pertinenti nei tra le prime combinazioni. Questa tesi esplora tre differenti nozioni di diversità (categoriale, quantitativa e la mescolanza di categorica e quantitativa) per risultati di query multidominio, confronta sperimentalmente algoritmi alternativi per il trade-off tra la pertinenza e la diversità, ed esegue uno studio con utenti per valutare l'utilità della diversificazione di query multi-dominio.

Diversification for multi domain result sets

IQBAL, MUHAMMAD SHOAIB
2011/2012

Abstract

Find a hotel in Milan close to a concert venue, a museum and a good restaurant? This information is available on the Web, but no software system can accept such queries nor compute the answer. Search computing as the new multi-disciplinary science which provides the abstractions, foundations, methods, and tools required to answer these and many similar questions. Due to the combinatorial nature of results, good entity instances (e.g., five stars hotels) tend to appear repeatedly in top-ranked combinations. To improve the quality of the result set, it is important to balance relevance (i.e., high values of the ranking function) with diversity, which promotes different, yet almost equally relevant, entities in the top-k combinations. This thesis explores three different notions of diversity (categorical, quantitative and mixture of categorical and quantitative) for multi-domain result sets, compares experimentally alternative algorithms for the trade-off between relevance and diversity, and performs a user study for evaluating the utility of diversification in multi-domain queries.
ING V - Scuola di Ingegneria dell'Informazione
23-apr-2012
2011/2012
Dove posso trovare un albergo a Milano, vicino ad una sala concerti, un museo e un buon ristorante? Queste informazioni sono disponibili sul Web, ma nessun sistema software è in grado di accettare tali query, né di calcolare la risposta. Il search computing si puo definire come una nuova scienza multidisciplinare che fornisce le astrazioni, le fondamenta, i metodi e gli strumenti necessari per rispondere a queste e molte domande simili. A causa della natura combinatoria dei risultati, le istanze di entità rilevanti (per esempio, alberghi a cinque stelle) tendono a comparire più volte tra le prime combinazioni prodotte in risposta a una query multi-dominio. Per migliorare la qualità dei risultati, è importante equilibrare pertinenza (cioè, valori elevati della funzione di rango) con diversità, che promuove entità diverse, ma quasi egualmente pertinenti nei tra le prime combinazioni. Questa tesi esplora tre differenti nozioni di diversità (categoriale, quantitativa e la mescolanza di categorica e quantitativa) per risultati di query multidominio, confronta sperimentalmente algoritmi alternativi per il trade-off tra la pertinenza e la diversità, ed esegue uno studio con utenti per valutare l'utilità della diversificazione di query multi-dominio.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2012_04_Iqbal.pdf

accessibile in internet per tutti

Descrizione: Thesis Text
Dimensione 3.02 MB
Formato Adobe PDF
3.02 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/42721