Negli ultimi anni le ricerche sul web hanno avuto un impatto sempre maggiore nella vita delle persone. In particolare motori di ricerca su argomenti specifici, come hotel, compagnie aeree, case in vendita e molti altri, sono sempre più utilizzati ed apprezzati. Per molte di queste ricerche, però, non sono sufficienti algoritmi semplici, infatti, molto spesso, le esigenze degli utenti sono molto varie e sfaccettate. Pensiamo un attimo a ricerche composte su più domini diversi, ad esempio una ricerca combinata di aerei e case vacanze. Per poter soddisfare ricerche di questo tipo servono algoritmi che estraggano risultati da più data service e li combinino secondo determinate funzioni, per ottenere dei dati rilevanti per l'utente finale. Uno di questi casi particolari, è il problema della diversificazione dei risultati, ossia l'esigenza da parte dell'utente di ottenere dei risultati che non siano ordinati secondo un solo parametro (ad esempio il prezzo), ma che siano fra loro il più vario possibile; quindi ad esempio una ricerca sugli hotel non dovrebbe fornire solo i risultati in ordine di prezzo, ma mostrare l'hotel più costoso, il più economico, quello con una valutazione dei clienti migliore e magari quello più vicino ad un luogo particolare. Alcuni algoritmi di diversificazione dei risultati sono stati proposti in letteratura, fra questi MMR è il più conosciuto ed usato. Il punto di partenza di questo lavoro di tesi è SPP un algoritmo di diversificazione spaziale basato su strutture geometriche. L'obiettivo di SPP era di ottenere gli stessi risultati di MMR accedendo ad un numero molto minore di oggetti, per migliorare le prestazioni del sistema. Il mio scopo, con questo lavoro, è stato quello di studiare la politica di accesso agli oggetti di SPP per trovare dei possibili miglioramenti. Mi sono focalizzato in particolare su una versione dell'algoritmo che accede, ad ogni iterazione, ad un numero di oggetti determinato da un budget, studiando in che modo far variare questo budget per ottenere risultati migliori.

Result diversification. Space partitioning & probing : batched access

GHIRALDELLI, DAVIDE
2012/2013

Abstract

Negli ultimi anni le ricerche sul web hanno avuto un impatto sempre maggiore nella vita delle persone. In particolare motori di ricerca su argomenti specifici, come hotel, compagnie aeree, case in vendita e molti altri, sono sempre più utilizzati ed apprezzati. Per molte di queste ricerche, però, non sono sufficienti algoritmi semplici, infatti, molto spesso, le esigenze degli utenti sono molto varie e sfaccettate. Pensiamo un attimo a ricerche composte su più domini diversi, ad esempio una ricerca combinata di aerei e case vacanze. Per poter soddisfare ricerche di questo tipo servono algoritmi che estraggano risultati da più data service e li combinino secondo determinate funzioni, per ottenere dei dati rilevanti per l'utente finale. Uno di questi casi particolari, è il problema della diversificazione dei risultati, ossia l'esigenza da parte dell'utente di ottenere dei risultati che non siano ordinati secondo un solo parametro (ad esempio il prezzo), ma che siano fra loro il più vario possibile; quindi ad esempio una ricerca sugli hotel non dovrebbe fornire solo i risultati in ordine di prezzo, ma mostrare l'hotel più costoso, il più economico, quello con una valutazione dei clienti migliore e magari quello più vicino ad un luogo particolare. Alcuni algoritmi di diversificazione dei risultati sono stati proposti in letteratura, fra questi MMR è il più conosciuto ed usato. Il punto di partenza di questo lavoro di tesi è SPP un algoritmo di diversificazione spaziale basato su strutture geometriche. L'obiettivo di SPP era di ottenere gli stessi risultati di MMR accedendo ad un numero molto minore di oggetti, per migliorare le prestazioni del sistema. Il mio scopo, con questo lavoro, è stato quello di studiare la politica di accesso agli oggetti di SPP per trovare dei possibili miglioramenti. Mi sono focalizzato in particolare su una versione dell'algoritmo che accede, ad ogni iterazione, ad un numero di oggetti determinato da un budget, studiando in che modo far variare questo budget per ottenere risultati migliori.
ING - Scuola di Ingegneria Industriale e dell'Informazione
23-lug-2013
2012/2013
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Ghiraldelli734540.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 543.1 kB
Formato Adobe PDF
543.1 kB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/80767