This work addresses the problem of the automatic layout definition for the Web search result pages. Upon query submission, the search engine returns several result items of heterogeneous types, such as images, web links, news,..., which have to be collected together to produce a unified view. We suppose that the query submitted by the user belongs to one domain of interest such as city, actor, product,... each of them is characterized by a set of result types. For example a city is described by the map, the local news, some images, while the description of an actor is enhanced with videos, images and blogs. The positioning of the results in the page is crucial because it affects the user experience, during the search process: in a good page layout the user finds quickly the needed information, because it occupies the expected positions (e.g. for a city search, the important contents are the map, the weather conditions and the local news, so they should be shown at the top of the page). Our approach is based on constraint programming techniques, which allow to express a set of positioning rules by means of constraints (for example the map can only appear at the top or at the bottom of the page), deducted from the analysis of the real search engines behaviour. Additionally each domain of interest is associated with a set of result types, with an assigned score, representing their importance (e.g. the video is very significant for the actor, and less for the city). The optimal positioning of each result type in the page (modelled as a grid with weighted cells) depends on the scores, other than taking into account the other constraints. The evaluation of our algorithm reveals that we are able to reproduce the page layout of the general purpose search engines (sometimes we have to do some changes, for example related to the introduction of a new object), and a user test allowed to evaluate the quality and effectiveness of each version of the algorithm.
Questo lavoro affronta il problema della definizione automatica della griglia di pagina, per risultati di motori di ricerca. In risposta ad una domanda (query), i motori di ricerca restituiscono risultati di diverso tipo, per esempio immagini, links, news,..., che devono essere visualizzati nella stessa pagina. Si suppone che la richiesta dell'utente riguarda un campo di interesse come città, attore, prodotto,... caratterizzato da un insieme di tipi di risultato. Per esempio la città è descritta tramite la mappa, le notizie locali, le immagini, mentre l'attore è descritto con i video, le immagini, il blog. Il posizionamento dei risultati nella pagina è molto importante, perchè condiziona l'esperienza dell'utente durante la ricerca: se il layout della pagina web è bene organizzato, l'utente trova velocemente le informazioni richieste, poichè esse occupano le posizioni aspettate (per esempio nella ricerca di una città, le informazioni più importanti sono la mappa, il meteo e le notizie locali, che dovrebbero essere visualizzate in alto alla pagina). L'approccio di questo elaborato si basa su tecniche di programmazione legate a vincoli, che consentono di esprimere le regole di posizionamento tramite dei vincoli (per esempio la mappa può essere collocata in alto oppure in basso alla pagina), dedotti dal comportamento dei motori di ricerca reali. Inoltre ogni dominio di interesse è caratterizzato da un insieme di tipi di risultato, ai quali è assegnato un punteggio ("score") che rappresenta il livello di importanza (per esempio il video è molto significativo per l'attore e meno per le città). Il posizionamento ottimale di ogni tipo di risultato nella pagina (modellata come una griglia di celle "pesate") dipende dai punteggi e dagli altri vincoli considerati. La valutazione dell'algoritmo proposto ha verificato la capacità di riprodurre le pagine dei motori di ricerca attuali (talvolta è necessario effettuare dei cambiamenti, per esempio riguardanti l'introduzione di un nuovo oggetto), mentre il test con l'utente ha permesso di valutare la qualità e l'efficacia di ogni versione dell'algoritmo.
Automatic layout management for entity aware search engine result pages
CIGARDI, LAURA
2010/2011
Abstract
This work addresses the problem of the automatic layout definition for the Web search result pages. Upon query submission, the search engine returns several result items of heterogeneous types, such as images, web links, news,..., which have to be collected together to produce a unified view. We suppose that the query submitted by the user belongs to one domain of interest such as city, actor, product,... each of them is characterized by a set of result types. For example a city is described by the map, the local news, some images, while the description of an actor is enhanced with videos, images and blogs. The positioning of the results in the page is crucial because it affects the user experience, during the search process: in a good page layout the user finds quickly the needed information, because it occupies the expected positions (e.g. for a city search, the important contents are the map, the weather conditions and the local news, so they should be shown at the top of the page). Our approach is based on constraint programming techniques, which allow to express a set of positioning rules by means of constraints (for example the map can only appear at the top or at the bottom of the page), deducted from the analysis of the real search engines behaviour. Additionally each domain of interest is associated with a set of result types, with an assigned score, representing their importance (e.g. the video is very significant for the actor, and less for the city). The optimal positioning of each result type in the page (modelled as a grid with weighted cells) depends on the scores, other than taking into account the other constraints. The evaluation of our algorithm reveals that we are able to reproduce the page layout of the general purpose search engines (sometimes we have to do some changes, for example related to the introduction of a new object), and a user test allowed to evaluate the quality and effectiveness of each version of the algorithm.File | Dimensione | Formato | |
---|---|---|---|
2011_03_Cigardi.pdf
accessibile in internet solo dagli utenti autorizzati
Descrizione: Relazione della tesi
Dimensione
15.79 MB
Formato
Adobe PDF
|
15.79 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/13062