Given the extensive use of data of the Web, ensuring its quality and reliability it is surely one of the main goals to pursue. Existing researches are mainly focused on the evaluation of Web sources and not on the data they contain. Secondly, those researches do not consider the contribution (reviews and opinions) given by users of those Web sources, which is a valuable resource that can be used for the validation of data itself. This thesis propose a methodology whose goal is to find the true value of the data using many Web sources and reviews from their users. The proposed methodology was applied to a real world case consisting of three websites containing information about restaurants. The developed application creates an integration of data from the three websites and allows users to see the minimum price spent by other users in a given restaurant by extracting that value directly from the reviews.
Dato il grande uso che viene fatto dei dati sul Web, assicurarne la qualità ed affidabilità è sicuramente un obiettivo fondamentale. Le ricerche esistenti purtroppo tendono a focalizzarsi nel valutare la sola reputazione della fonte e non quella dei dati che contengono, e soprattutto non tengono conto del contributo degli utenti nella validazione dei valori. In questa tesi si propone una metodologia che utilizza sorgenti web e recensioni degli utenti per trovare il vero valore dei dati. La metodologia studiata è stata applicata nel caso reale di tre siti, contenenti informazioni di ristoranti, nel quale si fornisce un’integrazione dei dati delle sorgenti e viene ricavato il valore del prezzo minimo speso dagli utenti direttamente dalle recensioni.
Una metodologia per la valutazione e il miglioramento dei dati pubblicati sul Web
MARINI, FEDERICO
2014/2015
Abstract
Given the extensive use of data of the Web, ensuring its quality and reliability it is surely one of the main goals to pursue. Existing researches are mainly focused on the evaluation of Web sources and not on the data they contain. Secondly, those researches do not consider the contribution (reviews and opinions) given by users of those Web sources, which is a valuable resource that can be used for the validation of data itself. This thesis propose a methodology whose goal is to find the true value of the data using many Web sources and reviews from their users. The proposed methodology was applied to a real world case consisting of three websites containing information about restaurants. The developed application creates an integration of data from the three websites and allows users to see the minimum price spent by other users in a given restaurant by extracting that value directly from the reviews.File | Dimensione | Formato | |
---|---|---|---|
tesi.pdf
accessibile in internet per tutti
Descrizione: Testo della tesi
Dimensione
1.77 MB
Formato
Adobe PDF
|
1.77 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/108741