The quantity of public content, generated by users or by sensors, available on the web nowadays is reaching unprecedented volumes. This massive collection of data contains an enormous amount of latent knowledge, which can be used for a variety of purposes, such as event detection and predictive modeling. The goal of the research presented in this thesis is to explore the methods for extracting such knowledge and building useful applications using low-cost, publicly available, multimedia web content, with reference to the field of environmental monitoring, which often suffers from the lack of significant and exhaustive input data. This objective requires addressing such challenges as content acquisition, content normalization and fusion, analysis and correlation, and model building and training. Specifically, the focus is set on monitoring snow cover in mountainous regions, that is, the spatial extent of earth surface covered by snow. The effort exploits visual data, terrestrial photography crawled from the public image sharing websites and publicly available webcams. We present algorithms for retrieving and analyzing such data, and prove its usefulness thanks to a data-driven environmental model. The experiments prove that, in the described use case, the virtual snow indexes obtained from a single public webcam are able to replace the original authoritative snow measurements without a performance drop and improve the performance if complemented to the authoritative snow measurements. These results confirm the feasibility of exploiting visual content publicly available on the web in real world environmental monitoring scenarios.

La quantità di contenuti pubblici, generati dagli utenti o da sensori, disponibile oggi sul web, sta raggiungendo volumi senza precedenti. Questa considerevole raccolta di dati contiene un'enorme quantità di informazioni nascoste, che possono essere utilizzate per svariati scopi, come l'individuazione degli eventi e il predictive modeling. L'obiettivo della ricerca presentato in questa tesi è quello di esplorare i metodi per estrarre tali informazioni e costruire applicazioni utili utilizzando contenuti web a basso costo e pubblicamente accessibili, con riferimento al campo del monitoraggio ambientale, che spesso soffre dalla mancanza di dati di input significativi ed esaustivi. Questo obiettivo richiede di affrontare sfide come l'acquisizione dei contenuti, la loro normalizzazione e fusione, l'analisi e la correlazione, la creazione di modelli e addestramento. In particolare, l'attenzione è posta sul monitoraggio della neve in regioni montuose, ovvero l'estensione spaziale della superficie terrestre coperta dalla neve. Il lavoro sfrutta i dati visuali: fotografie estratte dai siti web di condivisione di immagini pubbliche e webcams pubblicamente disponibili. Vengono presentati gli algoritmi per il recupero e l'analisi di tali dati e viene dimostrata la loro utilità grazie ad un modello ambientale basato su di essi. Gli esperimenti dimostrano che, nel caso d'uso descritto, gli indici della neve virtuale ottenuti da una singola webcam pubblica sono in grado di sostituire le misurazioni ufficiali delle neve mantendo lo stesso livello di prestazioni, mentre le prestazioni migliorano se gli indici della neve virtuale vengono integrati alle misurazioni ufficiali. Questi risultati confermano la fattibilità di sfruttare contenuti visuali pubblicamente disponibili sul web in scenari di monitoraggio ambientale del mondo reale.

Exploiting public web content to enhance environmental monitoring

FEDOROV, ROMAN

Abstract

The quantity of public content, generated by users or by sensors, available on the web nowadays is reaching unprecedented volumes. This massive collection of data contains an enormous amount of latent knowledge, which can be used for a variety of purposes, such as event detection and predictive modeling. The goal of the research presented in this thesis is to explore the methods for extracting such knowledge and building useful applications using low-cost, publicly available, multimedia web content, with reference to the field of environmental monitoring, which often suffers from the lack of significant and exhaustive input data. This objective requires addressing such challenges as content acquisition, content normalization and fusion, analysis and correlation, and model building and training. Specifically, the focus is set on monitoring snow cover in mountainous regions, that is, the spatial extent of earth surface covered by snow. The effort exploits visual data, terrestrial photography crawled from the public image sharing websites and publicly available webcams. We present algorithms for retrieving and analyzing such data, and prove its usefulness thanks to a data-driven environmental model. The experiments prove that, in the described use case, the virtual snow indexes obtained from a single public webcam are able to replace the original authoritative snow measurements without a performance drop and improve the performance if complemented to the authoritative snow measurements. These results confirm the feasibility of exploiting visual content publicly available on the web in real world environmental monitoring scenarios.
BONARINI, ANDREA
CASTELLETTI, ANDREA FRANCESCO
15-set-2017
La quantità di contenuti pubblici, generati dagli utenti o da sensori, disponibile oggi sul web, sta raggiungendo volumi senza precedenti. Questa considerevole raccolta di dati contiene un'enorme quantità di informazioni nascoste, che possono essere utilizzate per svariati scopi, come l'individuazione degli eventi e il predictive modeling. L'obiettivo della ricerca presentato in questa tesi è quello di esplorare i metodi per estrarre tali informazioni e costruire applicazioni utili utilizzando contenuti web a basso costo e pubblicamente accessibili, con riferimento al campo del monitoraggio ambientale, che spesso soffre dalla mancanza di dati di input significativi ed esaustivi. Questo obiettivo richiede di affrontare sfide come l'acquisizione dei contenuti, la loro normalizzazione e fusione, l'analisi e la correlazione, la creazione di modelli e addestramento. In particolare, l'attenzione è posta sul monitoraggio della neve in regioni montuose, ovvero l'estensione spaziale della superficie terrestre coperta dalla neve. Il lavoro sfrutta i dati visuali: fotografie estratte dai siti web di condivisione di immagini pubbliche e webcams pubblicamente disponibili. Vengono presentati gli algoritmi per il recupero e l'analisi di tali dati e viene dimostrata la loro utilità grazie ad un modello ambientale basato su di essi. Gli esperimenti dimostrano che, nel caso d'uso descritto, gli indici della neve virtuale ottenuti da una singola webcam pubblica sono in grado di sostituire le misurazioni ufficiali delle neve mantendo lo stesso livello di prestazioni, mentre le prestazioni migliorano se gli indici della neve virtuale vengono integrati alle misurazioni ufficiali. Questi risultati confermano la fattibilità di sfruttare contenuti visuali pubblicamente disponibili sul web in scenari di monitoraggio ambientale del mondo reale.
Tesi di dottorato
File allegati
File Dimensione Formato  
roman-phd-thesis.pdf

accessibile in internet per tutti

Descrizione: thesis
Dimensione 5.78 MB
Formato Adobe PDF
5.78 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/135778