This work deals with disaster management. Specifically, it is focused on the quality management of information coming from non-authoritative sources: social media and crowdsourcing. This thesis is framed in the H2020 E2mC Evolution of Emergency Copernicus project and a part of it has been conducted at Citizen Cyber lab, a research centre of citizen science in Geneva. The aim is to understand how user-generated information could meet the quality requirements of emergency operators, in order to make it a valid and easily usable resource for situation awareness and rapid mapping when a disaster strikes. Since images taken on-field have shown their utility for these purposes, the visual content extracted from social media, specifically Twitter, has been analysed. Tools present in the E2mC platform, filters appositely created, and the crowdsourcing activities have been studied to understand their capabilities in reducing the volume of non-relevant information retrieved. Two case studies have been used to see if it is possible to give an a-priori estimation of the final quality and dimension of the dataset, that can be obtained applying different data processing workflows, that integrate automatic filtering and two crowdsourcing steps. In particular, since the geographic information associated to the images is necessary to locate them on a map, the performances of the E2mC geolocating algorithm and the potentiality of a crowdsourcing task for the improvement of the geolocation are presented.
Questo lavoro è incentrato sull’ambito della gestione delle emergenze. In particolare, si occupa dello studio della qualità delle informazioni che proviene da fonti non ufficiali: i social media e il crowdsourcing. Questa tesi è legata al progetto H2020 E2mC Evolution of Emergency Copernicus e una parte è stata svolta presso il Citizen Cyber lab, un centro di ricerca di citizen-science situato a Ginevra. Lo scopo della tesi è capire come le informazioni prodotte da utenti generici possano essere conformi agli standard di qualità imposti dagli operatori che si occupano di emergenze, in modo da renderle una risorsa valida e utilizzabile per la mappatura delle aree colpite da un disastro. Dato che le foto scattate in prossimità dell’evento hanno dimostrato la loro utilità per questo scopo, sono stati analizzati i contenuti multimediali estratti dai social media, in particolare da Twitter. Gli strumenti presenti nella piattaforma di E2mC, alcuni filtri sviluppati nel corso di questa tesi e alcune attività di crowdsourcing sono state studiate per capire le loro capacità nel ridurre il volume delle informazioni non rilevanti che vengono estratte dai social media. Due casi di studio sono stati utilizzati per capire se è possibile fornire delle stime a-priori sulla qualità del dataset finale che può essere ottenuto tramite l’applicazione di diversi processi che integrino filtri automatici e steps di crowdsourcing per analizzare il dato disponibile. In particolare, dato che l’informazione geografica associata alle immagini è necessaria per localizzarle su una mappa, sono state studiate la precisone dell’algoritmo di geolocalizzatine creato per il progetto E2mC e come il crowdsourcing possa migliorare i risultati che l’algoritmo fornisce.
Visual social media and crowdsourcing : analysis of tools for disaster management applications
BAROZZI, SARA
2017/2018
Abstract
This work deals with disaster management. Specifically, it is focused on the quality management of information coming from non-authoritative sources: social media and crowdsourcing. This thesis is framed in the H2020 E2mC Evolution of Emergency Copernicus project and a part of it has been conducted at Citizen Cyber lab, a research centre of citizen science in Geneva. The aim is to understand how user-generated information could meet the quality requirements of emergency operators, in order to make it a valid and easily usable resource for situation awareness and rapid mapping when a disaster strikes. Since images taken on-field have shown their utility for these purposes, the visual content extracted from social media, specifically Twitter, has been analysed. Tools present in the E2mC platform, filters appositely created, and the crowdsourcing activities have been studied to understand their capabilities in reducing the volume of non-relevant information retrieved. Two case studies have been used to see if it is possible to give an a-priori estimation of the final quality and dimension of the dataset, that can be obtained applying different data processing workflows, that integrate automatic filtering and two crowdsourcing steps. In particular, since the geographic information associated to the images is necessary to locate them on a map, the performances of the E2mC geolocating algorithm and the potentiality of a crowdsourcing task for the improvement of the geolocation are presented.File | Dimensione | Formato | |
---|---|---|---|
Tesi Sara Barozzi.pdf
accessibile in internet per tutti
Descrizione: Testo della tesi
Dimensione
5.84 MB
Formato
Adobe PDF
|
5.84 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/144804