This work is framed in the emergency management area, focusing in particular in the development of a fuzzy logic system for ranking social media information during natural disasters. The aim of this work is to give timely useful information to rescue operators for the production of maps of the afflicted areas, and to solve the information overload problem by stipulating a rank of the social media posts based on their importance. Several features of a post are considered and analysed together in an integrated manner: the text, the presence of hashtags and of URLs, the publication date, the position, the author reliability and the relevance of the media contained in the posts. The fuzzy system model developed takes in input all these components, and, based on a set of rules appropriately defined, returns as output a numerical value reflecting the global utility of the tweet, which is the basis for the ranking. The ranking in output has been compared to a baseline ranking obtained through a simpler model which computes the scores by multiplying three coefficients of different features and to a ground truth obtained through a manual analysis of the posts, demonstrating that the proposed model achieves better results than the baseline, getting closer to ground truth.

Questo lavoro si colloca nell’area di gestione delle emergenze, in particolare nello sviluppo di un sistema basato sulla logica fuzzy per la classificazione delle informazioni pubblicate sui social network durante le calamità naturali. L’obbiettivo di questo lavoro è quello di fornire tempestivamente informazioni utili agli operatori del soccorso per la realizzazione di mappe delle aree colpite, e di risolvere il problema del sovraccarico di informazioni, stabilendo una classifica dei post sui social media in base alla loro importanza. Diverse caratteristiche di un post vengono considerate e analizzate: il testo, la presenza di hashtag e di URL, la data di pubblicazione, la posizione, l’affidabilità dell’autore e la rilevanza dei media contenuti nei post. Il modello sviluppato utilizza la logica fuzzy, prende in considerazione tutte queste caratteristiche e, sulla base di un insieme di regole opportunamente definito, restituisce come output un valore numerico che riflette l’utilità globale del tweet, in base al quale verrà stilata la classifica. La classifica restituita in output è stata confrontata con un’altra classifica ottenuta attraverso un modello più semplice che calcola i punteggi moltiplicando tre coefficienti di componenti diverse e con una ground truth ottenuta attraverso un’analisi manuale dei post, dimostrando che il modello proposto raggiunge risultati migliori, avvicinandosi maggiormente alla ground truth.

A fuzzy logic approach for ranking social media information during natural disasters

SCACIGA, DAVIDE
2017/2018

Abstract

This work is framed in the emergency management area, focusing in particular in the development of a fuzzy logic system for ranking social media information during natural disasters. The aim of this work is to give timely useful information to rescue operators for the production of maps of the afflicted areas, and to solve the information overload problem by stipulating a rank of the social media posts based on their importance. Several features of a post are considered and analysed together in an integrated manner: the text, the presence of hashtags and of URLs, the publication date, the position, the author reliability and the relevance of the media contained in the posts. The fuzzy system model developed takes in input all these components, and, based on a set of rules appropriately defined, returns as output a numerical value reflecting the global utility of the tweet, which is the basis for the ranking. The ranking in output has been compared to a baseline ranking obtained through a simpler model which computes the scores by multiplying three coefficients of different features and to a ground truth obtained through a manual analysis of the posts, demonstrating that the proposed model achieves better results than the baseline, getting closer to ground truth.
SCALIA, GABRIELE
ING - Scuola di Ingegneria Industriale e dell'Informazione
19-apr-2018
2017/2018
Questo lavoro si colloca nell’area di gestione delle emergenze, in particolare nello sviluppo di un sistema basato sulla logica fuzzy per la classificazione delle informazioni pubblicate sui social network durante le calamità naturali. L’obbiettivo di questo lavoro è quello di fornire tempestivamente informazioni utili agli operatori del soccorso per la realizzazione di mappe delle aree colpite, e di risolvere il problema del sovraccarico di informazioni, stabilendo una classifica dei post sui social media in base alla loro importanza. Diverse caratteristiche di un post vengono considerate e analizzate: il testo, la presenza di hashtag e di URL, la data di pubblicazione, la posizione, l’affidabilità dell’autore e la rilevanza dei media contenuti nei post. Il modello sviluppato utilizza la logica fuzzy, prende in considerazione tutte queste caratteristiche e, sulla base di un insieme di regole opportunamente definito, restituisce come output un valore numerico che riflette l’utilità globale del tweet, in base al quale verrà stilata la classifica. La classifica restituita in output è stata confrontata con un’altra classifica ottenuta attraverso un modello più semplice che calcola i punteggi moltiplicando tre coefficienti di componenti diverse e con una ground truth ottenuta attraverso un’analisi manuale dei post, dimostrando che il modello proposto raggiunge risultati migliori, avvicinandosi maggiormente alla ground truth.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2018_04_Scaciga.pdf

non accessibile

Descrizione: Master thesis Scaciga
Dimensione 1.95 MB
Formato Adobe PDF
1.95 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/140181