Il presente lavoro di tesi intende definire una metodologia per l’estrazione di informazione rilevante dai messaggi scambiati sui social network, allo scopo di supportare le strategie decisionali e operative delle organizzazioni preposte alla gestione delle emergenze. Si vuole quindi ottenere un metodo efficiente con il quale, attraverso un monitoraggio e un’analisi costante delle conversazioni dei cittadini sulle reti sociali, si possa riuscire a catturare messaggi riguardanti situazioni di emergenza - come segnalazioni, allarmi, richieste di aiuto – che, una volta interpretati e organizzati, possano fornire dati utili alle autorità. Numerosi casi recenti hanno infatti dimostrato come Internet e i social network si siano rivelati efficaci nel veicolare informazioni utili in contesti di crisi. Alcuni eventi verificatisi nel passato recente hanno ottenuto grande risalto su questi nuovi mezzi di comunicazione, e i messaggi a riguardo, scambiati dalle persone, hanno spesso aiutato le istituzioni nella risoluzione di vari problemi. Le informazioni ricavate dal Web 2.0, debitamente sfruttate dalle autorità, potrebbero portare a un miglioramento complessivo nel processo di risoluzione dell’evento critico, fornendo un supporto alle decisioni per tutti quegli enti impegnati a garantire la salvaguardia dei cittadini. Analogamente, esse potrebbero aiutare durante le fasi di monitoraggio del territorio, grazie a una raccolta dati distribuita basata sul paradigma crowdsourcing, ovvero sulla partecipazione attiva della cittadinanza e sullo sfruttamento coordinato delle conoscenze e delle capacità di un numero elevato di individui. L’utilizzo delle persone comuni alla stregua di “sensori” può infatti condurre a una diffusione più rapida delle informazioni e all’acquisizione di dettagli importanti riguardo alla situazione del territorio durante un’emergenza. Spesso questi dettagli sono però nascosti all’interno di messaggi non esplicitamente diretti alle autorità: serve perciò una strategia per ricavarli e strutturarli, in modo che risultino d’aiuto. Poiché i messaggi scambiati sui social network possono assumere natura variegata, si intende qui affrontare il problema di come costruire un dominio lessicale focalizzato sul contesto delle emergenze. Tale dominio potrà poi essere sfruttato all’interno di un algoritmo sintattico, che avrà lo scopo di effettuare un’analisi automatica dei messaggi scambiati in rete, in modo da definire una categorizzazione degli stessi. Questo fornirà in uscita un contenuto informativo strutturato, dal quale poter estrarre dati utili per la rilevazione o la risoluzione di un’emergenza. Lo studio effettuato nel presente lavoro si inserisce nell’ambito di un progetto denominato TORCIA, che vede la collaborazione del Dipartimento di Elettronica e Informazione del Politecnico di Milano e di Fondazione Politecnico con diverse imprese del settore informatico e delle telecomunicazioni. Lo scopo di tale progetto è la realizzazione di una piattaforma resiliente in grado di raccogliere, analizzare e interpretare i messaggi scambiati dai cittadini riguardo agli eventi critici che possono avvenire in ambito metropolitano, e di restituire in uscita una serie di dati aggregati fruibili dalle autorità per rendere più efficiente il processo di gestione delle emergenze. A tal proposito, la finalità primaria di questa tesi è concentrarsi sulla definizione di un’ontologia di dominio sintattico per le emergenze, ricavata a partire da un analisi bottom-up sui testi scambiati nei social network durante una situazione di crisi. Il dominio così generato, costruito a partire da casi reali e focalizzato su una specifica emergenza, potrà poi essere esteso ad altri contesti grazie a una serie di considerazioni argomentate in chiusura. La definizione del dominio partirà da un’analisi sistematica dei messaggi scambiati su uno specifico social network – che nel caso del presente lavoro sarà individuato in Twitter -, così da generare un vocabolario di termini ricorrenti nell’ambito di un’emergenza predefinita, istruendo così l’algoritmo in modo che esso sia in grado di suddividere correttamente i messaggi, riconoscendone il contenuto informativo. Quanto ricavato qui, poi, potrà essere utilizzato per l’estensione della metodologia ad altre sorgenti informative. La tesi è strutturata come segue. Nel primo capitolo dedicato allo “stato dell’arte”, si forniscono tutti gli strumenti per comprendere cosa sia un’emergenza e come essa venga tradizionalmente trattata. Si spiega inoltre cos’è il paradigma crowdsourcing, dimostrando come esso possa essere efficacemente sfruttato durante un’emergenza. Il capitolo 2 aiuta nell’apprendere gli aspetti basilari riguardo alla classificazione delle emergenze, necessari per la definizione della metodologia. Il capitolo 3 è dedicato all’analisi di alcuni casi d’emergenza reali in cui i social network e in generale gli strumenti messi a disposizione dal Web 2.0 hanno giocato un ruolo fondamentale nella gestione dell’emergenza. L’analisi preventiva, fatta sulla letteratura, è un passo necessario alla definizione del dominio. Il capitolo 4 contestualizza quanto visto precedentemente all’interno del progetto TORCIA, fornendo anche un supporto introduttivo alla metodologia e definendo il contesto nel quale essa andrà a essere utilizzata. Il capitolo 5 è il cuore della tesi, e definisce in maniera dettagliata la metodologia ricercata per l’estrazione di informazione sociale. La metodologia viene poi applicata a un algoritmo sintattico, al fine di ricavare risultati qualitativi in merito alla bontà dello studio effettuato.

Metodologia per la gestione di emergenze basata su informazione sociale

PALLA, ANDREA
2011/2012

Abstract

Il presente lavoro di tesi intende definire una metodologia per l’estrazione di informazione rilevante dai messaggi scambiati sui social network, allo scopo di supportare le strategie decisionali e operative delle organizzazioni preposte alla gestione delle emergenze. Si vuole quindi ottenere un metodo efficiente con il quale, attraverso un monitoraggio e un’analisi costante delle conversazioni dei cittadini sulle reti sociali, si possa riuscire a catturare messaggi riguardanti situazioni di emergenza - come segnalazioni, allarmi, richieste di aiuto – che, una volta interpretati e organizzati, possano fornire dati utili alle autorità. Numerosi casi recenti hanno infatti dimostrato come Internet e i social network si siano rivelati efficaci nel veicolare informazioni utili in contesti di crisi. Alcuni eventi verificatisi nel passato recente hanno ottenuto grande risalto su questi nuovi mezzi di comunicazione, e i messaggi a riguardo, scambiati dalle persone, hanno spesso aiutato le istituzioni nella risoluzione di vari problemi. Le informazioni ricavate dal Web 2.0, debitamente sfruttate dalle autorità, potrebbero portare a un miglioramento complessivo nel processo di risoluzione dell’evento critico, fornendo un supporto alle decisioni per tutti quegli enti impegnati a garantire la salvaguardia dei cittadini. Analogamente, esse potrebbero aiutare durante le fasi di monitoraggio del territorio, grazie a una raccolta dati distribuita basata sul paradigma crowdsourcing, ovvero sulla partecipazione attiva della cittadinanza e sullo sfruttamento coordinato delle conoscenze e delle capacità di un numero elevato di individui. L’utilizzo delle persone comuni alla stregua di “sensori” può infatti condurre a una diffusione più rapida delle informazioni e all’acquisizione di dettagli importanti riguardo alla situazione del territorio durante un’emergenza. Spesso questi dettagli sono però nascosti all’interno di messaggi non esplicitamente diretti alle autorità: serve perciò una strategia per ricavarli e strutturarli, in modo che risultino d’aiuto. Poiché i messaggi scambiati sui social network possono assumere natura variegata, si intende qui affrontare il problema di come costruire un dominio lessicale focalizzato sul contesto delle emergenze. Tale dominio potrà poi essere sfruttato all’interno di un algoritmo sintattico, che avrà lo scopo di effettuare un’analisi automatica dei messaggi scambiati in rete, in modo da definire una categorizzazione degli stessi. Questo fornirà in uscita un contenuto informativo strutturato, dal quale poter estrarre dati utili per la rilevazione o la risoluzione di un’emergenza. Lo studio effettuato nel presente lavoro si inserisce nell’ambito di un progetto denominato TORCIA, che vede la collaborazione del Dipartimento di Elettronica e Informazione del Politecnico di Milano e di Fondazione Politecnico con diverse imprese del settore informatico e delle telecomunicazioni. Lo scopo di tale progetto è la realizzazione di una piattaforma resiliente in grado di raccogliere, analizzare e interpretare i messaggi scambiati dai cittadini riguardo agli eventi critici che possono avvenire in ambito metropolitano, e di restituire in uscita una serie di dati aggregati fruibili dalle autorità per rendere più efficiente il processo di gestione delle emergenze. A tal proposito, la finalità primaria di questa tesi è concentrarsi sulla definizione di un’ontologia di dominio sintattico per le emergenze, ricavata a partire da un analisi bottom-up sui testi scambiati nei social network durante una situazione di crisi. Il dominio così generato, costruito a partire da casi reali e focalizzato su una specifica emergenza, potrà poi essere esteso ad altri contesti grazie a una serie di considerazioni argomentate in chiusura. La definizione del dominio partirà da un’analisi sistematica dei messaggi scambiati su uno specifico social network – che nel caso del presente lavoro sarà individuato in Twitter -, così da generare un vocabolario di termini ricorrenti nell’ambito di un’emergenza predefinita, istruendo così l’algoritmo in modo che esso sia in grado di suddividere correttamente i messaggi, riconoscendone il contenuto informativo. Quanto ricavato qui, poi, potrà essere utilizzato per l’estensione della metodologia ad altre sorgenti informative. La tesi è strutturata come segue. Nel primo capitolo dedicato allo “stato dell’arte”, si forniscono tutti gli strumenti per comprendere cosa sia un’emergenza e come essa venga tradizionalmente trattata. Si spiega inoltre cos’è il paradigma crowdsourcing, dimostrando come esso possa essere efficacemente sfruttato durante un’emergenza. Il capitolo 2 aiuta nell’apprendere gli aspetti basilari riguardo alla classificazione delle emergenze, necessari per la definizione della metodologia. Il capitolo 3 è dedicato all’analisi di alcuni casi d’emergenza reali in cui i social network e in generale gli strumenti messi a disposizione dal Web 2.0 hanno giocato un ruolo fondamentale nella gestione dell’emergenza. L’analisi preventiva, fatta sulla letteratura, è un passo necessario alla definizione del dominio. Il capitolo 4 contestualizza quanto visto precedentemente all’interno del progetto TORCIA, fornendo anche un supporto introduttivo alla metodologia e definendo il contesto nel quale essa andrà a essere utilizzata. Il capitolo 5 è il cuore della tesi, e definisce in maniera dettagliata la metodologia ricercata per l’estrazione di informazione sociale. La metodologia viene poi applicata a un algoritmo sintattico, al fine di ricavare risultati qualitativi in merito alla bontà dello studio effettuato.
FRANCALANCI, CHIARA
POLI, ALESSANDRO
ING V - Scuola di Ingegneria dell'Informazione
20-dic-2012
2011/2012
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2012_12_Palla.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 1.08 MB
Formato Adobe PDF
1.08 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/72164