This thesis was developed in the context of E2mC, an European project that aims at improving the quality of the information processed online during events classified as catastrophes (such as hurricanes, floods, earthquakes and fires) in order to have a system that can be supportive during emergency management. The E2mC project therefore aims at introducing a robust system for extracting and analyzing data published on various social media and improving the integration process of these data coming from different platforms. In order to consider only the contents related to a particular disaster, it is necessary to define a specific group of keywords that are used to support the selection of news and articles from Social Networks. The main contribution of this thesis is the addition to the system already developed in the context of the E2mC project of a module that allows to exploit the information contained within the various online newspapers, in order to automatically identify the places that have been affected from a certain natural disaster. The proposed methodology shows how it is possible, using a news aggregator that collects articles published from various sources, to select through the use of an alternative method only the news concerning catastrophes, using at the same time numerous filtering and analysis techniques. The procedures described have all been tested on various use cases, with the aim of providing a complete view of the benefits that can be derived from this new developed system. Among the effects of the integration of this new module to the pre-existing system it is easy to identify the reduction of the human intervention required to be able to correctly manage the emergency situations, together with an increase in the quantity and an improvement in the quality of the information obtained.
Questa tesi è stata sviluppata nel contesto del progetto europeo E2mC, il quale si pone come obiettivo quello di migliorare la qualità delle informazioni proces- sate online durante eventi classificati come catastrofi (quali uragani, inondazioni, terremoti e incendi) al fine di avere a disposizione un sistema che possa essere di supporto durante la gestione delle emergenze. Il progetto E2mC mira quindi all’introduzione di un robusto sistema di estrazione e di analisi dei dati pubblicati sui vari Social Media e al miglioramento del processo di integrazione di questi dati provenienti da diverse piattaforme. Per considerare esclusivamente i contenuti correlati ad una determinata catastrofe è necessaria la definizione di un apposito gruppo di parole chiave che vengono utilizzate per supportare l’attività di selezione delle news e degli articoli dai Social Network. Il contributo principale di questa tesi è l’aggiunta al sistema già sviluppato nel contesto del progetto E2mC di un modulo che permetta di sfruttare le infor- mazioni contenute all’interno dei vari giornali online, al fine di identificare in modo automatico le località che sono state colpite da un determinato disastro naturale. La metodologia proposta mostra come sia possibile, utilizzando un aggregatore di news che raccoglie articoli pubblicati da varie fonti, selezionare attraverso l’utilizzo di un metodo alternativo solo le notizie riguardanti catastrofi, servendosi allo stesso tempo di numerose tecniche di filtraggio e di analisi. Le procedure descritte sono state tutte testate su svariati casi d’uso, con il fine di fornire una visione completa circa i benefici che possono essere tratti da questo nuovo sistema sviluppato. Tra gli effetti dell’integrazione di questo nuovo modulo al preesistente sistema si possono facilmente identificare la riduzione dell’intervento umano richiesto per poter gestire in modo corretto le situazioni di emergenza, insieme ad un aumento della quantità e ad un miglioramento della qualità delle informazioni ottenute.
A methodology to extract event-specific keywords from online articles in an emergency context
VIVIANI, MIRKO
2018/2019
Abstract
This thesis was developed in the context of E2mC, an European project that aims at improving the quality of the information processed online during events classified as catastrophes (such as hurricanes, floods, earthquakes and fires) in order to have a system that can be supportive during emergency management. The E2mC project therefore aims at introducing a robust system for extracting and analyzing data published on various social media and improving the integration process of these data coming from different platforms. In order to consider only the contents related to a particular disaster, it is necessary to define a specific group of keywords that are used to support the selection of news and articles from Social Networks. The main contribution of this thesis is the addition to the system already developed in the context of the E2mC project of a module that allows to exploit the information contained within the various online newspapers, in order to automatically identify the places that have been affected from a certain natural disaster. The proposed methodology shows how it is possible, using a news aggregator that collects articles published from various sources, to select through the use of an alternative method only the news concerning catastrophes, using at the same time numerous filtering and analysis techniques. The procedures described have all been tested on various use cases, with the aim of providing a complete view of the benefits that can be derived from this new developed system. Among the effects of the integration of this new module to the pre-existing system it is easy to identify the reduction of the human intervention required to be able to correctly manage the emergency situations, together with an increase in the quantity and an improvement in the quality of the information obtained.File | Dimensione | Formato | |
---|---|---|---|
TESIULTIMAVERSIONE (1).pdf
non accessibile
Descrizione: Testo della tesi
Dimensione
11.87 MB
Formato
Adobe PDF
|
11.87 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/149854