This thesis aims at deep and accurate feasibility analysis of exploitation of social network content, especially from Twitter, to mine useful information for the local publishing industry. Based on the retrieval and analysis of the tweets related to some sample cities, the project tries to understand how valuable is the retrieved data. The work focused on determining the quality of the contents, in other words if they’re relevant or not to extract a piece of news. A new and customized method is defined and applied for this, covering the classification by relevance, the calculation of correlation indexes with respect to various context variables, the publication trend analysis, the anomaly detection and the study of other dimensions that are potentially able to provide more precise information. Results are then displayed through a customized visual presentation, which also grants explorability of the results. The work is completed by an experimental evaluation on a set of local areas, with real data.

Questo lavoro di tesi si propone di fornire un’analisi dettagliata ed approfondita della possibilità di sfruttare i social network, in particolare Twitter, per estrarre informazioni utili nell’ambito dell’editoria locale. Basandosi sulla raccolta e sull’analisi dei tweet relativi all’intero anno 2015 per alcune municipalità campione, si mira a capire se la mole di dati recuperata è significativa ai fini analitici. Durante il corso del lavoro si valuta la qualità dei contenuti, ovvero se sono rilevanti o meno al fine della costruzione di una notizia, e si propone un metodo, di nuova e personale ideazione, per esplorare i dati precedentemente salvati e classificati. Il calcolo di indici di correlazione, l’analisi dei trend di pubblicazione, la valutazione delle anomalie e lo studio di valori in grado di fornire indicazioni sul tipo di dati raccolti, vengono rappresentati in forma grafica dal sistema, così da garantire un’interpretazione corretta e semplice all’utente. La parte finale del lavoro consiste nella valutazione dei dati, raccolti e manipolati in precedenza, al fine di poter definire la capacità di utilizzare i social network per estrarre informazioni utili nel campo dell’editoria locale.

Analisi dei social network per l'estrazione di informazioni rilevanti per l'editoria locale

SILINI, PAOLO
2015/2016

Abstract

This thesis aims at deep and accurate feasibility analysis of exploitation of social network content, especially from Twitter, to mine useful information for the local publishing industry. Based on the retrieval and analysis of the tweets related to some sample cities, the project tries to understand how valuable is the retrieved data. The work focused on determining the quality of the contents, in other words if they’re relevant or not to extract a piece of news. A new and customized method is defined and applied for this, covering the classification by relevance, the calculation of correlation indexes with respect to various context variables, the publication trend analysis, the anomaly detection and the study of other dimensions that are potentially able to provide more precise information. Results are then displayed through a customized visual presentation, which also grants explorability of the results. The work is completed by an experimental evaluation on a set of local areas, with real data.
ING - Scuola di Ingegneria Industriale e dell'Informazione
28-apr-2016
2015/2016
Questo lavoro di tesi si propone di fornire un’analisi dettagliata ed approfondita della possibilità di sfruttare i social network, in particolare Twitter, per estrarre informazioni utili nell’ambito dell’editoria locale. Basandosi sulla raccolta e sull’analisi dei tweet relativi all’intero anno 2015 per alcune municipalità campione, si mira a capire se la mole di dati recuperata è significativa ai fini analitici. Durante il corso del lavoro si valuta la qualità dei contenuti, ovvero se sono rilevanti o meno al fine della costruzione di una notizia, e si propone un metodo, di nuova e personale ideazione, per esplorare i dati precedentemente salvati e classificati. Il calcolo di indici di correlazione, l’analisi dei trend di pubblicazione, la valutazione delle anomalie e lo studio di valori in grado di fornire indicazioni sul tipo di dati raccolti, vengono rappresentati in forma grafica dal sistema, così da garantire un’interpretazione corretta e semplice all’utente. La parte finale del lavoro consiste nella valutazione dei dati, raccolti e manipolati in precedenza, al fine di poter definire la capacità di utilizzare i social network per estrarre informazioni utili nel campo dell’editoria locale.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
TESI.pdf

non accessibile

Descrizione: Testo della Tesi
Dimensione 4.44 MB
Formato Adobe PDF
4.44 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/119364