Recentemente nel mondo della rete si sta assistendo ad un'esplosione dei Social Media, ossia di quei servizi che permettono a qualsiasi utente di diventare, oltre che un fruitore, un creatore di informazione, rendendo il Web sempre più aperto verso i propri utilizzatori. L'analisi dei Social Media offre la possibilità di percepire quali siano gli argomenti che più attirano l'attenzione e quale sia l'opinione su di essi da parte degli utenti: analizzando le informazioni è possibile dedurre i personaggi più in voga, i cantanti più seguiti, i libri più letti, i luoghi più visitati dai turisti, etc. Il tipo di dato che meglio rappresenta questo flusso continuo di dati è lo stream. La necessità di utilizzo degli stream ha portato, agli fine degli anni novanta, allo sviluppo dei Data Stream Management System (DSMS) da parte della comunità delle basi di dati, ovvero di quei sistemi software in grado di gestire e interrogare stream di dati. Parte del nostro lavoro ha riguardato la sperimentazione di questi sistemi. Un'altra categoria di tecnologie che si stanno rivelando di crescente interesse per l'analisi dei Social Media sono quelle che appartengono alla sfera del Web Semantico. Con la nascita del Web Semantico, infatti, si è passati ad una diversa modalità di pubblicazione e fruizione dei contenuti informativi presenti sul Web che sta ulteriormente evolvendo con le potenzialità offerte dagli stream. La barriera principale che rallenta lo sviluppo di tecnologie legate all'utilizzo degli stream in associazione con il Web Semantico è l'estrema disomogeneità dei formati in cui l'informazione viene offerta all'utilizzatore finale. Lo scopo di questa tesi è stato quello di creare un metodo per analizzare e ripubblicare i dati provenienti dai Social Media in un modello semantico basato sul framework RDF e sul linguaggio ontologico RDF-S. Ciò ha dato vita a Streaming Linked Data for Social Media (in breve SLD4SM), un sistema in grado di recuperare i dati dai Social Media e di salvarli, ripubblicarli o interrogarli tramite query continue (grazie al linguaggio C-SPARQL e allo C-SPARQL Engine sviluppati dal team LarKC del Politecnico di Milano). L'analisi delle performance di efficienza ed efficacia svolta sul sistema, ci permette di affermare che SLD4SM è un framework performante, scalabile, flessibile ma soprattutto estendibile.

SLD4SM : un ambiente integrato per la gestione di stream di social media tramite linked data

BRATOMI, MIRKO;BALDUINI, MARCO
2010/2011

Abstract

Recentemente nel mondo della rete si sta assistendo ad un'esplosione dei Social Media, ossia di quei servizi che permettono a qualsiasi utente di diventare, oltre che un fruitore, un creatore di informazione, rendendo il Web sempre più aperto verso i propri utilizzatori. L'analisi dei Social Media offre la possibilità di percepire quali siano gli argomenti che più attirano l'attenzione e quale sia l'opinione su di essi da parte degli utenti: analizzando le informazioni è possibile dedurre i personaggi più in voga, i cantanti più seguiti, i libri più letti, i luoghi più visitati dai turisti, etc. Il tipo di dato che meglio rappresenta questo flusso continuo di dati è lo stream. La necessità di utilizzo degli stream ha portato, agli fine degli anni novanta, allo sviluppo dei Data Stream Management System (DSMS) da parte della comunità delle basi di dati, ovvero di quei sistemi software in grado di gestire e interrogare stream di dati. Parte del nostro lavoro ha riguardato la sperimentazione di questi sistemi. Un'altra categoria di tecnologie che si stanno rivelando di crescente interesse per l'analisi dei Social Media sono quelle che appartengono alla sfera del Web Semantico. Con la nascita del Web Semantico, infatti, si è passati ad una diversa modalità di pubblicazione e fruizione dei contenuti informativi presenti sul Web che sta ulteriormente evolvendo con le potenzialità offerte dagli stream. La barriera principale che rallenta lo sviluppo di tecnologie legate all'utilizzo degli stream in associazione con il Web Semantico è l'estrema disomogeneità dei formati in cui l'informazione viene offerta all'utilizzatore finale. Lo scopo di questa tesi è stato quello di creare un metodo per analizzare e ripubblicare i dati provenienti dai Social Media in un modello semantico basato sul framework RDF e sul linguaggio ontologico RDF-S. Ciò ha dato vita a Streaming Linked Data for Social Media (in breve SLD4SM), un sistema in grado di recuperare i dati dai Social Media e di salvarli, ripubblicarli o interrogarli tramite query continue (grazie al linguaggio C-SPARQL e allo C-SPARQL Engine sviluppati dal team LarKC del Politecnico di Milano). L'analisi delle performance di efficienza ed efficacia svolta sul sistema, ci permette di affermare che SLD4SM è un framework performante, scalabile, flessibile ma soprattutto estendibile.
BARBIERI, DAVIDE FRANCESCO
ING V - Scuola di Ingegneria dell'Informazione
20-lug-2011
2010/2011
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2011_07_Balduini_Bratomi.PDF

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 4.37 MB
Formato Adobe PDF
4.37 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/20582