In the last decade, the spread of social media has disrupted the typical news flow, shifting the role of news content producer from traditional news sources, e.g. newspapers and television, to social platforms. This lead social media, such as Facebook and Twitter, to become the main source of news online with more than 2.4 billion internet users. The main drawback of this new multi-directional flow of information is that it lacks one of the fundamentals steps of the typical editorial process, which is fact-checking. The large spread of low quality information poses several threats to our everyday society and democracy. Therefore, the problem of detecting fake news on social media has drawn global attention. One of the key difficulties in detecting fake news lies in the nature of its content, which is intentionally deceptive, thus the exclusive use of text in combination with existing algorithms is ineffective. For this reason, this thesis focuses on an extended set of features that entail social information, such as user social engagement and news diffusion, with the goal of displaying the different contributions that various features have in the detection task. In addition, given the nature of social platforms, this work proposes a new representation that models the relationship among users and articles as a graph and frames the task of classifying fake news as a node classification problem using graph neural network.

Nell'ultimo decennio la diffusione dei social media ha modificato radicalmente il processo comunicativo, portando i social ad avere il ruolo che una volta avevano le fonti di notizie come ad esempio i giornali e le televisioni. Questo ha fatto si che social media come Facebook e Twitter siano diventati le principali fonti di notizie per molte persone, infatti basti pensare che circa 2.4 miliardi di utenti utilizzano giornalmente tali piattaforme. Il principale svantaggio di questo nuovo flusso multi-direzionale delle informazioni è dato dal venir meno di uno dei passaggi fondamentali del classico lavoro editoriale, ovvero la verifica dei fatti e delle fonti. La vasta diffusione di notizie di bassa e dubbia qualità fa sorgere alcuni pericoli per quanto riguarda sia la nostra società che la nostra democrazia. Pertanto, il problema relativo all'identificazione delle fake news sui social media ha catturato l'attenzione mondiale. Una delle difficoltà principali nel trovare le fake news è intrinseca nella natura stessa della notizia, in quanto questa è scritta di modo tale da fuorviare il lettore. Ciò fa si che l'utilizzo di tecniche classiche, basate esclusivamente sul contenuto testuale della notizia, non risulti essere efficace in questo caso. Per questo motivo questo lavoro di tesi considera come possibili caratteristiche discriminanti degli aspetti che coinvolgano anche la parte social, come ad esempio l'attività dell'utente e la diffusione delle notizie. Lo scopo è quello di rendere evidente quali siano i vari contributi che queste diverse caratteristiche apportano al problema dell'identificazione delle fake news. Inoltre, data la natura delle piattaforme social, questo lavoro propone una nuova formulazione del problema che modella le relazioni tra utenti e articoli per mezzo di un grafo, e riconduce il problema di scovare le fake news a quello di classificare i nodi di un grafo per mezzo delle graph neural networks.

Text-based and graph-based analysis for fake news detection on social media

NASCA, ENNIO
2018/2019

Abstract

In the last decade, the spread of social media has disrupted the typical news flow, shifting the role of news content producer from traditional news sources, e.g. newspapers and television, to social platforms. This lead social media, such as Facebook and Twitter, to become the main source of news online with more than 2.4 billion internet users. The main drawback of this new multi-directional flow of information is that it lacks one of the fundamentals steps of the typical editorial process, which is fact-checking. The large spread of low quality information poses several threats to our everyday society and democracy. Therefore, the problem of detecting fake news on social media has drawn global attention. One of the key difficulties in detecting fake news lies in the nature of its content, which is intentionally deceptive, thus the exclusive use of text in combination with existing algorithms is ineffective. For this reason, this thesis focuses on an extended set of features that entail social information, such as user social engagement and news diffusion, with the goal of displaying the different contributions that various features have in the detection task. In addition, given the nature of social platforms, this work proposes a new representation that models the relationship among users and articles as a graph and frames the task of classifying fake news as a node classification problem using graph neural network.
ING - Scuola di Ingegneria Industriale e dell'Informazione
3-ott-2019
2018/2019
Nell'ultimo decennio la diffusione dei social media ha modificato radicalmente il processo comunicativo, portando i social ad avere il ruolo che una volta avevano le fonti di notizie come ad esempio i giornali e le televisioni. Questo ha fatto si che social media come Facebook e Twitter siano diventati le principali fonti di notizie per molte persone, infatti basti pensare che circa 2.4 miliardi di utenti utilizzano giornalmente tali piattaforme. Il principale svantaggio di questo nuovo flusso multi-direzionale delle informazioni è dato dal venir meno di uno dei passaggi fondamentali del classico lavoro editoriale, ovvero la verifica dei fatti e delle fonti. La vasta diffusione di notizie di bassa e dubbia qualità fa sorgere alcuni pericoli per quanto riguarda sia la nostra società che la nostra democrazia. Pertanto, il problema relativo all'identificazione delle fake news sui social media ha catturato l'attenzione mondiale. Una delle difficoltà principali nel trovare le fake news è intrinseca nella natura stessa della notizia, in quanto questa è scritta di modo tale da fuorviare il lettore. Ciò fa si che l'utilizzo di tecniche classiche, basate esclusivamente sul contenuto testuale della notizia, non risulti essere efficace in questo caso. Per questo motivo questo lavoro di tesi considera come possibili caratteristiche discriminanti degli aspetti che coinvolgano anche la parte social, come ad esempio l'attività dell'utente e la diffusione delle notizie. Lo scopo è quello di rendere evidente quali siano i vari contributi che queste diverse caratteristiche apportano al problema dell'identificazione delle fake news. Inoltre, data la natura delle piattaforme social, questo lavoro propone una nuova formulazione del problema che modella le relazioni tra utenti e articoli per mezzo di un grafo, e riconduce il problema di scovare le fake news a quello di classificare i nodi di un grafo per mezzo delle graph neural networks.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
thesis.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 1.61 MB
Formato Adobe PDF
1.61 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/149908