Wikipedia is a free encyclopaedia that anyone can edit and it is currently one of the main sources of online information. Users of Wikipedia only read the latest version of the article they have looked up, but in fact behind each entry there is much more to discover. It is indeed possible to reach the edit history of an article, its talk pages and other administrative spaces, which are actually not easily accessible in general. The analysis of these pages shows how the creation of collaborative contents inevitably leads different points of view to a clash. To better analyze the major controversies, we can take advantage of a tool called Contropedia, which identifies the terms that are more controversial within a given Wikipedia page, that is those that have been revised the most. But do such content disputes reflect a wider cultural difference and harsh social debate? Since both Wikipedia and Contropedia make their contents available in different languages, each independent and non-homologated to the others, comparing the controversial elements of an entry to its equivalent in another language can be very interesting to us. This way, we can study how and how much the cultural and linguistic background influences the writing of an article and the debates it inspires. The aim of this thesis project is, therefore, to introduce a tool for cross-linguistic comparisons, which can help reading all the data that Contropedia already offers, and which can make the comparison between editions automatic and simpler. By reading an article in a given language, Wikipedia users access only part of a great amount of content and discussions, which might be existing in another language. Therefore, the final output we introduce is a visualization that, through the comparison of the same page in different languages, shows the common elements and those unique to a language.

Wikipedia è un’enciclopedia libera che chiunque può editare e, attualmente, costituisce una delle principali fonti di informazione online. Gli utenti che la consultano sono abituati a leggere solo l’ultima versione di un articolo, ma dietro ogni voce c’è molto altro. Wikipedia, infatti, rende disponibile per ogni articolo la cronologia delle modifiche, le pagine di discussione e molte altre pagine logistiche, che tuttavia non sono facilmente accessibili. Dall’analisi di queste pagine emerge a pieno come la creazione di contenuti collaborativi porti inevitabilmente a situazioni in cui differenti punti di vista arrivano a scontrarsi. Per poter analizzare meglio quali siano le controversie maggiori nei vari articoli, esiste un tool chiamato Contropedia, che identifica i termini più controversi all’interno di una determinata pagina di Wikipedia, cioè quelli che hanno subito più revisioni. Queste dispute sui contenuti possono riflettere differenze culturali e dibattiti sociali più ampi? Poiché sia Wikipedia che Contropedia rendono disponibili i loro contenuti in diverse edizioni linguistiche, ciascuna indipendente e non omologata alle altre, è interessante poter confrontare gli elementi controversi di un articolo con il suo corrispettivo in un’altra lingua. In questo modo, si può analizzare quanto il background culturale influenzi la stesura di un articolo e i dibattiti alle sue spalle. L’obiettivo di questo progetto di tesi è quindi quello di introdurre una visualizzazione per la comparazione cross-linguistica, sfruttando tutti i dati che Contropedia offre già, ma che renda il confronto tra edizioni linguistiche automatico e semplice. Si vuole evidenziare come leggendo un articolo in una lingua specifica, un utente si perda una grande quantità di contenuti e punti di vista differenti, disponibili invece in altre lingue. L’output finale è dunque una visualizzazione che, mettendo a confronto più edizioni linguistiche, mostra quali sono gli elementi controversi comuni e quali invece sono unici di una lingua.

Controversie cross-linguistiche. Esplorazione visuale dei dibattiti sociali all'interno del contesto multilinguistico di Wikipedia

Giordano, Martina
2019/2020

Abstract

Wikipedia is a free encyclopaedia that anyone can edit and it is currently one of the main sources of online information. Users of Wikipedia only read the latest version of the article they have looked up, but in fact behind each entry there is much more to discover. It is indeed possible to reach the edit history of an article, its talk pages and other administrative spaces, which are actually not easily accessible in general. The analysis of these pages shows how the creation of collaborative contents inevitably leads different points of view to a clash. To better analyze the major controversies, we can take advantage of a tool called Contropedia, which identifies the terms that are more controversial within a given Wikipedia page, that is those that have been revised the most. But do such content disputes reflect a wider cultural difference and harsh social debate? Since both Wikipedia and Contropedia make their contents available in different languages, each independent and non-homologated to the others, comparing the controversial elements of an entry to its equivalent in another language can be very interesting to us. This way, we can study how and how much the cultural and linguistic background influences the writing of an article and the debates it inspires. The aim of this thesis project is, therefore, to introduce a tool for cross-linguistic comparisons, which can help reading all the data that Contropedia already offers, and which can make the comparison between editions automatic and simpler. By reading an article in a given language, Wikipedia users access only part of a great amount of content and discussions, which might be existing in another language. Therefore, the final output we introduce is a visualization that, through the comparison of the same page in different languages, shows the common elements and those unique to a language.
ARC III - Scuola del Design
28-apr-2021
2019/2020
Wikipedia è un’enciclopedia libera che chiunque può editare e, attualmente, costituisce una delle principali fonti di informazione online. Gli utenti che la consultano sono abituati a leggere solo l’ultima versione di un articolo, ma dietro ogni voce c’è molto altro. Wikipedia, infatti, rende disponibile per ogni articolo la cronologia delle modifiche, le pagine di discussione e molte altre pagine logistiche, che tuttavia non sono facilmente accessibili. Dall’analisi di queste pagine emerge a pieno come la creazione di contenuti collaborativi porti inevitabilmente a situazioni in cui differenti punti di vista arrivano a scontrarsi. Per poter analizzare meglio quali siano le controversie maggiori nei vari articoli, esiste un tool chiamato Contropedia, che identifica i termini più controversi all’interno di una determinata pagina di Wikipedia, cioè quelli che hanno subito più revisioni. Queste dispute sui contenuti possono riflettere differenze culturali e dibattiti sociali più ampi? Poiché sia Wikipedia che Contropedia rendono disponibili i loro contenuti in diverse edizioni linguistiche, ciascuna indipendente e non omologata alle altre, è interessante poter confrontare gli elementi controversi di un articolo con il suo corrispettivo in un’altra lingua. In questo modo, si può analizzare quanto il background culturale influenzi la stesura di un articolo e i dibattiti alle sue spalle. L’obiettivo di questo progetto di tesi è quindi quello di introdurre una visualizzazione per la comparazione cross-linguistica, sfruttando tutti i dati che Contropedia offre già, ma che renda il confronto tra edizioni linguistiche automatico e semplice. Si vuole evidenziare come leggendo un articolo in una lingua specifica, un utente si perda una grande quantità di contenuti e punti di vista differenti, disponibili invece in altre lingue. L’output finale è dunque una visualizzazione che, mettendo a confronto più edizioni linguistiche, mostra quali sono gli elementi controversi comuni e quali invece sono unici di una lingua.
File allegati
File Dimensione Formato  
2021_04_Giordano.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Tesi Martina Giordano
Dimensione 17.39 MB
Formato Adobe PDF
17.39 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/173862