In this thesis I've decided to consider and analyze some ethical aspects that were encountered during data extraction; specifically, I've proposed a comparison between fairness and diversity. The general idea that you have when expressing a query we generally wish to obtain a result which is fair. Making a fair choice implies impartiality, therefore discrimination or prejudice, one of the most important causes of unfairness, should be avoided. The definition of fairness referred to is that of group fairness; we have presented the main characteristics, measures and technical solutions in order to assess how fair a choice is. An alternative definition of fairness will be proposed in Chapter 4, where we will discuss diversity. Diversity is closely linked to the differences among elements of a dataset compared to others; diversity is linked to the concept of novelty. As for fairness, the same holds for diversity: the discussion will focus on technical measures and solutions. Problems related to being fair in data extraction are presented in Chapter 3, when I define unfairness. In conclusion, I present an application in social networks to evaluate fairness and diversity.
In questo elaborato si è deciso di considerare ed analizzare alcuni aspetti etici che si incontrano durante l'estrazione di dati; nello specifico si propone un confronto tra fairness e diversity. L'idea generale che si ha quando si vuole esprimere una query è quella di ottenere un risultato che sia fair. Essere fair nella scelta significa operare con equità e imparzialità, evitando ad esempio le discriminazioni o i pregiudizi, una delle cause più importanti dell'unfairness. La definizione di fair a cui si farà riferimento è quella di group fairness; inoltre, per quanto riguarda la fairness si presenteranno le principali caratteristiche, misure e soluzioni tecniche per valutare quanto si è fair nella scelta. Una definizione alternativa di fairness si proporrà nel Capitolo 4, dove si parlerà di diversity. La diversity è strettamente legata alle differenze di ciascun elemento di un dataset rispetto agli altri; parlando di diversity ci si lega al concetto di novità (novelty). Come per la fairness, anche nel caso della diversity, la trattazione si concentrerà sulle misure e soluzioni tecniche. Vengono inoltre presentati dei problemi legati al cercare di essere fair nell'estrazione di dati, come l'unfairness, oppure delle applicazioni nella valutazione della diversity nelle reti sociali.
Metodi e tecniche per garantire la fairness e la diversity nell'estrazione di dati : un confronto
TATTI, ALESSANDRO
2017/2018
Abstract
In this thesis I've decided to consider and analyze some ethical aspects that were encountered during data extraction; specifically, I've proposed a comparison between fairness and diversity. The general idea that you have when expressing a query we generally wish to obtain a result which is fair. Making a fair choice implies impartiality, therefore discrimination or prejudice, one of the most important causes of unfairness, should be avoided. The definition of fairness referred to is that of group fairness; we have presented the main characteristics, measures and technical solutions in order to assess how fair a choice is. An alternative definition of fairness will be proposed in Chapter 4, where we will discuss diversity. Diversity is closely linked to the differences among elements of a dataset compared to others; diversity is linked to the concept of novelty. As for fairness, the same holds for diversity: the discussion will focus on technical measures and solutions. Problems related to being fair in data extraction are presented in Chapter 3, when I define unfairness. In conclusion, I present an application in social networks to evaluate fairness and diversity.File | Dimensione | Formato | |
---|---|---|---|
tesi.pdf
accessibile in internet per tutti
Descrizione: Testo della tesi
Dimensione
3.2 MB
Formato
Adobe PDF
|
3.2 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/144755