The digital revolution has changed societies across the globe, making personal data an extremely valuable asset. In such a context, protecting individual privacy is a key need, especially when dealing with sensitive information, such as political preferences. Open data plays a fundamental role in the 21th century economy with effects on the social sector. However, it is always challenging to create new high-quality datasets especially because of the privacy guarantees that most of the information requires. The objective of this thesis is to develop a privacy-preserving mechanism able to anonymize personal data and eventually release it as open data. The mechanism protects the individuality of the users through a strict definition of privacy called differential privacy. We proved that it is possible to release anonymized data that preserve utility for different use cases such as time-series or discrete data. Finally, we verified that differential privacy has an important impact in the protection of a model against the state of the art attacks, such as membership inference attacks.

La rivoluzione digitale ha profondamente cambiato la società del nostro pianeta rendendo i dati personali una risorsa estremamente importante. In questo contesto, sviluppare delle tecniche di privacy che proteggano le informazioni personali degli utenti è una necessità primaria. Gli open data svolgono un ruolo fondamentale nella nostra economia avendo un’ influenza diretta nel settore sociale. E’ però complesso generare nuovi open data evitando di includere informazioni sensibili ma al tempo stesso mantenendo i dati utili. L’ obiettivo di questa tesi è quello di sviluppare un meccanismo di anonimzzazione dei dati che permetta di anonimizzare un dataset che può essere eventualmente rilasciato come open data. Il meccanismo è basato su una solida definizione di privacy, chiamata privacy differenziale, che garantisce una serie di importanti proprietà matematiche. Siamo stati in grado di verificare che è possibile rilasciare dataset anonimizzati preservandone l’ utilità e focalizzandoci su time-series e dati discreti. Infine, abbiamo provato che la privacy differenziale offre importante benefici contro gli attacchi più ricorrenti come i membership inference attacks.

Data anonymization through generative adversarial networks in the differential privacy scenario

FRIGERIO, LORENZO
2017/2018

Abstract

The digital revolution has changed societies across the globe, making personal data an extremely valuable asset. In such a context, protecting individual privacy is a key need, especially when dealing with sensitive information, such as political preferences. Open data plays a fundamental role in the 21th century economy with effects on the social sector. However, it is always challenging to create new high-quality datasets especially because of the privacy guarantees that most of the information requires. The objective of this thesis is to develop a privacy-preserving mechanism able to anonymize personal data and eventually release it as open data. The mechanism protects the individuality of the users through a strict definition of privacy called differential privacy. We proved that it is possible to release anonymized data that preserve utility for different use cases such as time-series or discrete data. Finally, we verified that differential privacy has an important impact in the protection of a model against the state of the art attacks, such as membership inference attacks.
ROUDIER, YVES
SANTANA DE OLIVEIRA, ANDERSON
ING - Scuola di Ingegneria Industriale e dell'Informazione
3-ott-2018
2017/2018
La rivoluzione digitale ha profondamente cambiato la società del nostro pianeta rendendo i dati personali una risorsa estremamente importante. In questo contesto, sviluppare delle tecniche di privacy che proteggano le informazioni personali degli utenti è una necessità primaria. Gli open data svolgono un ruolo fondamentale nella nostra economia avendo un’ influenza diretta nel settore sociale. E’ però complesso generare nuovi open data evitando di includere informazioni sensibili ma al tempo stesso mantenendo i dati utili. L’ obiettivo di questa tesi è quello di sviluppare un meccanismo di anonimzzazione dei dati che permetta di anonimizzare un dataset che può essere eventualmente rilasciato come open data. Il meccanismo è basato su una solida definizione di privacy, chiamata privacy differenziale, che garantisce una serie di importanti proprietà matematiche. Siamo stati in grado di verificare che è possibile rilasciare dataset anonimizzati preservandone l’ utilità e focalizzandoci su time-series e dati discreti. Infine, abbiamo provato che la privacy differenziale offre importante benefici contro gli attacchi più ricorrenti come i membership inference attacks.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2018_09_Frigerio.pdf

non accessibile

Descrizione: Tesi
Dimensione 3.06 MB
Formato Adobe PDF
3.06 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/143368