Privacy-preserving service delivery in Internet

Today’s Internet is a complex system through which users are provided with the most varied services. Internet is composed of several different and (generally) independent entities, such as Internet Service Providers (ISPs), Content Providers (CPs) and Online Social Network Providers (OSNs) that cooperate to deliver services to final users. For instance, ISPs deliver to final users the Internet traffic that carries the contents (e.g., a movie) that is originally hosted in a data center owned by a CP. By exploiting several enabling technologies (e.g., in-network caching) and the different information the involved entities have (e.g., about the final users and the network infrastructures), this cooperation can be taken even further to improve the QoE perceived by users. For instance, the ISP can maintain cache servers within its network and make the CP remotely manage them (e.g., by selecting the most popular contents worth caching), thus reducing contents’ retrieval latency and network congestion probability. Whilst being beneficial to all the involved parties, such improved cooperation may require the exposition of sensitive and business-critical information (e.g., about network infrastructure) that raises severe privacy concerns. The overall objective of this research is the development of methodologies to enable the main Internet players to cooperate and exchange information for realizing improved services while fulfilling their privacy requirements. In general terms, guaranteeing privacy comes at the expenses of service effectiveness degradation and/or at the cost of introducing a non-negligible overhead of data exchanged between the cooperating parties. In this thesis, we propose feasible and readily applicable privacy-preserving solutions for several Internet-based services, such as video content delivery and online social networking. Firstly, we focus on the application of video contents' caching strategies jointly performed by ISPs and CPs. We design privacy-preserving protocols based on data perturbation and secure multiparty computation to ensure caching effectiveness (e.g., maximization of hit-ratio and minimization of retrieval latency) while guaranteeing that sensitive information are not disclosed (e.g., contents' popularity, users' requests and locations are only known to the legitimate party). Then, we also propose a protocol based on Shamir Secret Sharing (SSS) to realize caching strategies that are both privacy-preserving and compliant with Network Neutrality principles. Moreover, we propose a machine-learning-based tool that Twitter users can employ to measure the vulnerability to attacks aimed at inferring their location from publicly-available data. This tool also allows to quantitatively evaluate the effects that several factors (e.g., the frequency of exposition of location data) have on users' privacy, thus enabling their proper control. Finally, we study the problem of optimally deploying a virtual graph over a wide-area network composed of several independent and mutually-distrustful ISPs. We develop a reinforcement learning algorithm based on SSS which is capable to effectively deploy the virtual graph while not requiring the exposition of salient infrastructural information (e.g., cost of embedding into the physical nodes).

Oggigiorno, Internet è un sistema complesso attraverso il quale gli utenti hanno accesso ai servizi più svariati. Internet è composto da entità diverse e (generalmente) indipendenti, quali gli Internet Service Providers (ISPs), i Content Providers (CPs) e gli Online Social Network Providers (OSNs), che cooperano per portare il servizio agli utenti finali. Per esempio, gli ISPs consegnano agli utenti finali i contenuti (e.g., un film) che sono originariamente mantenuti in un data ceter posseduto da un CP. Sfruttando varie technologie abilitanti (e.g., in-network caching) e le diverse informazioni che le entità coinvolte hanno (e.g., sugli utenti finali e sulle infrastrutture di rete), questa cooperazione può essere ulteriormente migliorata al fine di incrementare la QoE percepita dagli utenti. Per esempio, l'ISP può mantenere delle caches all'interno della propria rete e permettere al CP di gestirle da remoto (e.g., selezionando i contenuti più popolari che sono meritevoli di essere memorizzati), portando così ad una riduzione sia della latenza nella consegna dei contenuti che della probabilità di congestione all'interno della rete. Pur beneficiando tutte le entità coinvolte, il miglioramento di questa cooperazione può richiedere l'esposizione di informazioni sensibili e critiche in termini di business (e.g., in merito all'infrastruttura di rete), e questo genera gravi problemi di privacy. L'obiettivo generale di questa ricerca è lo sviluppo di metodologie che consentano ai principali attori in Internet di cooperare e scambiare informazioni al fine di realizzare servizi migliori e al contempo rispettare i propri requisiti di privacy. In termini generali, garantire la privacy porta al peggioramento dell'efficacia del servizio e/o all'introduzione di un significativo overhead di dati scambiati tra le parti coinvolte. In questa tesi proponiamo soluzioni privacy-preserving facilmente applicabili a svariati servizi Internet, quali la video content delivery e l'online social networking. Inizialmente ci concentriamo sull'applicazione di strategie di caching di contenuti video realizzate coingiuntamente da ISPs e CPs. Progettiamo protocolli privacy-preserving basati su data perturbation e secure multiparty computation per garantire sia l'efficacia del caching (e.g., massimizzazione dell'hit-ratio e minimizzazione della latenza nella consegna) che la protezione di informazioni sensibili (e.g., la popolarità dei contenuti, le richieste e le posizioni geograpiche degli utenti rimangono noti soltanto all'entità legittima). In seguito proponiamo anche un protocollo basato sullo schema di Shamir Secret Sharing (SSS) per realizzare strategie di caching che siano sia privacy-preserving che conformi ai principi della Neutralità della Rete. Inoltre, proponiamo uno strumento basato sul machine learning che gli utenti Twitter possono usare per misurare la vulnerabilità agli attacchi mirati ad inferire la loro posizione a partire da dati pubblici. Questo strumento consente anche di valutare quantitativamente gli effetti che svariati fattori (e.g., la frequenza di esposizioe dell'informazione sulla propria posizione) hanno sulla privacy degli utenti, in modo tale da consentirne un controllo efficace. Infine, studiamo il problema della distribuzione ottima di un grafo virtuale su di una wide-area network composta da svariati ISPs indipendenti e reciprocamente diffidenti. Sviluppiamo un algoritmo di reinforcement learning basato su SSS che è in grado di distribuire efficamente il grafo virtuale senza bisogno che vengano esposte informazioni infrastrutturali salienti (e.g., il costo dell'embedding all'interno dei nodi fisici).

Privacy-preserving service delivery in Internet

ANDREOLETTI, DAVIDE

Abstract

Today’s Internet is a complex system through which users are provided with the most varied services. Internet is composed of several different and (generally) independent entities, such as Internet Service Providers (ISPs), Content Providers (CPs) and Online Social Network Providers (OSNs) that cooperate to deliver services to final users. For instance, ISPs deliver to final users the Internet traffic that carries the contents (e.g., a movie) that is originally hosted in a data center owned by a CP. By exploiting several enabling technologies (e.g., in-network caching) and the different information the involved entities have (e.g., about the final users and the network infrastructures), this cooperation can be taken even further to improve the QoE perceived by users. For instance, the ISP can maintain cache servers within its network and make the CP remotely manage them (e.g., by selecting the most popular contents worth caching), thus reducing contents’ retrieval latency and network congestion probability. Whilst being beneficial to all the involved parties, such improved cooperation may require the exposition of sensitive and business-critical information (e.g., about network infrastructure) that raises severe privacy concerns. The overall objective of this research is the development of methodologies to enable the main Internet players to cooperate and exchange information for realizing improved services while fulfilling their privacy requirements. In general terms, guaranteeing privacy comes at the expenses of service effectiveness degradation and/or at the cost of introducing a non-negligible overhead of data exchanged between the cooperating parties. In this thesis, we propose feasible and readily applicable privacy-preserving solutions for several Internet-based services, such as video content delivery and online social networking. Firstly, we focus on the application of video contents' caching strategies jointly performed by ISPs and CPs. We design privacy-preserving protocols based on data perturbation and secure multiparty computation to ensure caching effectiveness (e.g., maximization of hit-ratio and minimization of retrieval latency) while guaranteeing that sensitive information are not disclosed (e.g., contents' popularity, users' requests and locations are only known to the legitimate party). Then, we also propose a protocol based on Shamir Secret Sharing (SSS) to realize caching strategies that are both privacy-preserving and compliant with Network Neutrality principles. Moreover, we propose a machine-learning-based tool that Twitter users can employ to measure the vulnerability to attacks aimed at inferring their location from publicly-available data. This tool also allows to quantitatively evaluate the effects that several factors (e.g., the frequency of exposition of location data) have on users' privacy, thus enabling their proper control. Finally, we study the problem of optimally deploying a virtual graph over a wide-area network composed of several independent and mutually-distrustful ISPs. We develop a reinforcement learning algorithm based on SSS which is capable to effectively deploy the virtual graph while not requiring the exposition of salient infrastructural information (e.g., cost of embedding into the physical nodes).

Scheda breve

Scheda completa

	Relatore
	
				TORNATORE, MASSIMO
			
	Coordinatore
	
				PERNICI, BARBARA
			
	Tutor
	
				CESANA, MATTEO
			
	Correlatore/i
	
				GIORDANO, SILVIA
			
	Data
	
				14-feb-2020
			
	Abstract in italiano
	
				Oggigiorno, Internet è un sistema complesso attraverso il quale gli utenti hanno accesso ai servizi più svariati. Internet è composto da entità diverse e (generalmente) indipendenti, quali gli Internet Service Providers (ISPs), i Content Providers (CPs) e gli Online Social Network Providers (OSNs), che cooperano per 
portare il servizio agli utenti finali. Per esempio, gli ISPs consegnano agli utenti finali i contenuti (e.g., un film) che sono originariamente mantenuti in un data ceter posseduto da un CP. Sfruttando varie technologie abilitanti (e.g., in-network caching) e le diverse informazioni che le entità coinvolte hanno (e.g., sugli utenti finali e sulle infrastrutture di rete), questa cooperazione può essere ulteriormente migliorata al fine di incrementare la QoE percepita dagli utenti. Per esempio, l'ISP può mantenere delle caches all'interno della propria rete e permettere al CP di gestirle da remoto (e.g., selezionando i contenuti più popolari che sono meritevoli di essere memorizzati), portando così ad una riduzione sia della latenza nella consegna dei contenuti che della probabilità di congestione all'interno della rete. Pur beneficiando tutte le entità coinvolte, il miglioramento di questa cooperazione può richiedere l'esposizione di informazioni sensibili e critiche in termini di business (e.g., in merito all'infrastruttura di rete), e questo genera gravi problemi di privacy. L'obiettivo generale di questa ricerca è lo sviluppo di metodologie che consentano ai principali attori in Internet di cooperare e scambiare informazioni al fine di realizzare servizi migliori e al contempo rispettare i propri requisiti di privacy. In termini generali, garantire la privacy porta al peggioramento dell'efficacia del servizio e/o all'introduzione di un significativo overhead di dati scambiati tra le parti coinvolte. In questa tesi proponiamo soluzioni privacy-preserving facilmente applicabili a svariati servizi Internet, quali la video content delivery e l'online social networking. Inizialmente ci concentriamo sull'applicazione di strategie di caching di contenuti video realizzate coingiuntamente da ISPs e CPs. Progettiamo protocolli privacy-preserving basati su data perturbation e secure multiparty computation per garantire sia l'efficacia del caching (e.g., massimizzazione dell'hit-ratio e minimizzazione della latenza nella consegna) che la protezione di informazioni sensibili (e.g., la popolarità dei contenuti, le richieste e le posizioni geograpiche degli utenti rimangono noti soltanto all'entità legittima). In seguito proponiamo anche un protocollo basato sullo schema di Shamir Secret Sharing (SSS) per realizzare strategie di caching che siano sia privacy-preserving che conformi ai principi della Neutralità della Rete. Inoltre, proponiamo uno strumento basato sul machine learning che gli utenti Twitter possono usare per misurare la vulnerabilità agli attacchi mirati ad inferire la loro posizione a partire da dati pubblici. Questo strumento consente anche di valutare quantitativamente gli effetti che svariati fattori (e.g., la frequenza di esposizioe dell'informazione sulla propria posizione) hanno sulla privacy degli utenti, in modo tale da consentirne un controllo efficace. Infine, studiamo il problema della distribuzione ottima di un grafo virtuale su di una wide-area network composta da svariati ISPs indipendenti e reciprocamente diffidenti. Sviluppiamo un algoritmo di reinforcement learning basato su SSS che è in grado di distribuire efficamente il grafo virtuale senza bisogno che vengano esposte informazioni infrastrutturali salienti (e.g., il costo dell'embedding all'interno dei nodi fisici).
			
	Tipo di documento
	
				Tesi di dottorato
			
	Appare nelle tipologie:
	
				Tesi di Dottorato

File allegati

File	Dimensione	Formato
PhD_Thesis_Andreoletti_Final.pdf Open Access dal 24/01/2021 Dimensione 6.58 MB Formato Adobe PDF Visualizza/Apri	6.58 MB	Adobe PDF	Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/152299