Federated learning in privacy-preserving indoor localization

Classic centralized training represents a basic assumption of many projects involving Machine Learning models: the model has raw data at its disposal within the machine in which it is deployed. However, this assumption presents one crucial limitation: what if the model needs data located elsewhere? Decentralized Machine Learning techniques come to help for this purpose. And what if these remote data are not easily accessible and cannot be exchanged (e.g., for privacy or law issues)? These requirements gave birth to a recent decentralized approach to Machine Learning: Federated Learning. This thesis work presents a thorough description of what Federated Learning is and how it works, and an engineering problem wherein it can be applied: indoor localization via Wi-Fi fingerprinting. In the setting of a regression task wherein a RSS or a MAC vector is inputted in order for the neural network in question to predict the spatial coordinates of a data point, the goal of this work is to observe whether Federated Learning can yield similar or contextually better results than standard Centralized Learning. The purpose behind this objective is to make use of all the advantages of this recent framework (e.g., less heavy data storage unloaded on more clients instead of a single one, no need to ex- change raw data), and potentially create more efficient algorithm variants starting from its standard version.

L’apprendimento centralizzato classico rappresenta una precondizione di base di molti progetti che fanno uso di modelli di Machine Learning: il modello in questione ha a disposizione dati grezzi all’interno del dispositivo in cui è impiegato, e con essi viene allenato. Tuttavia, questa precondizione presenta una cruciale limitazione: cosa succede se il modello ha bisogno di dati localizzati altrove? A tal proposito vengono in aiuto le tecniche decentralizzate di Machine Learning. E se questi dati da remoto non sono facilmente accessibili e non possono essere scambiati (ad esempio, per ragioni legali o di privacy)? Questi requisiti hanno gettato le basi per una tecnica decentralizzata di Machine Learning di recente origine: l’apprendimento federato (conosciuto col nome di Federated Learning). Questo lavoro di tesi presenta una scrupolosa descrizione di che cos’è l’apprendimento fed- erato e come funziona, e un problema ingegneristico nel quale esso può essere applicato: la localizzazione al chiuso mediante Wi-Fi fingerprinting. Nella cornice di un problema di regressione nel quale un vettore RSS o MAC viene fornito come input per predire le coor- dinate spaziali di un punto, l’obiettivo di questo lavoro è di osservare se l’apprendimento federato può fornire risultati simili o contestualmente migliori rispetto alle classiche tec- niche di apprendimento centralizzato. Il motivo dietro a quest’obiettivo è di far uso di tutti i vantaggi di questo framework (per esempio, un carico computazionale inferiore e scaricato su più clienti piuttosto che su uno solo, la mancata necessità di scambiare dati grezzi), ed eventualmente creare varianti più efficienti dell’algoritmo a partire dalla sua versione standard.