The main goal of this Ph.D. research is the development of advanced data analysis tools for mobility data to study human mobility from an innovative privacy-preserving perspective. The theme of privacy is the core of this work. Recent years have seen an increase in the concern in both government institutions and research institutes for sensitive information disclosure, accentuating the need for new methodologies for analyzing data in privacy compliance. In the world of mobility, this is even more evident given the data variety and data complexity, which often make anonymization techniques ineffective. In this thesis, therefore, the aim is to bring the issue of privacy back to center stage in the analysis of mobility data, with the primary goal of bringing clarity to which data are available and what level of privacy risk they have associated. This is done by providing examples of mobility data sources and suggesting a classification based on their potential privacy risks, i.e., between naturally anonymized and user specific data. Then, real-life mobility problems are tackled by proposing new statistical methods and innovative pipelines for three mobility data analyses. Automatic Passenger Counting (APC) data are the input of an in-depth investigation of public transport usage rates, with focus on the critical situations of low occupancy rates (see Chapter 2). Then, through GPS data, accessibility maps to university campuses are built, measuring the aggregated mobility in urban areas, and applied in the examination of the impact of commuting time on students' performance (see Chapter 3). Finally, a new method for synthetic functional data generation is proposed to obtain synthetic traces from user specific GPS trajectories (see Chapter 4).
L'obiettivo principale di questo dottorato di ricerca è lo sviluppo di strumenti avanzati di analisi dei dati di mobilità per studiare la mobilità umana da una prospettiva innovativa che preservi la privacy. Il tema della privacy è al centro di questo lavoro. Negli ultimi anni è aumentata la preoccupazione delle istituzioni governative e degli istituti di ricerca per la divulgazione di informazioni sensibili, accentuando la necessità di nuove metodologie per l'analisi dei dati nel rispetto della privacy. Nel mondo della mobilità, ciò è ancora più evidente data la varietà e la complessità dei dati, che spesso rendono inefficaci le tecniche di anonimizzazione. In questa tesi, quindi, si vuole riportare il tema della privacy al centro dell'analisi dei dati di mobilità, con l'obiettivo primario di fare chiarezza su quali dati siano disponibili e quale sia il livello di rischio per la privacy ad essi associato. A tal fine, vengono forniti esempi di fonti di dati sulla mobilità e viene proposta una classificazione basata sui loro potenziali rischi per la privacy, ossia tra dati naturalmente anonimizzati e dati specifici dell'utente. In seguito, vengono affrontati i problemi di mobilità della vita reale, proponendo nuovi metodi statistici e pipeline innovative per l'analisi di tre dati sulla mobilità. I dati del Conteggio Automatico dei Passeggeri (APC) sono l'input di un'indagine approfondita sui tassi di utilizzo del trasporto pubblico, con particolare attenzione alle situazioni critiche di basso tasso di occupazione (vedi capitolo 2). Poi, attraverso i dati GPS, sono state costruite mappe di accessibilità ai campus universitari, misurando la mobilità aggregata nelle aree urbane, e sono state applicate nell'esame dell'impatto del tempo di viaggio sul rendimento degli studenti (vedi capitolo 3). Infine, viene proposto un nuovo metodo per la generazione di dati funzionali sintetici per ottenere tracce sintetiche da traiettorie GPS specifiche dell'utente (vedi capitolo 4).
Privacy-preserving data analysis of location data for the design of human mobility services and infrastructures
Burzacchi, Arianna
2024/2025
Abstract
The main goal of this Ph.D. research is the development of advanced data analysis tools for mobility data to study human mobility from an innovative privacy-preserving perspective. The theme of privacy is the core of this work. Recent years have seen an increase in the concern in both government institutions and research institutes for sensitive information disclosure, accentuating the need for new methodologies for analyzing data in privacy compliance. In the world of mobility, this is even more evident given the data variety and data complexity, which often make anonymization techniques ineffective. In this thesis, therefore, the aim is to bring the issue of privacy back to center stage in the analysis of mobility data, with the primary goal of bringing clarity to which data are available and what level of privacy risk they have associated. This is done by providing examples of mobility data sources and suggesting a classification based on their potential privacy risks, i.e., between naturally anonymized and user specific data. Then, real-life mobility problems are tackled by proposing new statistical methods and innovative pipelines for three mobility data analyses. Automatic Passenger Counting (APC) data are the input of an in-depth investigation of public transport usage rates, with focus on the critical situations of low occupancy rates (see Chapter 2). Then, through GPS data, accessibility maps to university campuses are built, measuring the aggregated mobility in urban areas, and applied in the examination of the impact of commuting time on students' performance (see Chapter 3). Finally, a new method for synthetic functional data generation is proposed to obtain synthetic traces from user specific GPS trajectories (see Chapter 4).File | Dimensione | Formato | |
---|---|---|---|
BurzacchiArianna_thesis_final3.pdf
accessibile in internet per tutti a partire dal 23/01/2028
Descrizione: PhD thesis
Dimensione
23.78 MB
Formato
Adobe PDF
|
23.78 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/232752