One of the main issues related to the growth of large cities around the world is the management of mobility. Understanding how, when and why people move is crucial to avoid issues such as heavy traffic and overcrowding of public means, especially in developing countries. Several projects were born in this direction, including Safari Njema, an interdisciplinary project of the Politecnico di Milano, created to improve mobility in the area of Maputo, the capital of Mozambique. However, the issue of mobility also affects more modernized countries; for this reason with this thesis we want to verify whether the algorithms used and the results obtained for Safari Njema are consistent with other case studies such as the Milano area. In particular, the central topic of this thesis is the transport mode detection, one of the key issues related to mobility. Using the data provided by Cuebiq, it was possible to identify the transport mode used for a set of travel segments through information obtained from GPS coordinates, including features related to speed, acceleration and distance. All segments took place in a specific weekday before the outbreak of the COVID-19 pandemic. Going into more detail, in this thesis three main issues are addressed: firstly, we try to understand if it is possible to classify transport modes through supervised approach techniques: k-means, k-medoids, fuzzy c-means, clustering hierarchical and DBSCAN; secondly, we try to answer the same question but through supervised methods, including the QDA and the Naive Bayes approach with Leave One-Out Cross-Validation. Finally, the last step is the analysis of the usage of transport modes by area, through the use of the Origin-Destination matrices, where the results obtained in the previous phases are analyzed by province of origin and destination, to understand whether there are some areas where mobility takes place differently than others. For the validation of these results, the Open Data Regione Lombardia studies were used as a reference. To conclude the thesis, the results were then compared with those obtained in a day during the lockdown phase imposed by the pandemic, to see how the latter affected not only the behavior of citizens in the Milano area, but also their mobility habits.

Uno dei principali problemi legati alla crescita delle grandi città in tutto il mondo è la gestione della mobilità. Capire come, quando e perchè le persone si muovono è di fondamentale importanza per evitare problemi come l’elevato traffico e il sovraffollamento dei mezzi, soprattutto nei Paesi in via di sviluppo. Diversi progetti sono nati sotto questa scia, tra cui Safari Njema, ovvero un progetto interdisciplinare del Politecnico di Milano, creato per migliorare la mobilità nell’area di Maputo, capitale del Mozambico. Tuttavia, il problema della mobilità interessa anche Paesi più modernizzati, proprio per questo motivo con la presente tesi si vuole verificare se gli algoritmi utilizzati e i risultati ottenuti per Safari Njema sono consistenti con altri casi studio come l’area di Milano. In particolare, l’argomento centrale della tesi è la classificazione dei mezzi di trasporto, una delle questioni cardine relative alla mobilità. Tramite l’utilizzo dei dati forniti da Cuebiq, è stato possibile identificare il mezzo di trasporto utilizzato per un insieme di segmenti di viaggio tramite informazioni ricavate dalle coordinate GPS, tra cui caratteristiche relative a velocità, accelerazione e distanza. Tutti i segmenti si sono svolti in un giorno lavorativo prima dell’esplosione della pandemia di COVID-19. Andando più nel dettaglio, in questa tesi tre questioni principali vengono affrontate: in primo luogo, si cerca di capire se è possibile classificare i mezzi di trasporto tramite tecniche di approccio supervisionato: k-means, k-medoids, fuzzy c-means, clustering gerarchico e DBSCAN; in secondo luogo, si cerca di rispondere alla stessa domanda ma attraverso metodi supervisionati, tra cui il QDA e l’approccio Naive Bayes con cross-validazione leave one-out. Infine, l’ultimo passaggio è l’analisi dell’utilizzo dei mezzi di trasporto per area, tramite l’utilizzo delle matrici Origine-Destinazione, in cui i risultati ottenuti nelle fasi precedenti vengono analizzati per provincia di origine e destinazione, per capire se esistono alcune aree dove la mobilità si svolge diversamente rispetto ad altre. Per la validazione di questi risultati, sono stati utilizzati come riferimento gli studi di Open Data Regione Lombardia. Per concludere il discorso, i risultati sono poi stati confrontati con quelli ottenuti in un giorno durante la fase di lockdown imposta dalla pandemia, per vedere come quest’ultima abbia condizionato non solo i comportamenti dei cittadini nell’area di Milano, ma anche le loro abitudini in termini di mobilità.

Unsupervised and supervised transport mode detection of GPS phone data : Milano area as a case study

Borra, Andrea
2021/2022

Abstract

One of the main issues related to the growth of large cities around the world is the management of mobility. Understanding how, when and why people move is crucial to avoid issues such as heavy traffic and overcrowding of public means, especially in developing countries. Several projects were born in this direction, including Safari Njema, an interdisciplinary project of the Politecnico di Milano, created to improve mobility in the area of Maputo, the capital of Mozambique. However, the issue of mobility also affects more modernized countries; for this reason with this thesis we want to verify whether the algorithms used and the results obtained for Safari Njema are consistent with other case studies such as the Milano area. In particular, the central topic of this thesis is the transport mode detection, one of the key issues related to mobility. Using the data provided by Cuebiq, it was possible to identify the transport mode used for a set of travel segments through information obtained from GPS coordinates, including features related to speed, acceleration and distance. All segments took place in a specific weekday before the outbreak of the COVID-19 pandemic. Going into more detail, in this thesis three main issues are addressed: firstly, we try to understand if it is possible to classify transport modes through supervised approach techniques: k-means, k-medoids, fuzzy c-means, clustering hierarchical and DBSCAN; secondly, we try to answer the same question but through supervised methods, including the QDA and the Naive Bayes approach with Leave One-Out Cross-Validation. Finally, the last step is the analysis of the usage of transport modes by area, through the use of the Origin-Destination matrices, where the results obtained in the previous phases are analyzed by province of origin and destination, to understand whether there are some areas where mobility takes place differently than others. For the validation of these results, the Open Data Regione Lombardia studies were used as a reference. To conclude the thesis, the results were then compared with those obtained in a day during the lockdown phase imposed by the pandemic, to see how the latter affected not only the behavior of citizens in the Milano area, but also their mobility habits.
CALISSANO, ANNA
MASCARETTI, ANDREA
ING - Scuola di Ingegneria Industriale e dell'Informazione
22-lug-2022
2021/2022
Uno dei principali problemi legati alla crescita delle grandi città in tutto il mondo è la gestione della mobilità. Capire come, quando e perchè le persone si muovono è di fondamentale importanza per evitare problemi come l’elevato traffico e il sovraffollamento dei mezzi, soprattutto nei Paesi in via di sviluppo. Diversi progetti sono nati sotto questa scia, tra cui Safari Njema, ovvero un progetto interdisciplinare del Politecnico di Milano, creato per migliorare la mobilità nell’area di Maputo, capitale del Mozambico. Tuttavia, il problema della mobilità interessa anche Paesi più modernizzati, proprio per questo motivo con la presente tesi si vuole verificare se gli algoritmi utilizzati e i risultati ottenuti per Safari Njema sono consistenti con altri casi studio come l’area di Milano. In particolare, l’argomento centrale della tesi è la classificazione dei mezzi di trasporto, una delle questioni cardine relative alla mobilità. Tramite l’utilizzo dei dati forniti da Cuebiq, è stato possibile identificare il mezzo di trasporto utilizzato per un insieme di segmenti di viaggio tramite informazioni ricavate dalle coordinate GPS, tra cui caratteristiche relative a velocità, accelerazione e distanza. Tutti i segmenti si sono svolti in un giorno lavorativo prima dell’esplosione della pandemia di COVID-19. Andando più nel dettaglio, in questa tesi tre questioni principali vengono affrontate: in primo luogo, si cerca di capire se è possibile classificare i mezzi di trasporto tramite tecniche di approccio supervisionato: k-means, k-medoids, fuzzy c-means, clustering gerarchico e DBSCAN; in secondo luogo, si cerca di rispondere alla stessa domanda ma attraverso metodi supervisionati, tra cui il QDA e l’approccio Naive Bayes con cross-validazione leave one-out. Infine, l’ultimo passaggio è l’analisi dell’utilizzo dei mezzi di trasporto per area, tramite l’utilizzo delle matrici Origine-Destinazione, in cui i risultati ottenuti nelle fasi precedenti vengono analizzati per provincia di origine e destinazione, per capire se esistono alcune aree dove la mobilità si svolge diversamente rispetto ad altre. Per la validazione di questi risultati, sono stati utilizzati come riferimento gli studi di Open Data Regione Lombardia. Per concludere il discorso, i risultati sono poi stati confrontati con quelli ottenuti in un giorno durante la fase di lockdown imposta dalla pandemia, per vedere come quest’ultima abbia condizionato non solo i comportamenti dei cittadini nell’area di Milano, ma anche le loro abitudini in termini di mobilità.
File allegati
File Dimensione Formato  
Borra_Tesi.pdf

non accessibile

Dimensione 4.8 MB
Formato Adobe PDF
4.8 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/190777