The number of active devices in our pocket has exploded since 2008, with it, also the magnitude of data coming from smartphone sensors. A project started by Microsoft in 2005 collected gps data from people moving around different cities, in particular Beijing. That project has had a crucial role in enabling the research in transport mode detection algorithms starting from raw gps data. Nowadays gps is not the only positioning system available, phone companies are beginning to sell low resolution trajectories of their costumers, and other technologies are providing this type of data at very low cost. In this framework, there is a big opportunity to get rid of traditional methods to gather informations about commuters habits. These methods, such as censuses, questionnaires… are resource consuming and could be substituted or complemented by more efficient methods. The added value of such informations can range from support to urban planning, to efficient scheduling of activities, services, transports, etc… To make the most of the potential of this system, it is useful to create a transport mode detection algorithm, capable of doing data mining from the raw data and obtaining as much information as possible from it. This work highlights the limits due to the scarcity of a ground truth on which calibrate the algorithms but also the accuracy that can be reached when the data is abundant.

Il numero di dispositivi elettronici attivi nelle nostre tasche è esploso dal 2008, con esso anche l'entità dei dati provenienti dai sensori degli smartphone. Un progetto avviato da Microsoft nel 2005 ha raccolto dati GPS da persone che si spostano in diverse città, in particolare Pechino. Quel progetto ha avuto un ruolo cruciale nel consentire la ricerca di algoritmi di rilevamento della modalità di trasporto a partire da dati GPS grezzi. Al giorno d'oggi il gps non è l'unico sistema di localizzazione disponibile, le compagnie telefoniche stanno iniziando a vendere traiettorie a bassa risoluzione dei loro clienti e altre tecnologie stanno fornendo questo tipo di dati a costi molto bassi. In questo quadro, c'è una grande opportunità per accantonare dei metodi tradizionali per raccogliere informazioni sulle abitudini dei pendolari. Questi metodi, come censimenti, questionari... consumano risorse e potrebbero essere sostituiti o integrati con metodi più efficienti. Il valore aggiunto di tali informazioni può spaziare dal supporto alla pianificazione urbanistica, alla programmazione efficiente di attività, servizi, trasporti, ecc... Per sfruttare al meglio le potenzialità di questo sistema, è utile creare un algoritmo di rilevamento della modalità di trasporto, in grado di fare data mining dai dati grezzi e ricavarne quante più informazioni possibili. Questo lavoro mette in evidenza i limiti dovuti alla scarsità di una verità di base su cui calibrare l'algoritmo ma anche l'accuratezza che si può raggiungere quando i dati sono abbondanti.

Machine learning applied to raw gps trajectories to enable transport mode detection

Rossi, Gabriele
2021/2022

Abstract

The number of active devices in our pocket has exploded since 2008, with it, also the magnitude of data coming from smartphone sensors. A project started by Microsoft in 2005 collected gps data from people moving around different cities, in particular Beijing. That project has had a crucial role in enabling the research in transport mode detection algorithms starting from raw gps data. Nowadays gps is not the only positioning system available, phone companies are beginning to sell low resolution trajectories of their costumers, and other technologies are providing this type of data at very low cost. In this framework, there is a big opportunity to get rid of traditional methods to gather informations about commuters habits. These methods, such as censuses, questionnaires… are resource consuming and could be substituted or complemented by more efficient methods. The added value of such informations can range from support to urban planning, to efficient scheduling of activities, services, transports, etc… To make the most of the potential of this system, it is useful to create a transport mode detection algorithm, capable of doing data mining from the raw data and obtaining as much information as possible from it. This work highlights the limits due to the scarcity of a ground truth on which calibrate the algorithms but also the accuracy that can be reached when the data is abundant.
ING - Scuola di Ingegneria Industriale e dell'Informazione
6-ott-2022
2021/2022
Il numero di dispositivi elettronici attivi nelle nostre tasche è esploso dal 2008, con esso anche l'entità dei dati provenienti dai sensori degli smartphone. Un progetto avviato da Microsoft nel 2005 ha raccolto dati GPS da persone che si spostano in diverse città, in particolare Pechino. Quel progetto ha avuto un ruolo cruciale nel consentire la ricerca di algoritmi di rilevamento della modalità di trasporto a partire da dati GPS grezzi. Al giorno d'oggi il gps non è l'unico sistema di localizzazione disponibile, le compagnie telefoniche stanno iniziando a vendere traiettorie a bassa risoluzione dei loro clienti e altre tecnologie stanno fornendo questo tipo di dati a costi molto bassi. In questo quadro, c'è una grande opportunità per accantonare dei metodi tradizionali per raccogliere informazioni sulle abitudini dei pendolari. Questi metodi, come censimenti, questionari... consumano risorse e potrebbero essere sostituiti o integrati con metodi più efficienti. Il valore aggiunto di tali informazioni può spaziare dal supporto alla pianificazione urbanistica, alla programmazione efficiente di attività, servizi, trasporti, ecc... Per sfruttare al meglio le potenzialità di questo sistema, è utile creare un algoritmo di rilevamento della modalità di trasporto, in grado di fare data mining dai dati grezzi e ricavarne quante più informazioni possibili. Questo lavoro mette in evidenza i limiti dovuti alla scarsità di una verità di base su cui calibrare l'algoritmo ma anche l'accuratezza che si può raggiungere quando i dati sono abbondanti.
File allegati
File Dimensione Formato  
2022_10_Rossi.pdf

accessibile in internet per tutti

Dimensione 4.6 MB
Formato Adobe PDF
4.6 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/192577