In the last years, the use of novel and innovative data sources for transport modelling, as an alternative and a supplement to traditional surveys and traffic counts, has emerged and gained popularity. At date, several mobile network operators and smartphone app data analytics companies are already employing their data to build origin-destination matrices for commercial purposes. These are obtained by mining large sets of punctual user locations in time to extract individual trips that are then aggregated into matrices, eventually by estimated transport mode or trip purpose. This is generally accomplished by means of hand-made fixed rules and thresholds, yet, there is quite a research gap in the use of more data-driven tools for such tasks. The goal of this study is to preliminarily test the possibility of applying machine learning techniques in such process, and in particular clustering for the estimation of trip purpose, so to put a seed in this still unexplored field, and to identify the related criticalities. Due to the unavailability of openly accessible datasets, we conducted a pilot experiment with volunteers, emulating, through a dedicated smartphone app, the aforementioned data sources on a smaller scale. After cleansing and processing raw data, we tested the performance of hierarchical clustering and DBSCAN with different options, interpreting their results in the light of our target, that is trip purpose. Despite relevant issues and biases in our dataset, and several criticalities that we noted, the final results appeared quite promising, leading us to the conclusion that machine learning does actually have great potentialities in transport analysis, especially with a larger and more complete dataset. Nonetheless, tests on such scalability, as well as further and deeper research, are still needed.

Nella modellizzazione dei trasporti e della mobilità si è assistito, negli ultimi anni, ad un notevole sviluppo e diffusione dell’utilizzo di fonti di dati innovative, affiancate sempre più spesso ai sistemi tradizionali, quali sondaggi e conteggi di traffico. Già diverse compagnie telefoniche e aggregatori di dati dalle applicazioni per smartphone offrono, tra i loro prodotti, matrici origine-destinazione costruite elaborando i dati in loro possesso, ovvero grandi quantità di punti geograficamente e temporalmente referenziati che rappresentano le traiettorie seguite da ciascun utente. Da queste, è possibile estrarre gli spostamenti individuali che, successivamente, sono aggregati in una o più matrici OD, eventualmente ripartite per modo di trasporto o motivo dello spostamento; in questo processo si utilizzano tipicamente criteri fissi con soglie impostate dall’analista, piuttosto che metodi più data-driven, ancora trascurati dalla ricerca. L’obiettivo di questo studio consiste dunque nello sperimentarvi l’uso di tecniche di machine learning per valutarne le relative potenzialità e criticità; in particolare, ci si è concentrati sulla stima del motivo dello spostamento tramite clustering. A causa della mancanza di dati liberamente fruibili, si è deciso di condurre un esperimento pilota con il coinvolgimento di alcuni volontari e l’uso di una specifica app per smartphone, al fine di emulare un possibile dataset di quelli menzionati sopra, benché su scala nettamente più modesta. Si è dunque proceduto con l’elaborazione del dato grezzo, per arrivare infine a testare le performance degli algoritmi di clustering gerarchico e DBSCAN con diverse configurazioni, interpretando i risultati ottenuti nell’ottica del motivo dello spostamento. Nonostante i significativi problemi legati ai dati che si sono raccolti, si sono ottenuti risultati piuttosto promettenti, che lasciano supporre che vi siano grandi potenzialità per il machine learning nella modellizzazione dei trasporti, in particolar modo su dataset più ampi e completi; naturalmente, tale scalabilità deve essere ancora testata, è in generale si ritiene sia opportuno sviluppare e approfondire notevolmente la ricerca in questo campo.

Machine learning techniques for the analysis of people mobility

Barbierato, Luca
2020/2021

Abstract

In the last years, the use of novel and innovative data sources for transport modelling, as an alternative and a supplement to traditional surveys and traffic counts, has emerged and gained popularity. At date, several mobile network operators and smartphone app data analytics companies are already employing their data to build origin-destination matrices for commercial purposes. These are obtained by mining large sets of punctual user locations in time to extract individual trips that are then aggregated into matrices, eventually by estimated transport mode or trip purpose. This is generally accomplished by means of hand-made fixed rules and thresholds, yet, there is quite a research gap in the use of more data-driven tools for such tasks. The goal of this study is to preliminarily test the possibility of applying machine learning techniques in such process, and in particular clustering for the estimation of trip purpose, so to put a seed in this still unexplored field, and to identify the related criticalities. Due to the unavailability of openly accessible datasets, we conducted a pilot experiment with volunteers, emulating, through a dedicated smartphone app, the aforementioned data sources on a smaller scale. After cleansing and processing raw data, we tested the performance of hierarchical clustering and DBSCAN with different options, interpreting their results in the light of our target, that is trip purpose. Despite relevant issues and biases in our dataset, and several criticalities that we noted, the final results appeared quite promising, leading us to the conclusion that machine learning does actually have great potentialities in transport analysis, especially with a larger and more complete dataset. Nonetheless, tests on such scalability, as well as further and deeper research, are still needed.
COPPOLA, PIERLUIGI
ING - Scuola di Ingegneria Industriale e dell'Informazione
21-dic-2021
2020/2021
Nella modellizzazione dei trasporti e della mobilità si è assistito, negli ultimi anni, ad un notevole sviluppo e diffusione dell’utilizzo di fonti di dati innovative, affiancate sempre più spesso ai sistemi tradizionali, quali sondaggi e conteggi di traffico. Già diverse compagnie telefoniche e aggregatori di dati dalle applicazioni per smartphone offrono, tra i loro prodotti, matrici origine-destinazione costruite elaborando i dati in loro possesso, ovvero grandi quantità di punti geograficamente e temporalmente referenziati che rappresentano le traiettorie seguite da ciascun utente. Da queste, è possibile estrarre gli spostamenti individuali che, successivamente, sono aggregati in una o più matrici OD, eventualmente ripartite per modo di trasporto o motivo dello spostamento; in questo processo si utilizzano tipicamente criteri fissi con soglie impostate dall’analista, piuttosto che metodi più data-driven, ancora trascurati dalla ricerca. L’obiettivo di questo studio consiste dunque nello sperimentarvi l’uso di tecniche di machine learning per valutarne le relative potenzialità e criticità; in particolare, ci si è concentrati sulla stima del motivo dello spostamento tramite clustering. A causa della mancanza di dati liberamente fruibili, si è deciso di condurre un esperimento pilota con il coinvolgimento di alcuni volontari e l’uso di una specifica app per smartphone, al fine di emulare un possibile dataset di quelli menzionati sopra, benché su scala nettamente più modesta. Si è dunque proceduto con l’elaborazione del dato grezzo, per arrivare infine a testare le performance degli algoritmi di clustering gerarchico e DBSCAN con diverse configurazioni, interpretando i risultati ottenuti nell’ottica del motivo dello spostamento. Nonostante i significativi problemi legati ai dati che si sono raccolti, si sono ottenuti risultati piuttosto promettenti, che lasciano supporre che vi siano grandi potenzialità per il machine learning nella modellizzazione dei trasporti, in particolar modo su dataset più ampi e completi; naturalmente, tale scalabilità deve essere ancora testata, è in generale si ritiene sia opportuno sviluppare e approfondire notevolmente la ricerca in questo campo.
File allegati
File Dimensione Formato  
LucaBarbierato_MLpeopleMobility.pdf

accessibile in internet solo dagli utenti autorizzati

Dimensione 19.28 MB
Formato Adobe PDF
19.28 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/181976