This work deals with a problem of dimensional reduction and interpretation of functional data with spatial dependence, related to the mobile phone network activity in the metropolitan area of Milan (Erlang data, recorder every 15 minutes for 14 days, in a spatial grid with pixels 200m 200m). Aim of the analysis is to identify speci c behaviors in time and space based on di fferent population and activity types, associating the results in terms of spatial patterns with local soil use data. The proposed approach is based on the procedure developed by Secchi, Vantini and Vitelli [34], named Bagging-Voronoi Treelet Analysis, which combines the treelet decomposition with a Bagging-Voronoi strategy (replicates of the analysis are performed on sets of local representatives associated to random Voronoi tessellations and eventually aggregated) to take into account spatial dependence. The results point out some temporal and spatial patterns, whose interpretation is validated through soil use and land cover data (DUSAF, Regione Lombardia). In particular, the strategy adopted for relating the two types of spatial information (mobile phone use and soil use) relies on Canonical Correlation Analysis and regression techniques, where the geographic nature of data is treated with a Bagging-Voronoi approach. The performances are also compared with the results of tree-based methodologies (Regression trees and Random Forest). We eventually obtained a global explanation of the most relevant spatial patterns, validating the interpretation of some phenomena related to population dynamics (e.g. daily work activities taking place in central urban areas, including services settlements and road networs, vs. weekend and evening activities associated to residential and leisure areas; relevant movements in the road networks during rush hours; reduced activities in agricultural and seminatural areas). The strengths and limitations of the proposed methodologies are eventually presented with an overall discussion of the results and we suggest some possible directions for technical improvements and future research developments.
Questo lavoro di tesi si occupa di un problema di riduzione dimensionale e interpretazione di dati funzionali con dipendenza spaziale, relativi all'utilizzo della rete cellulare nell'area metropolitana di Milano (dati Erlang, registrati ogni 15 minuti per 14 giorni consecutivi, su una griglia spaziale di pixel 200m per 200m). Lo scopo dell'analisi é identificare comportamenti specifici nello spazio e nel tempo, basati su differenti tipologie di popolazione e di attività, associando successivamente i risultati in termini di pattern spaziali a informazioni circa l'utilizzo e la copertura del suolo. L'approccio che proponiamo si basa sulla procedura sviluppata da Secchi, Vantini e Vitelli [34] con il nome di Bagging-Voronoi Treelet Analysis, che combina la decomposizione treelet con una strategia Bagging-Voronoi ( diverse repliche dell'analisi sono effettuate su insiemi di rappresentati locali associati a tassellazioni Voronoi casuali e i risultati vengono poi aggregati) per tenere in considerazione la dipendenza spaziale dei dati. I risultati indicano diversi pattern temporali e spaziali, la cui interpretazione é avvalorata attraverso lo studio di dati di utilizzo del suolo (dati DUSAF, Regione Lombardia). In particolare, la strategia impiegata per mettere in relazione i due tipi di informazioni spaziali (utilizzo della rete cellulare e uso del suolo) si basa su analisi delle correlazioni canoniche e tecniche di regressione, in cui la natura geo-spaziale dei dati é trattata con un approccio Bagging-Voronoi. Le performance sono inoltre comparate con i risultati di tecniche tree-based (Regression trees e Random Forest). Abbiamo in questo modo ottenuto una spiegazione globale dei pattern spaziali più rilevanti, comprovando l'interpretazione di alcuni fenomeni legati a dinamiche della popolazione ( ad esempio: attività lavorative diurne si svolgono principalmente in aree urbane centrali, compresi impianti di servizi e reti stradali, opponendosi alle attività serali e del weekend associate ad aree residenziali e ricreative; considerevole movimento é rilevato nel suolo stradale durante gli orari di punta; l'attività telefonica risulta in genere modesta nelle aree agricole e semi-naturali ). I pregi e i limiti della metodologia proposta sono infine presentati con una discussione dei risultati ottenuti e vengono suggerite alcune possibili direzioni per miglioramenti dal punto di vista tecnico e futuri sviluppi della ricerca.
Spatio-temporal mobile phone data in Milan : Bagging-Voronoi exploration and modeling through soil use and land cover data
PASSAMONTI, FEDERICA
2015/2016
Abstract
This work deals with a problem of dimensional reduction and interpretation of functional data with spatial dependence, related to the mobile phone network activity in the metropolitan area of Milan (Erlang data, recorder every 15 minutes for 14 days, in a spatial grid with pixels 200m 200m). Aim of the analysis is to identify speci c behaviors in time and space based on di fferent population and activity types, associating the results in terms of spatial patterns with local soil use data. The proposed approach is based on the procedure developed by Secchi, Vantini and Vitelli [34], named Bagging-Voronoi Treelet Analysis, which combines the treelet decomposition with a Bagging-Voronoi strategy (replicates of the analysis are performed on sets of local representatives associated to random Voronoi tessellations and eventually aggregated) to take into account spatial dependence. The results point out some temporal and spatial patterns, whose interpretation is validated through soil use and land cover data (DUSAF, Regione Lombardia). In particular, the strategy adopted for relating the two types of spatial information (mobile phone use and soil use) relies on Canonical Correlation Analysis and regression techniques, where the geographic nature of data is treated with a Bagging-Voronoi approach. The performances are also compared with the results of tree-based methodologies (Regression trees and Random Forest). We eventually obtained a global explanation of the most relevant spatial patterns, validating the interpretation of some phenomena related to population dynamics (e.g. daily work activities taking place in central urban areas, including services settlements and road networs, vs. weekend and evening activities associated to residential and leisure areas; relevant movements in the road networks during rush hours; reduced activities in agricultural and seminatural areas). The strengths and limitations of the proposed methodologies are eventually presented with an overall discussion of the results and we suggest some possible directions for technical improvements and future research developments.File | Dimensione | Formato | |
---|---|---|---|
Tesi.pdf
accessibile in internet per tutti
Descrizione: Tesi
Dimensione
26.54 MB
Formato
Adobe PDF
|
26.54 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/121477