Land use identification is an essential requirement in the process of urban planning. The traditional approaches for identification and classification of type of uses in piece of land (e.g. industrial, residential, commercial, etc.) are too time consuming and too costly for the scale of modern large cities. To address these issues novel methods of land use identification – classification have been introduced which are based on digital data that is potentially indicative of land use types, example of such data includes phone or mobile phone activity data or location based services based data. The goal of this thesis is to predict the actual land use of an area of 3000KM area in Milan, Italy based on the historical land use data from 2009 (Provided by CORINE) and call details records (CDR data) from 2013 (Provided by Telecom Italia). It is reasonable to expect that the spatial and temporal patterns of mobile calls coming in – going out from/to piece of land vary depending on the types of the land uses available in that land. For instance, in an area under industrial use the number of outgoing calls in evenings is probably much smaller with respect to that of work hours or compared to out-going calls from a domestic area in evenings. We have divided the whole mentioned area into 10000 cells each of which being 250M*250M. For each cell we extracted a call out profile (2013) consisting of average call out over 60 days. We then measured the similarity of the profile of each cell to the ‘land use profile’ of different land uses estimated from land use data 2009. The land use profiles of specific land use are estimated as the average out call profile of a sub group of cells labeled with that land use in 2009. We have suggested a few different distance measures as well as a few different methods to extract the above mentioned cell’s subgroup. We have compared the predicted land uses of 49 samples cells which are mostly construction sites with the actual 2014 land use of them as a measure of prediction accuracy. Our suggested method that uses Mahanalobis as similarity measure and two-class k-means clustering or cell subgroup selection predicts the actual land usage with more than 90% accuracy.

L'identificazione d'uso del suolo è un passaggio essenziale nel processo di pianificazione urbana. Gli approcci tradizionali di identificazione e classificazione di tipologie d'uso di terreni (es. industriale, residenziale, commerciale ecc) sono procedimenti lenti e costosi per le dimensioni delle moderne metropoli. Per evitare questi problemi, sono stati introdotti nuovi metodi di classificazione e identificazione dell'uso dei terreni basati su dati digitali che sono potenzialmente indicativi sull'uso dei terreni, esempio di tali dati include dati di attività telefoniche o di cellulari L’obbiettivo di questa tesi e’ di predirre l’attuale identificazione d’uso del suolo di un’area di 3000km2 a Milano (Italia) sulla base dei dati d’uso del suolo storici dal 2009 e sulla base dei dettagli delle registrazioni delle chiamate effettuate dal 2013 a questa parte (CDR data). è ragionevole aspettarsi che i modelli spaziali e temporali di chiamate mobili in arrivo e in uscita dal suolo in esame variano a seconda dei tipi di suolo disponibili in quell’area. Ad esempio, in una zona industriale il numero di chiamate in uscita durante la sera è probabilmente molto minore rispetto a quello delle ore lavorative o rispetto alle chiamate uscenti da una zona residenziale la sera. Abbiamo diviso l'intera area indicate nel 10000 cellule ognuna delle quali dell'essere 250M * 250M. Per ogni cella abbiamo estratto un profilo di chiamata (2013) composto di chiamata media fuori oltre i 60 giorni. Abbiamo poi misurato la somiglianza del profilo di ogni cella alla 'utilizzazione profilo di terra' di terreno diversi usi sulla base dei dati di uso del suolo 2009 I profili di uso del suolo di uso specifico territorio sono stimati come il profilo medio fuori di chiamata di un gruppo di sub cellule marcate con quella dell'uso del suolo nel 2009 abbiamo proposto alcune misure di distanza differenti, nonché un paio di metodi diversi per estrarre sottogruppo della cella di cui sopra. Abbiamo confrontato gli usi del suolo previsti su 49 campioni di cellule che sono per lo più cantieri con l'effettivo utilizzo 2014 terra di loro come una misura di precisione di previsione. Il nostro metodo suggerito che utilizza Mahanalobis come misura di similarità e due di classe k-means clustering di selezione o sottogruppo di cellule prevede l'utilizzo effettivo terreno con oltre il 90% di precisione

Land use identification using mobile phone data

BEHNAM ROUDSARI, SOHEIL;SHEYKHVAND, KOUROSH
2013/2014

Abstract

Land use identification is an essential requirement in the process of urban planning. The traditional approaches for identification and classification of type of uses in piece of land (e.g. industrial, residential, commercial, etc.) are too time consuming and too costly for the scale of modern large cities. To address these issues novel methods of land use identification – classification have been introduced which are based on digital data that is potentially indicative of land use types, example of such data includes phone or mobile phone activity data or location based services based data. The goal of this thesis is to predict the actual land use of an area of 3000KM area in Milan, Italy based on the historical land use data from 2009 (Provided by CORINE) and call details records (CDR data) from 2013 (Provided by Telecom Italia). It is reasonable to expect that the spatial and temporal patterns of mobile calls coming in – going out from/to piece of land vary depending on the types of the land uses available in that land. For instance, in an area under industrial use the number of outgoing calls in evenings is probably much smaller with respect to that of work hours or compared to out-going calls from a domestic area in evenings. We have divided the whole mentioned area into 10000 cells each of which being 250M*250M. For each cell we extracted a call out profile (2013) consisting of average call out over 60 days. We then measured the similarity of the profile of each cell to the ‘land use profile’ of different land uses estimated from land use data 2009. The land use profiles of specific land use are estimated as the average out call profile of a sub group of cells labeled with that land use in 2009. We have suggested a few different distance measures as well as a few different methods to extract the above mentioned cell’s subgroup. We have compared the predicted land uses of 49 samples cells which are mostly construction sites with the actual 2014 land use of them as a measure of prediction accuracy. Our suggested method that uses Mahanalobis as similarity measure and two-class k-means clustering or cell subgroup selection predicts the actual land usage with more than 90% accuracy.
CELINO, IRENE
ING - Scuola di Ingegneria Industriale e dell'Informazione
3-ott-2014
2013/2014
L'identificazione d'uso del suolo è un passaggio essenziale nel processo di pianificazione urbana. Gli approcci tradizionali di identificazione e classificazione di tipologie d'uso di terreni (es. industriale, residenziale, commerciale ecc) sono procedimenti lenti e costosi per le dimensioni delle moderne metropoli. Per evitare questi problemi, sono stati introdotti nuovi metodi di classificazione e identificazione dell'uso dei terreni basati su dati digitali che sono potenzialmente indicativi sull'uso dei terreni, esempio di tali dati include dati di attività telefoniche o di cellulari L’obbiettivo di questa tesi e’ di predirre l’attuale identificazione d’uso del suolo di un’area di 3000km2 a Milano (Italia) sulla base dei dati d’uso del suolo storici dal 2009 e sulla base dei dettagli delle registrazioni delle chiamate effettuate dal 2013 a questa parte (CDR data). è ragionevole aspettarsi che i modelli spaziali e temporali di chiamate mobili in arrivo e in uscita dal suolo in esame variano a seconda dei tipi di suolo disponibili in quell’area. Ad esempio, in una zona industriale il numero di chiamate in uscita durante la sera è probabilmente molto minore rispetto a quello delle ore lavorative o rispetto alle chiamate uscenti da una zona residenziale la sera. Abbiamo diviso l'intera area indicate nel 10000 cellule ognuna delle quali dell'essere 250M * 250M. Per ogni cella abbiamo estratto un profilo di chiamata (2013) composto di chiamata media fuori oltre i 60 giorni. Abbiamo poi misurato la somiglianza del profilo di ogni cella alla 'utilizzazione profilo di terra' di terreno diversi usi sulla base dei dati di uso del suolo 2009 I profili di uso del suolo di uso specifico territorio sono stimati come il profilo medio fuori di chiamata di un gruppo di sub cellule marcate con quella dell'uso del suolo nel 2009 abbiamo proposto alcune misure di distanza differenti, nonché un paio di metodi diversi per estrarre sottogruppo della cella di cui sopra. Abbiamo confrontato gli usi del suolo previsti su 49 campioni di cellule che sono per lo più cantieri con l'effettivo utilizzo 2014 terra di loro come una misura di precisione di previsione. Il nostro metodo suggerito che utilizza Mahanalobis come misura di similarità e due di classe k-means clustering di selezione o sottogruppo di cellule prevede l'utilizzo effettivo terreno con oltre il 90% di precisione
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2014_10_SHEYKHVAND_BEHNAM.pdf

accessibile in internet per tutti

Descrizione: Thesis document
Dimensione 5.17 MB
Formato Adobe PDF
5.17 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/96627