The goal of this thesis is to introduce a multivariate-data based method in the study of retail and service activities spatial pattern with the aid of machine learning algorithms. City as a whole evolves through time, with different aspects of the city interactively influencing each other. Economic activities, as one of the most important function of a city, are always undergoing through changes. The space patterns of economic activities in a city are shaped by many aspects, including transportation infrastructure, physical environment, social configuration and so on. This thesis attempts to depict and analyze how economic, especially the retail and private service activities, distribute in a city. Furthermore, based on the recognition and classification of land pattern, the thesis also tries to discover the hidden relationships between different urban dimensions and economic activities in order to diagnose the present situation and predict the future. In the analyzing process, we manage to introduce a data science method in the analysis. Multivariate data will be collected to describe various dimensions of urban systems. Instead of the modeling methods that are based on induction and deduction in the “small data” time, machine learning algorithms, including clustering classification and regression algorithms, will be used in analyzing the “large sample data”. As one of the most developed city in Europe, Milan is taken as the case city in this thesis. The spatial pattern of urban retail and service activities is the research object to show how to convert an urban question into a data question, how to collect and process data, and how to tune algorithms and interpret the result according to the specific algorithms. Specifically, the DBSCAN clustering algorithm is used to explore the spatial pattern of an single type of retail or service activity. The hierarchical agglomerative clustering algorithm is implemented to recognize the land use pattern. The LASSO and polynomial regression algorithm are involved to describe the relationship between land use type and multi-dimensional urban data. At last, the land use prediction model based on multi-dimensional city data is constructed by using the random forest classification algorithm. Through the analysis, we find that most retail and service activities Milan cluster at neighborhood scale from 100-300m and the clusters show 5 typical spatial patterns in city scale. The commercial land use in Milan are classified into 6 categories and 16 sub-categories. Overall, Milan shows a typical monocentric pattern, which is further validated with bid-rent theory. The prediction model has detected some risky and potential land use and predicted the land use change with the construction of the Metro 4. Finally, through clustering, classification and regression, the new routine substitutes “detect relation”, “establish relation” and “depict relation” for inductive reasoning and deductive reasoning to engaging all related variables from large samples, and leads to a more comprehensive and interactive relationship between variables in urban studies. We hope that this research methods are not only applicable to the study of retail and service activities, but also can be further used in the research and exploration of other fields in urban study. Keywords: Retail and service activity, spatial pattern, machine learning algorithm

L'obiettivo di questa tesi è di introdurre un metodo basato su dati multivariati nello studio del modello spaziale urbano delle attività di vendita al dettaglio e dei servizi con l'ausilio di algoritmi di apprendimento automatico. La città nel suo complesso si evolve nel tempo, modificandosi a causa di diversi aspetti che si influenzano a vicenda in modo interattivo. Le attività economiche, certamente tra le funzioni più importanti della città, sono sempre sottoposte a cambiamenti. I modelli spaziali delle attività economiche in una città sono plasmati da molti aspetti, tra cui infrastrutture di trasporto, ambiente fisico, configurazione sociale e così via. Questa tesi tenta di descrivere e analizzare in che modo le attività economiche, in particolare le attività di vendita al dettaglio e i servizi, si distribuiscono in una città. Inoltre, sulla base del riconoscimento e della classificazione del modello di suolo, la tesi cerca anche di scoprire le relazioni nascoste tra le diverse dimensioni urbane e le attività economiche, al fine di diagnosticare la situazione attuale e predire quella futura. Nel processo di analisi è possibile introdurre un metodo di data science. Verranno raccolti dati multivariati per descrivere varie dimensioni dei sistemi urbani. Invece di metodi di modellazione basati sull'induzione e deduzione di "small data", saranno utilizzati algoritmi di apprendimento automatico, tra cui algoritmi di classificazione e di regressione del clustering, così da analizzare i "large sample data". Tra le città più sviluppate in Europa, Milano è il caso studio di questa tesi. L’oggetto di ricerca è lo schema spaziale delle attività di vendita al dettaglio e di servizi urbani; lo scopo è mostrare come raccogliere dati e processi, come convertire una domanda urbana in una domanda di dati e come accordare gli algoritmi e interpretare il risultato secondo gli algoritmi specifici. Nello specifico, l'algoritmo di clustering DBSCAN viene utilizzato per esplorare il modello spaziale di un singolo tipo di attività di vendita o servizio. L'algoritmo di clustering gerarchico agglomerativo viene implementato per riconoscere il modello di uso del suolo. L'algoritmo LASSO e l’algoritmo regressivo polinomiale sono coinvolti nella descrizione della relazione tra tipo di uso del suolo e dati urbani multidimensionali. Infine, il modello di previsione dell'uso basato su dati urbani multidimensionali viene costruito utilizzando l'algoritmo di classificazione delle foreste casuale. Attraverso l'analisi, scopriamo che la maggior parte delle attività di vendita al dettaglio e dei servizi di Milano si concentrano su una scala di vicinato da 100 a 300 metri e i cluster mostrano 5 tipici modelli spaziali in scala urbana. L’uso commerciale a Milano è classificato in 6 categorie e 16 sottocategorie. Nel complesso, Milano mostra un tipico schema monocentrico, ulteriormente convalidato con la teoria del “bid-rent”. Il modello di predizione ha rilevato alcuni elementi di rischio e potenziali in relazione all’uso del suolo e ha previsto il cambiamento d’uso conseguenti alla costruzione della Metro 4. Infine, attraverso il clustering, la classificazione e la regressione, il nuovo metodo è composto dal "rilevare la relazione", "stabilire una relazione" e "rappresentare la relazione" attraverso il ragionamento induttivo e deduttivo, così da coinvolgere tutte le variabili correlate da campioni di grandi dimensioni e portare a una più completa e interattiva relazione tra variabili negli studi urbani. Si spera che questi metodi di ricerca non siano solo applicabili allo studio delle attività di vendita al dettaglio e di servizi, ma che possano essere ulteriormente utilizzati nella ricerca e nell'analisi di altri campi dello studio urbano.

Urban retail and service activities spatial pattern recognition and prediction based on multiple data sources and machine learning algorithms : the case study of Milan

WEI, JIABIN
2017/2018

Abstract

The goal of this thesis is to introduce a multivariate-data based method in the study of retail and service activities spatial pattern with the aid of machine learning algorithms. City as a whole evolves through time, with different aspects of the city interactively influencing each other. Economic activities, as one of the most important function of a city, are always undergoing through changes. The space patterns of economic activities in a city are shaped by many aspects, including transportation infrastructure, physical environment, social configuration and so on. This thesis attempts to depict and analyze how economic, especially the retail and private service activities, distribute in a city. Furthermore, based on the recognition and classification of land pattern, the thesis also tries to discover the hidden relationships between different urban dimensions and economic activities in order to diagnose the present situation and predict the future. In the analyzing process, we manage to introduce a data science method in the analysis. Multivariate data will be collected to describe various dimensions of urban systems. Instead of the modeling methods that are based on induction and deduction in the “small data” time, machine learning algorithms, including clustering classification and regression algorithms, will be used in analyzing the “large sample data”. As one of the most developed city in Europe, Milan is taken as the case city in this thesis. The spatial pattern of urban retail and service activities is the research object to show how to convert an urban question into a data question, how to collect and process data, and how to tune algorithms and interpret the result according to the specific algorithms. Specifically, the DBSCAN clustering algorithm is used to explore the spatial pattern of an single type of retail or service activity. The hierarchical agglomerative clustering algorithm is implemented to recognize the land use pattern. The LASSO and polynomial regression algorithm are involved to describe the relationship between land use type and multi-dimensional urban data. At last, the land use prediction model based on multi-dimensional city data is constructed by using the random forest classification algorithm. Through the analysis, we find that most retail and service activities Milan cluster at neighborhood scale from 100-300m and the clusters show 5 typical spatial patterns in city scale. The commercial land use in Milan are classified into 6 categories and 16 sub-categories. Overall, Milan shows a typical monocentric pattern, which is further validated with bid-rent theory. The prediction model has detected some risky and potential land use and predicted the land use change with the construction of the Metro 4. Finally, through clustering, classification and regression, the new routine substitutes “detect relation”, “establish relation” and “depict relation” for inductive reasoning and deductive reasoning to engaging all related variables from large samples, and leads to a more comprehensive and interactive relationship between variables in urban studies. We hope that this research methods are not only applicable to the study of retail and service activities, but also can be further used in the research and exploration of other fields in urban study. Keywords: Retail and service activity, spatial pattern, machine learning algorithm
ARC I - Scuola di Architettura Urbanistica Ingegneria delle Costruzioni
5-ott-2018
2017/2018
L'obiettivo di questa tesi è di introdurre un metodo basato su dati multivariati nello studio del modello spaziale urbano delle attività di vendita al dettaglio e dei servizi con l'ausilio di algoritmi di apprendimento automatico. La città nel suo complesso si evolve nel tempo, modificandosi a causa di diversi aspetti che si influenzano a vicenda in modo interattivo. Le attività economiche, certamente tra le funzioni più importanti della città, sono sempre sottoposte a cambiamenti. I modelli spaziali delle attività economiche in una città sono plasmati da molti aspetti, tra cui infrastrutture di trasporto, ambiente fisico, configurazione sociale e così via. Questa tesi tenta di descrivere e analizzare in che modo le attività economiche, in particolare le attività di vendita al dettaglio e i servizi, si distribuiscono in una città. Inoltre, sulla base del riconoscimento e della classificazione del modello di suolo, la tesi cerca anche di scoprire le relazioni nascoste tra le diverse dimensioni urbane e le attività economiche, al fine di diagnosticare la situazione attuale e predire quella futura. Nel processo di analisi è possibile introdurre un metodo di data science. Verranno raccolti dati multivariati per descrivere varie dimensioni dei sistemi urbani. Invece di metodi di modellazione basati sull'induzione e deduzione di "small data", saranno utilizzati algoritmi di apprendimento automatico, tra cui algoritmi di classificazione e di regressione del clustering, così da analizzare i "large sample data". Tra le città più sviluppate in Europa, Milano è il caso studio di questa tesi. L’oggetto di ricerca è lo schema spaziale delle attività di vendita al dettaglio e di servizi urbani; lo scopo è mostrare come raccogliere dati e processi, come convertire una domanda urbana in una domanda di dati e come accordare gli algoritmi e interpretare il risultato secondo gli algoritmi specifici. Nello specifico, l'algoritmo di clustering DBSCAN viene utilizzato per esplorare il modello spaziale di un singolo tipo di attività di vendita o servizio. L'algoritmo di clustering gerarchico agglomerativo viene implementato per riconoscere il modello di uso del suolo. L'algoritmo LASSO e l’algoritmo regressivo polinomiale sono coinvolti nella descrizione della relazione tra tipo di uso del suolo e dati urbani multidimensionali. Infine, il modello di previsione dell'uso basato su dati urbani multidimensionali viene costruito utilizzando l'algoritmo di classificazione delle foreste casuale. Attraverso l'analisi, scopriamo che la maggior parte delle attività di vendita al dettaglio e dei servizi di Milano si concentrano su una scala di vicinato da 100 a 300 metri e i cluster mostrano 5 tipici modelli spaziali in scala urbana. L’uso commerciale a Milano è classificato in 6 categorie e 16 sottocategorie. Nel complesso, Milano mostra un tipico schema monocentrico, ulteriormente convalidato con la teoria del “bid-rent”. Il modello di predizione ha rilevato alcuni elementi di rischio e potenziali in relazione all’uso del suolo e ha previsto il cambiamento d’uso conseguenti alla costruzione della Metro 4. Infine, attraverso il clustering, la classificazione e la regressione, il nuovo metodo è composto dal "rilevare la relazione", "stabilire una relazione" e "rappresentare la relazione" attraverso il ragionamento induttivo e deduttivo, così da coinvolgere tutte le variabili correlate da campioni di grandi dimensioni e portare a una più completa e interattiva relazione tra variabili negli studi urbani. Si spera che questi metodi di ricerca non siano solo applicabili allo studio delle attività di vendita al dettaglio e di servizi, ma che possano essere ulteriormente utilizzati nella ricerca e nell'analisi di altri campi dello studio urbano.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Retail and service activities spatial distribution analysis_10_ff.pdf

Open Access dal 25/09/2019

Descrizione: Thesis Final Version
Dimensione 119.74 MB
Formato Adobe PDF
119.74 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/143280