In today’s society, big companies, Banks and Governments are interested to know which are the geographical areas with highest potential. It cannot be hidden that the definition of potential is made by them in terms of profitability. Consequently a crucial interest is in the possibility to create a model to find which are the locations with the highest number of transactions. This research aims to find a model allowing one to predict the number of transactions in each borough of Italy using demographic information. For the scope, a number of datasets provided by a Bank and obtained from the 2011 census made by ISTAT are used. The analysis shows that it is possible to predict with a good accuracy the order of magnitude of transactions by looking at features like number of inhabitants, income, number of withdrawals. The model found is based on a weighted principal component regression. The goodness of the fitting is tested through a cross-validation approach. Moreover the absence of spatial association and spatial outliers in the residuals is checked with spatial statistical techniques, in particular local indicators of spatial association. This reinforces the choice to avoid the usage of a spatial model. From the analysis, it is evident that the estimation could be improved by adding a variable related to tourism. Since this variable is not given in any of the available dataset, the compositional shape of transactions is analysed, to infer the touristic nature of boroughs from available data. The compositional data analysis of the percentages of transactions over the year can be explained in terms of tourism and allow to improve the model found.

Nel mondo odierno, grandi società, banche e governi sono interessati a conoscere quali siano le aree geografiche con potenziale più alto. Non si può nascondere che la definizione di potenziale da loro considerata sia quella legata alla redditività. Di conseguenza è di cruciale interesse la realizzazione di un modello per individuare le località con il più elevato numero di transazioni. Questa ricerca si pone quindi l’obiettivo di prevedere il numero di transazioni in ogni comune d’Italia utilizzando variabili demografiche. Per questo scopo sono stati utilizzati i dati di una banca e il censimento ISTAT del 2011. Le analisi mostrano che è possibile prevedere con grande accuratezza l’ordine di grandezza delle transazioni attraverso variabili come il numero di abitanti, il reddito e il numero di prelievi. Il modello trovato è basato su una regressione pesata delle componenti principali. La precisione del modello è stata testata attraverso la tecnica della validazione incrociata. Inoltre l’assenza di correlazione e anomalie spaziali è stata indagata attraverso metodi di statistica spaziale, in particolare tramite indicatori locali di associazione spaziale. I risultati ottenuti hanno dato fondamento alla scelta di non utilizzare un modello spaziale. Dalle analisi è emerso che i valori predetti potrebbero essere migliorati utilizzando una variabile relativa al turismo. Dal momento che questa variabile non era presente nei dati a disposizione, sono stati analizzati i profili composizionali delle transazioni per dedurre la presenza di turismo nei comuni a partire dai dati disponibili. Le analisi composizionali delle percentuali delle transazioni durante l’anno possono essere spiegati in termini di turismo e permettono di migliorare il modello trovato.

A predictive model for high potential areas based on spatial and compositional analysis of transactions

BONZI, KRISTIN
2018/2019

Abstract

In today’s society, big companies, Banks and Governments are interested to know which are the geographical areas with highest potential. It cannot be hidden that the definition of potential is made by them in terms of profitability. Consequently a crucial interest is in the possibility to create a model to find which are the locations with the highest number of transactions. This research aims to find a model allowing one to predict the number of transactions in each borough of Italy using demographic information. For the scope, a number of datasets provided by a Bank and obtained from the 2011 census made by ISTAT are used. The analysis shows that it is possible to predict with a good accuracy the order of magnitude of transactions by looking at features like number of inhabitants, income, number of withdrawals. The model found is based on a weighted principal component regression. The goodness of the fitting is tested through a cross-validation approach. Moreover the absence of spatial association and spatial outliers in the residuals is checked with spatial statistical techniques, in particular local indicators of spatial association. This reinforces the choice to avoid the usage of a spatial model. From the analysis, it is evident that the estimation could be improved by adding a variable related to tourism. Since this variable is not given in any of the available dataset, the compositional shape of transactions is analysed, to infer the touristic nature of boroughs from available data. The compositional data analysis of the percentages of transactions over the year can be explained in terms of tourism and allow to improve the model found.
BARARDI, ALESSANDRO
ING - Scuola di Ingegneria Industriale e dell'Informazione
29-apr-2020
2018/2019
Nel mondo odierno, grandi società, banche e governi sono interessati a conoscere quali siano le aree geografiche con potenziale più alto. Non si può nascondere che la definizione di potenziale da loro considerata sia quella legata alla redditività. Di conseguenza è di cruciale interesse la realizzazione di un modello per individuare le località con il più elevato numero di transazioni. Questa ricerca si pone quindi l’obiettivo di prevedere il numero di transazioni in ogni comune d’Italia utilizzando variabili demografiche. Per questo scopo sono stati utilizzati i dati di una banca e il censimento ISTAT del 2011. Le analisi mostrano che è possibile prevedere con grande accuratezza l’ordine di grandezza delle transazioni attraverso variabili come il numero di abitanti, il reddito e il numero di prelievi. Il modello trovato è basato su una regressione pesata delle componenti principali. La precisione del modello è stata testata attraverso la tecnica della validazione incrociata. Inoltre l’assenza di correlazione e anomalie spaziali è stata indagata attraverso metodi di statistica spaziale, in particolare tramite indicatori locali di associazione spaziale. I risultati ottenuti hanno dato fondamento alla scelta di non utilizzare un modello spaziale. Dalle analisi è emerso che i valori predetti potrebbero essere migliorati utilizzando una variabile relativa al turismo. Dal momento che questa variabile non era presente nei dati a disposizione, sono stati analizzati i profili composizionali delle transazioni per dedurre la presenza di turismo nei comuni a partire dai dati disponibili. Le analisi composizionali delle percentuali delle transazioni durante l’anno possono essere spiegati in termini di turismo e permettono di migliorare il modello trovato.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2020_04_Bonzi.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 55.09 MB
Formato Adobe PDF
55.09 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/152914