Modern technology has made it possible to create and store ever-increasing amounts of information and data volumes have increased rapidly. The vast amounts of data collected and stored using these technologies can offer transformational benefits to businesses around the world, but only if we are able to interpret it; indeed this data would be almost useless if not processed and transformed into information. In particular, in the world of IOT, devices such as sensors, robots, detectors or control devices are constantly performing their actions periodically over time, storing and transmitting a huge amount of data. Among the heterogeneous data available, time series represent a strand of information that is still quite immature. Current data mining techniques have several shortcomings when time series have to be analyzed, especially when more than one time series, i.e. multidimensional time series, should be analysed together to extract knowledge from the data. An example of that is mobile network, whose cells at every hour of the day record a huge amount of data from the high rate of devices that hook up to them and from the frequency with which this happens. The aim of this thesis is to develop a reliable and concrete profile of a telephone cell by analysing its periodic data and then clustering together those with similar profiles. In this way, the company will be able to learn which cells have similar behaviour and characteristics. A pipeline will be devised that will start with the selection and processing of data using techniques known in the literature, while a new clustering algorithm called K-MDTSC (K-Multi-Dimensional Time-Series Clustering). In this scenario we analyse the time span of three months of data from Vodafone's Mobile cells currently used in Milan, in order to describe their different use and highlight their main characteristics and differences.

La tecnologia moderna ha consentito la creazione e l'archiviazione di quantità sempre più crescenti di informazioni, i volumi di dati sono aumentati rapidamente. I moltissimi dati raccolti e archiviati mediante queste tecnologie possono offrire vantaggi in termini di trasformazione ad aziende in tutto il mondo, ma solo se siamo in grado di interpretarli; infatti, questi dati risulterebbero pressoché inutili se non processati e trasformati in informazioni. In particolare, nel mondo dell’Iot apparecchiature come sensori, robot, rilevatori o dispositivi di controllo effettuano costantemente le loro azioni periodicamente nel tempo immagazzinando e trasmettendo un enorme mole di dati. Tra i dati eterogenei disponibili, le serie temporali rappresentano un filone di informazioni ancora abbastanza acerbo. Le attuali tecniche di data mining presentano diverse carenze durante l'analisi delle serie temporali, soprattutto quando più di una serie temporale, ovvero serie temporali multidimensionali, dovrebbero essere analizzate insieme per estrarre conoscenza dai dati. Un esempio ne è la rete cellulare, le cui celle ogni ora del giorno registrano un’enorme quantità di dati provenienti dall'elevato tasso di dispositivi che si agganciano ad esse e dalla frequenza con cui ciò avviene. Lo scopo di questa tesi è di sviluppare in maniera affidabile e concreta il profilo di una cella telefonica analizzando i dati suoi dati periodici ed infine raggruppare quelle aventi profili simili. In questo modo l’azienda potrà apprendere quali celle hanno dei comportamenti e delle caratteristiche analoghe. Verrà ideata una pipeline che partirà dalla selezione e l'elaborazione dei dati utilizzando tecniche note in letteratura, mentre per far fronte alla difficoltà di analisi delle Serie Temporali Multi-Dimensionali verrà utilizzato un nuovo algoritmo di clustering chiamato K-MDTSC (K-Multi-Dimensional Time-Series Clustering). In questo scenario analizziamo l'arco temporale di tre mesi di dati derivanti dalle celle telefoniche di Vodafone attualmente in uso a Milano, in modo da descriverne il diverso utilizzo e evidenzandone le principali caratteristiche e diversità.

Multi-dimensional time-series clustering for mobile cellular networks key performance indicators

Consonni, Luca
2020/2021

Abstract

Modern technology has made it possible to create and store ever-increasing amounts of information and data volumes have increased rapidly. The vast amounts of data collected and stored using these technologies can offer transformational benefits to businesses around the world, but only if we are able to interpret it; indeed this data would be almost useless if not processed and transformed into information. In particular, in the world of IOT, devices such as sensors, robots, detectors or control devices are constantly performing their actions periodically over time, storing and transmitting a huge amount of data. Among the heterogeneous data available, time series represent a strand of information that is still quite immature. Current data mining techniques have several shortcomings when time series have to be analyzed, especially when more than one time series, i.e. multidimensional time series, should be analysed together to extract knowledge from the data. An example of that is mobile network, whose cells at every hour of the day record a huge amount of data from the high rate of devices that hook up to them and from the frequency with which this happens. The aim of this thesis is to develop a reliable and concrete profile of a telephone cell by analysing its periodic data and then clustering together those with similar profiles. In this way, the company will be able to learn which cells have similar behaviour and characteristics. A pipeline will be devised that will start with the selection and processing of data using techniques known in the literature, while a new clustering algorithm called K-MDTSC (K-Multi-Dimensional Time-Series Clustering). In this scenario we analyse the time span of three months of data from Vodafone's Mobile cells currently used in Milan, in order to describe their different use and highlight their main characteristics and differences.
ING - Scuola di Ingegneria Industriale e dell'Informazione
28-apr-2022
2020/2021
La tecnologia moderna ha consentito la creazione e l'archiviazione di quantità sempre più crescenti di informazioni, i volumi di dati sono aumentati rapidamente. I moltissimi dati raccolti e archiviati mediante queste tecnologie possono offrire vantaggi in termini di trasformazione ad aziende in tutto il mondo, ma solo se siamo in grado di interpretarli; infatti, questi dati risulterebbero pressoché inutili se non processati e trasformati in informazioni. In particolare, nel mondo dell’Iot apparecchiature come sensori, robot, rilevatori o dispositivi di controllo effettuano costantemente le loro azioni periodicamente nel tempo immagazzinando e trasmettendo un enorme mole di dati. Tra i dati eterogenei disponibili, le serie temporali rappresentano un filone di informazioni ancora abbastanza acerbo. Le attuali tecniche di data mining presentano diverse carenze durante l'analisi delle serie temporali, soprattutto quando più di una serie temporale, ovvero serie temporali multidimensionali, dovrebbero essere analizzate insieme per estrarre conoscenza dai dati. Un esempio ne è la rete cellulare, le cui celle ogni ora del giorno registrano un’enorme quantità di dati provenienti dall'elevato tasso di dispositivi che si agganciano ad esse e dalla frequenza con cui ciò avviene. Lo scopo di questa tesi è di sviluppare in maniera affidabile e concreta il profilo di una cella telefonica analizzando i dati suoi dati periodici ed infine raggruppare quelle aventi profili simili. In questo modo l’azienda potrà apprendere quali celle hanno dei comportamenti e delle caratteristiche analoghe. Verrà ideata una pipeline che partirà dalla selezione e l'elaborazione dei dati utilizzando tecniche note in letteratura, mentre per far fronte alla difficoltà di analisi delle Serie Temporali Multi-Dimensionali verrà utilizzato un nuovo algoritmo di clustering chiamato K-MDTSC (K-Multi-Dimensional Time-Series Clustering). In questo scenario analizziamo l'arco temporale di tre mesi di dati derivanti dalle celle telefoniche di Vodafone attualmente in uso a Milano, in modo da descriverne il diverso utilizzo e evidenzandone le principali caratteristiche e diversità.
File allegati
File Dimensione Formato  
Multi-Dimensional time-Series clustering for Mobile Cellular Networks Key Performance Indicators.pdf

non accessibile

Descrizione: Tesi Laurea Magistrale, Computer Science
Dimensione 7.6 MB
Formato Adobe PDF
7.6 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/187114