Present-day Communication Technologies, like 5G cellular systems must be highly reliable. While this is the first reason, having adaptation to fault recognition and having strong availability of networks, and fast recovery from problems is by all accounts a definitive objective. One stage towards arriving at unwavering quality in networks is failure identification and maintaining the network without any disturbances which are crucial elements for providing hustle free service to the customers. So, information describing the failure events such as alarms data is essential in communication networks such as Microwave Networks since it has been for the most part known as an important source of data for fault recognition and announcing link failures. An Alarm is a message delivered by a link in the network, ordinarily when an issue happens all of a sudden. While preparing alarm logs, issues related to propagation or hardware equipment are transferred to a network engineer and it is very difficult for the person to analyze the data because of the instability. Data is divided into various classes in which “Hardware Failures” class is formed by points for which the failure root-cause does not provide a distinguishable behavior. So this category is analyzed in our work to produce the features sets for future analysis to find any appropriate sub-classes in “Hardware Failures” class. Generally, the alarms are raised when there can be one or more problems in the network link. There can be issues in both software and hardware parts (physical devices) of the network. Often multiple alarms arise simultaneously, so, in order to reduce complexity, some alarms can be neglected, depending on the specific analysis to be performed. Manual examination of such data logs is tedious and exorbitant because they include a broad measure of information. Then, the identification of valuable data can be likewise very testing. Accordingly, finding appropriate techniques to process these logs legitimately is a well-established exercise in data analysis. In any case, the accessible information is not generally sufficient and accurately labeled to permit a managed order approach. To tackle this issue, one can use Clustering methodologies, which make use of unlabeled data very effectively. With the sole help of data analysis, we can easily mine alarm logs and, in this manner, give significant information for Machine Learning analysis to find potential causes of failure. Our main work in this thesis is reviewing the main steps of Machine Learning and, we can build a predictive model. The main steps involved before predicting a model are Data Acquisition, Data Cleaning, Data Mining, and Data Manipulation.

Le odierne tecnologie di comunicazione, come i sistemi cellulari 5G, devono essere altamente affidabili. Sebbene questa sia la prima ragione, avere un adattamento al riconoscimento dei guasti e una forte disponibilità di reti e un rapido recupero dai problemi è a tutti gli effetti un obiettivo definitivo. Una fase verso il raggiungimento di una qualità costante nelle reti è l'identificazione dei guasti e il mantenimento della rete senza disturbi, elementi cruciali per fornire un servizio gratuito ai clienti. Pertanto, le informazioni che descrivono gli eventi di guasto come i dati degli allarmi sono essenziali nelle reti di comunicazione come le reti a microonde poiché sono state per la maggior parte note come un'importante fonte di dati per il riconoscimento dei guasti e l'annuncio dei guasti di collegamento. Un allarme è un messaggio consegnato da un collegamento in rete, normalmente quando si verifica un problema all'improvviso. Durante la preparazione dei registri degli allarmi, i problemi relativi alla propagazione o alle apparecchiature hardware vengono trasferiti a un ingegnere di rete ed è molto difficile per la persona analizzare i dati a causa dell'instabilità. I dati sono suddivisi in varie classi in cui la classe “Hardware Failures” è formata da punti per i quali la causa principale del guasto non fornisce un comportamento distinguibile. Quindi questa categoria viene analizzata nel nostro lavoro per produrre i set di funzionalità per analisi future per trovare eventuali sottoclassi appropriate nella classe "Guasti hardware". Generalmente, gli allarmi vengono generati quando possono esserci uno o più problemi nel collegamento di rete. Possono esserci problemi sia nel software che nelle parti hardware (dispositivi fisici) della rete. Spesso si verificano più allarmi contemporaneamente, quindi, per ridurre la complessità, alcuni allarmi possono essere trascurati, a seconda dell'analisi specifica da eseguire. L'esame manuale di tali registri di dati è noioso ed esorbitante perché includono un'ampia misura di informazioni. Quindi, anche l'identificazione di dati preziosi può essere molto test. Di conseguenza, trovare tecniche appropriate per elaborare questi registri in modo legittimo è un esercizio consolidato di analisi dei dati. In ogni caso, le informazioni accessibili non sono generalmente sufficienti ed etichettate accuratamente per consentire un approccio di ordine gestito. Per affrontare questo problema, è possibile utilizzare metodologie di clustering, che fanno uso di dati senza etichetta in modo molto efficace. Con il solo aiuto dell'analisi dei dati, possiamo facilmente estrarre i registri degli allarmi e, in questo modo, fornire informazioni significative per l'analisi di Machine Learning per trovare potenziali cause di guasto. Il nostro lavoro principale in questa tesi è rivedere i passaggi principali del Machine Learning e possiamo costruire un modello predittivo. I passaggi principali coinvolti prima di prevedere un modello sono l'acquisizione dei dati, la pulizia dei dati, il data mining e la manipolazione dei dati.

Data analysis for hardware failure identification in microwave networks

TADEPALLI, SRIKANTH
2019/2020

Abstract

Present-day Communication Technologies, like 5G cellular systems must be highly reliable. While this is the first reason, having adaptation to fault recognition and having strong availability of networks, and fast recovery from problems is by all accounts a definitive objective. One stage towards arriving at unwavering quality in networks is failure identification and maintaining the network without any disturbances which are crucial elements for providing hustle free service to the customers. So, information describing the failure events such as alarms data is essential in communication networks such as Microwave Networks since it has been for the most part known as an important source of data for fault recognition and announcing link failures. An Alarm is a message delivered by a link in the network, ordinarily when an issue happens all of a sudden. While preparing alarm logs, issues related to propagation or hardware equipment are transferred to a network engineer and it is very difficult for the person to analyze the data because of the instability. Data is divided into various classes in which “Hardware Failures” class is formed by points for which the failure root-cause does not provide a distinguishable behavior. So this category is analyzed in our work to produce the features sets for future analysis to find any appropriate sub-classes in “Hardware Failures” class. Generally, the alarms are raised when there can be one or more problems in the network link. There can be issues in both software and hardware parts (physical devices) of the network. Often multiple alarms arise simultaneously, so, in order to reduce complexity, some alarms can be neglected, depending on the specific analysis to be performed. Manual examination of such data logs is tedious and exorbitant because they include a broad measure of information. Then, the identification of valuable data can be likewise very testing. Accordingly, finding appropriate techniques to process these logs legitimately is a well-established exercise in data analysis. In any case, the accessible information is not generally sufficient and accurately labeled to permit a managed order approach. To tackle this issue, one can use Clustering methodologies, which make use of unlabeled data very effectively. With the sole help of data analysis, we can easily mine alarm logs and, in this manner, give significant information for Machine Learning analysis to find potential causes of failure. Our main work in this thesis is reviewing the main steps of Machine Learning and, we can build a predictive model. The main steps involved before predicting a model are Data Acquisition, Data Cleaning, Data Mining, and Data Manipulation.
AYOUB, OMRAN
ING - Scuola di Ingegneria Industriale e dell'Informazione
2-ott-2020
2019/2020
Le odierne tecnologie di comunicazione, come i sistemi cellulari 5G, devono essere altamente affidabili. Sebbene questa sia la prima ragione, avere un adattamento al riconoscimento dei guasti e una forte disponibilità di reti e un rapido recupero dai problemi è a tutti gli effetti un obiettivo definitivo. Una fase verso il raggiungimento di una qualità costante nelle reti è l'identificazione dei guasti e il mantenimento della rete senza disturbi, elementi cruciali per fornire un servizio gratuito ai clienti. Pertanto, le informazioni che descrivono gli eventi di guasto come i dati degli allarmi sono essenziali nelle reti di comunicazione come le reti a microonde poiché sono state per la maggior parte note come un'importante fonte di dati per il riconoscimento dei guasti e l'annuncio dei guasti di collegamento. Un allarme è un messaggio consegnato da un collegamento in rete, normalmente quando si verifica un problema all'improvviso. Durante la preparazione dei registri degli allarmi, i problemi relativi alla propagazione o alle apparecchiature hardware vengono trasferiti a un ingegnere di rete ed è molto difficile per la persona analizzare i dati a causa dell'instabilità. I dati sono suddivisi in varie classi in cui la classe “Hardware Failures” è formata da punti per i quali la causa principale del guasto non fornisce un comportamento distinguibile. Quindi questa categoria viene analizzata nel nostro lavoro per produrre i set di funzionalità per analisi future per trovare eventuali sottoclassi appropriate nella classe "Guasti hardware". Generalmente, gli allarmi vengono generati quando possono esserci uno o più problemi nel collegamento di rete. Possono esserci problemi sia nel software che nelle parti hardware (dispositivi fisici) della rete. Spesso si verificano più allarmi contemporaneamente, quindi, per ridurre la complessità, alcuni allarmi possono essere trascurati, a seconda dell'analisi specifica da eseguire. L'esame manuale di tali registri di dati è noioso ed esorbitante perché includono un'ampia misura di informazioni. Quindi, anche l'identificazione di dati preziosi può essere molto test. Di conseguenza, trovare tecniche appropriate per elaborare questi registri in modo legittimo è un esercizio consolidato di analisi dei dati. In ogni caso, le informazioni accessibili non sono generalmente sufficienti ed etichettate accuratamente per consentire un approccio di ordine gestito. Per affrontare questo problema, è possibile utilizzare metodologie di clustering, che fanno uso di dati senza etichetta in modo molto efficace. Con il solo aiuto dell'analisi dei dati, possiamo facilmente estrarre i registri degli allarmi e, in questo modo, fornire informazioni significative per l'analisi di Machine Learning per trovare potenziali cause di guasto. Il nostro lavoro principale in questa tesi è rivedere i passaggi principali del Machine Learning e possiamo costruire un modello predittivo. I passaggi principali coinvolti prima di prevedere un modello sono l'acquisizione dei dati, la pulizia dei dati, il data mining e la manipolazione dei dati.
File allegati
File Dimensione Formato  
2020_10_TADEPALLI_SRIKANTH.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Thesis on "DATA ANALYSIS FOR HARDWARE FAILURE IDENTIFICATION IN MICROWAVE NETWORKS"
Dimensione 1.55 MB
Formato Adobe PDF
1.55 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/166043