In the nuclear and particle physics research panorama, many international experimental laboratories, such as CERN, ITER, Gran Sasso Science Institute, DESY, Fermi and SLAC National Accelerator Laboratories, are Complex Technical Infrastructures (CTIs), i.e. large-scale systems made of tens of thousands of interdependent components organized in complex hierarchical architectures. Some of these CTIs evolve in time in a way that at one point their functional logic may be more complex than originally designed. This makes difficult to minimize and mitigate the impact of components failures in order to optimize the overall availability of the CTIs. Given the difficulty of keeping up to date the functional logic of the CTIs based on engineering knowledge, traditional reliability/risk importance measures cannot be used for identifying the critical components and configurations on which to allocate the protection and recovery efforts, prioritarily. In this situation, the present work proposes a way to make use of the large amount of operational data collected from the CTI monitoring system, which contains the values of tens of thousands of signals recorded over long periods of time under different CTI operational settings, for the identification of the most critical components. The underlying idea is to develop binary classifiers to associate different combinations of signals to the CTI operating or failed state. From the set of signals optimally classifying the CTI state, it is possible to deduce the critical CTI components whose conditions these signals monitor. In other words, the problem of identifying the critical components is addressed as a feature selection problem, for the solution of which two different approaches are investigated and compared: a filter approach based on the RELIEF algorithm and a wrapper approach based on Support Vector Machine (SVM) classifiers and the Binary Differential Evolution algorithm for the search of the features set. The two approaches have been successfully applied to a real dataset collected from the technical infrastructure supporting the CERN Large Hadron Collider (LHC).

Nel mondo della ricerca nucleare e della fisica delle particelle, i principali laboratori sperimentali, come CERN, ITER, Laboratori nazionali del Gran Sasso, DESY, Fermilab e SLAC National Accelerator Laboratory, sono Infrastrutture Tecniche Complesse (Complex Technical Infrastructure CTI), ossia sistemi costituiti da decine di migliaia di componenti interdipendenti e organizzati secondo logiche gerarchiche. Modifiche strutturali e funzionali modificano nel tempo la logica funzionale che si complica rispetto al progetto iniziale. Questo rende più complesso attuare le misure necessarie a minimizzare e mitigare l’impatto del malfunzionamento dei componenti. Data la difficoltà nel tenere aggiornati gli schemi funzionali sulla base di conoscenze ingegneristiche, le tradizionali analisi di affidabilità e rischio basate su misure di importanza, e quindi sulla conoscenza degli schemi funzionali, non possono essere usate per identificare i componenti e configurazioni critici. Nel presente lavoro si propone una metodologia per sfruttare la grande quantità di dati operazionali, collezionati dai sistemi di monitoraggio della CTI su decine di migliaia di segnali e in diverse condizioni operative, per identificare i componenti più critici. L’idea alla base della metodologia è quella di identificare i componenti critici tramite la selezione dei segnali critici (feature selection). Quest’ultima viene eseguita allenando, con diversi set di segnali, dei classificatori binari (binary classifiers) che predicano lo stato operativo o di fallimento della CTI, sulla base del valore dei segnali. Il set di segnali che induce le migliori prestazioni di classificazione viene analizzato per dedurre i corrispondenti componenti della CTI. La selezione dei segnali critici viene fatta tramite un approccio a filtro (filter approach) basato sull’algoritmo RELIEF, e tramite uno ad involucro (wrapper approach) basato sul classificatore Support Vector Machine (SVM) e sull’algoritmo di ricerca Binary Differential Evolution. I due approcci sono stati testati con successo sui dati raccolti dall’infrastruttura tecnica di supporto del Large Hadron Collider (LHC) del CERN.

A feature selection-based approach for the identification of critical components in nuclear and particle physics research laboratories : application to the CERN large hadron collider

CASTELLANO, ANDREA
2017/2018

Abstract

In the nuclear and particle physics research panorama, many international experimental laboratories, such as CERN, ITER, Gran Sasso Science Institute, DESY, Fermi and SLAC National Accelerator Laboratories, are Complex Technical Infrastructures (CTIs), i.e. large-scale systems made of tens of thousands of interdependent components organized in complex hierarchical architectures. Some of these CTIs evolve in time in a way that at one point their functional logic may be more complex than originally designed. This makes difficult to minimize and mitigate the impact of components failures in order to optimize the overall availability of the CTIs. Given the difficulty of keeping up to date the functional logic of the CTIs based on engineering knowledge, traditional reliability/risk importance measures cannot be used for identifying the critical components and configurations on which to allocate the protection and recovery efforts, prioritarily. In this situation, the present work proposes a way to make use of the large amount of operational data collected from the CTI monitoring system, which contains the values of tens of thousands of signals recorded over long periods of time under different CTI operational settings, for the identification of the most critical components. The underlying idea is to develop binary classifiers to associate different combinations of signals to the CTI operating or failed state. From the set of signals optimally classifying the CTI state, it is possible to deduce the critical CTI components whose conditions these signals monitor. In other words, the problem of identifying the critical components is addressed as a feature selection problem, for the solution of which two different approaches are investigated and compared: a filter approach based on the RELIEF algorithm and a wrapper approach based on Support Vector Machine (SVM) classifiers and the Binary Differential Evolution algorithm for the search of the features set. The two approaches have been successfully applied to a real dataset collected from the technical infrastructure supporting the CERN Large Hadron Collider (LHC).
BARALDI, PIERO
GENTILE, UGO
SERIO, LUIGI
SHOKRY, AHMED
ING - Scuola di Ingegneria Industriale e dell'Informazione
25-lug-2018
2017/2018
Nel mondo della ricerca nucleare e della fisica delle particelle, i principali laboratori sperimentali, come CERN, ITER, Laboratori nazionali del Gran Sasso, DESY, Fermilab e SLAC National Accelerator Laboratory, sono Infrastrutture Tecniche Complesse (Complex Technical Infrastructure CTI), ossia sistemi costituiti da decine di migliaia di componenti interdipendenti e organizzati secondo logiche gerarchiche. Modifiche strutturali e funzionali modificano nel tempo la logica funzionale che si complica rispetto al progetto iniziale. Questo rende più complesso attuare le misure necessarie a minimizzare e mitigare l’impatto del malfunzionamento dei componenti. Data la difficoltà nel tenere aggiornati gli schemi funzionali sulla base di conoscenze ingegneristiche, le tradizionali analisi di affidabilità e rischio basate su misure di importanza, e quindi sulla conoscenza degli schemi funzionali, non possono essere usate per identificare i componenti e configurazioni critici. Nel presente lavoro si propone una metodologia per sfruttare la grande quantità di dati operazionali, collezionati dai sistemi di monitoraggio della CTI su decine di migliaia di segnali e in diverse condizioni operative, per identificare i componenti più critici. L’idea alla base della metodologia è quella di identificare i componenti critici tramite la selezione dei segnali critici (feature selection). Quest’ultima viene eseguita allenando, con diversi set di segnali, dei classificatori binari (binary classifiers) che predicano lo stato operativo o di fallimento della CTI, sulla base del valore dei segnali. Il set di segnali che induce le migliori prestazioni di classificazione viene analizzato per dedurre i corrispondenti componenti della CTI. La selezione dei segnali critici viene fatta tramite un approccio a filtro (filter approach) basato sull’algoritmo RELIEF, e tramite uno ad involucro (wrapper approach) basato sul classificatore Support Vector Machine (SVM) e sull’algoritmo di ricerca Binary Differential Evolution. I due approcci sono stati testati con successo sui dati raccolti dall’infrastruttura tecnica di supporto del Large Hadron Collider (LHC) del CERN.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2018_07_Castellano.pdf

non accessibile

Descrizione: Thesis text
Dimensione 1.79 MB
Formato Adobe PDF
1.79 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/141283