Cybersecurity in the Healthcare sector has become an important asset that aims to pro tect patient personal information and prevent attacks on the technology infrastructure that can affect the patient’s health and safety. For this purpose, cyber risk analysis must be performed to draw up a Risk Assessment document stating the company’s risk level. Despite every business deals with cybersecurity, the healthcare sector has been one of the most affected by cyber attacks in the last ten years. This is because patients’ clinical information is the most valuable data to steal and because an attack on a medical device (DM) can directly or indirectly affect the health and well-being of patients. Because of that, this sector is more inclined to evaluate the possibility of paying a ransom or coming to terms with criminals. This highlights the importance for a hospital or, in general, a healthcare company of having state-of-the-art technological facilities where it is impossible to have efficient and fast analysis methods to be aware of the risks and vulnerabilities. We proposed a model to speed up the process of drawing up a cyber-risk analysis with the help of Natural Language Processing (NLP) operations, exploiting Named Entity Recognition (NER) tasks in the healthcare domain and paying attention to remain strict at the stan dard provided by the National Institute of Standards and Technology (NIST) Framework. We took into account the use case of AOU Sant’Andrea of Rome, and we performed an AI-driven cyber-risk assessment that ended up with a risk index as an outcome to attach to a more general risk assessment document. Our model consists of an Artificial Neural Network (ANN) based on the SpaCy library and trained in the healthcare and cyberse curity domain to perform NER on MITRE’s CVE annual reports. We then compared the found entities with the Installed Base (IB) of the hospital to produce a dynamic risk index through statistical methods and merged with a static one to produce a final risk grade: LOW, MEDIUM, or HIGH for each DM. The performances of our model are: F1 score of 0.93, precision score of 0.93, and recall score of 0.94.

La cybersecurity nel settore sanitario è diventata un’importante risorsa per la protezione delle informazioni personali dei pazienti e per la prevenzione da attacchi all’infrastruttura tecnologica che possono ledere salute e sicurezza dei pazienti. A tal fine, deve essere eseguita un’analisi del rischio informatico per redigere un documento che ne indichi il livello dell’azienda. Nonostante ogni settore si occupi di cybersecurity, il settore sanitario è stato uno dei più colpiti dagli attacchi informatici negli ultimi dieci anni. Questo perché le informazioni cliniche dei pazienti sono i dati più preziosi da rubare e perché un attacco a un dispositivo medico (DM) può influenzare direttamente o indirettamente la salute e il benessere dei pazienti. Pertanto, questo settore è più incline a valutare la possibil ità di pagare un riscatto o di venire a patti con i criminali. Ciò evidenzia l’importanza per un ospedale o, in generale per un’azienda sanitaria, di avere strutture tecnologiche all’avanguardia e avere metodi di analisi efficienti per essere consapevoli di rischi e vul nerabilità. Abbiamo quindi proposto un modello per velocizzare il processo di analisi del rischio informatico con l’aiuto del Natural Language Processing (NLP), sfruttando la Named Entity Recognition (NER) nel dominio sanitario e rispettando gli standard forniti dal Framework del National Institute of Standards and Technology (NIST). Abbiamo poi preso in considerazione il caso d’uso dell’AOU Sant’Andrea di Roma e abbiamo effettuato una valutazione del rischio informatico guidata dall’IA che ha prodotto un indice di ris chio come risultato. Il nostro modello consiste in una Rete Neurale Artificiale (ANN) basata sulla libreria SpaCy e addestrata nel dominio sanitario e della cybersecurity per eseguire NER sui rapporti annuali CVE del MITRE. Abbiamo poi confrontato le entità trovate con l’Installato Base (IB) dell’ospedale per produrre, attraverso metodi statistici, un indice di rischio dinamico unito poi con uno statico per produrne uno finale: BASSO, MEDIO o ALTO per ogni DM. Le prestazioni del nostro modello sono: punteggio F1 di 0,93, precisione di 0,93 e punteggio di richiamo di 0,94.

Named entity recognition network for cyber risk assessment in healthcare domain

BANCALE, LORENZO
2022/2023

Abstract

Cybersecurity in the Healthcare sector has become an important asset that aims to pro tect patient personal information and prevent attacks on the technology infrastructure that can affect the patient’s health and safety. For this purpose, cyber risk analysis must be performed to draw up a Risk Assessment document stating the company’s risk level. Despite every business deals with cybersecurity, the healthcare sector has been one of the most affected by cyber attacks in the last ten years. This is because patients’ clinical information is the most valuable data to steal and because an attack on a medical device (DM) can directly or indirectly affect the health and well-being of patients. Because of that, this sector is more inclined to evaluate the possibility of paying a ransom or coming to terms with criminals. This highlights the importance for a hospital or, in general, a healthcare company of having state-of-the-art technological facilities where it is impossible to have efficient and fast analysis methods to be aware of the risks and vulnerabilities. We proposed a model to speed up the process of drawing up a cyber-risk analysis with the help of Natural Language Processing (NLP) operations, exploiting Named Entity Recognition (NER) tasks in the healthcare domain and paying attention to remain strict at the stan dard provided by the National Institute of Standards and Technology (NIST) Framework. We took into account the use case of AOU Sant’Andrea of Rome, and we performed an AI-driven cyber-risk assessment that ended up with a risk index as an outcome to attach to a more general risk assessment document. Our model consists of an Artificial Neural Network (ANN) based on the SpaCy library and trained in the healthcare and cyberse curity domain to perform NER on MITRE’s CVE annual reports. We then compared the found entities with the Installed Base (IB) of the hospital to produce a dynamic risk index through statistical methods and merged with a static one to produce a final risk grade: LOW, MEDIUM, or HIGH for each DM. The performances of our model are: F1 score of 0.93, precision score of 0.93, and recall score of 0.94.
Falvo, Antonio
ING - Scuola di Ingegneria Industriale e dell'Informazione
19-dic-2023
2022/2023
La cybersecurity nel settore sanitario è diventata un’importante risorsa per la protezione delle informazioni personali dei pazienti e per la prevenzione da attacchi all’infrastruttura tecnologica che possono ledere salute e sicurezza dei pazienti. A tal fine, deve essere eseguita un’analisi del rischio informatico per redigere un documento che ne indichi il livello dell’azienda. Nonostante ogni settore si occupi di cybersecurity, il settore sanitario è stato uno dei più colpiti dagli attacchi informatici negli ultimi dieci anni. Questo perché le informazioni cliniche dei pazienti sono i dati più preziosi da rubare e perché un attacco a un dispositivo medico (DM) può influenzare direttamente o indirettamente la salute e il benessere dei pazienti. Pertanto, questo settore è più incline a valutare la possibil ità di pagare un riscatto o di venire a patti con i criminali. Ciò evidenzia l’importanza per un ospedale o, in generale per un’azienda sanitaria, di avere strutture tecnologiche all’avanguardia e avere metodi di analisi efficienti per essere consapevoli di rischi e vul nerabilità. Abbiamo quindi proposto un modello per velocizzare il processo di analisi del rischio informatico con l’aiuto del Natural Language Processing (NLP), sfruttando la Named Entity Recognition (NER) nel dominio sanitario e rispettando gli standard forniti dal Framework del National Institute of Standards and Technology (NIST). Abbiamo poi preso in considerazione il caso d’uso dell’AOU Sant’Andrea di Roma e abbiamo effettuato una valutazione del rischio informatico guidata dall’IA che ha prodotto un indice di ris chio come risultato. Il nostro modello consiste in una Rete Neurale Artificiale (ANN) basata sulla libreria SpaCy e addestrata nel dominio sanitario e della cybersecurity per eseguire NER sui rapporti annuali CVE del MITRE. Abbiamo poi confrontato le entità trovate con l’Installato Base (IB) dell’ospedale per produrre, attraverso metodi statistici, un indice di rischio dinamico unito poi con uno statico per produrne uno finale: BASSO, MEDIO o ALTO per ogni DM. Le prestazioni del nostro modello sono: punteggio F1 di 0,93, precisione di 0,93 e punteggio di richiamo di 0,94.
File allegati
File Dimensione Formato  
2023_12_Bancale.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 4.71 MB
Formato Adobe PDF
4.71 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/214281