In the contemporary era, the advancement of automotive technology has led to an increase in engine components, Electronic Control Units (ECUs), perception sensors, and vehicle-to-everything (V2X) communications systems within vehicles. Consequently, modern vehicles have become generators of vast quantities of raw data, often reaching one to two terabytes daily. These data contain various information, including driving conditions, terrains, and user preferences. In the prevailing paradigm, automotive network typically consist of numerous vehicles, each independently producing unique datasets. This substantial volume of data is regularly or continuously transmitted to a centralized server to enable monitoring, prognostics, diagnostics, and connectivity features. However, this centralized model raises concerns about the privacy and security of the sensitive information collected by vehicles. Federated Learning (FL) in automotive network offers enhanced privacy, efficient data utilization, a lower latency, and adaptability, making it a suitable approach for deploying machine learning models while addressing the unique challenges and requirements of the automotive domain. For these reasons, our work aims to develop a FL system based on the Intrusion Detection System (IDS) CANdito. We implement and evaluate the performance of famous FL approaches, FedAvg and FedProx, demonstrating their effectiveness against attacks generated from different distributions. These approaches ensure data privacy preservation while improving scalability without compromising individual privacy. We compare them with a centralized system (using the same IDS). Furthermore, through our experiments, we aim to demonstrate how FL exhibits robustness and scalability and supports transferability in a comparable or superior manner in some instances.

Al giorno d'oggi, il progresso della tecnologia automobilistica ha portato a un aumento dei componenti del motore, ECUs, sensori di percezione e sistemi di comunicazione V2X all’interno dei veicoli. Di conseguenza, i veicoli moderni generano grandi quantità di dati, che spesso raggiungono uno o due terabyte al giorno. Questi dati contengono varie informazioni, comprese le condizioni di guida, i terreni e le preferenze dell’utente. Le reti automobilistiche sono tipicamente costituite da numerosi veicoli, ognuno dei quali produce in modo indipendente set di dati unici. Questo notevole volume di dati viene trasmesso regolarmente o continuamente a un server centralizzato per abilitare funzionalità di monitoraggio, prognostica, diagnostica e connettività. Tuttavia, questo modello centralizzato solleva preoccupazioni circa la privacy e la sicurezza delle informazioni sensibili raccolte dai veicoli. Il FL nelle reti automobilistiche offre una maggiore privacy, un utilizzo efficiente dei dati, una latenza inferiore e adattabilità, rendendolo un approccio adatto per l’implementazione di modelli di apprendimento automatico, affrontando al contempo le sfide e i requisiti unici del dominio automobilistico. Per queste ragioni, il nostro lavoro mira a sviluppare un sistema FL basato sull’IDS CANdito. Nel nostro lavoro di ricerca implementiamo e valutiamo le performance di due famosi approcci di FL, FedAvg e FedProx, dimostrando la loro efficacia contro gli attacchi generati da diverse distribuzioni. Questi approcci garantiscono la conservazione della privacy dei dati migliorando al contempo la scalabilità senza compromettere la privacy individuale. I due algoritmi federati vengono confrontati con un sistema centralizzato (implementato utilizzando lo stesso IDS). Inoltre, attraverso i nostri esperimenti, miriamo a dimostrare come un sistema di FL mostri robustezza e scalabilità e supporti la trasferibilità in modo paragonabile o superiore in alcuni casi.

Panettone: evaluating federated learning implementations of can intrusion detection systems

CAINAZZO, ELISABETTA
2022/2023

Abstract

In the contemporary era, the advancement of automotive technology has led to an increase in engine components, Electronic Control Units (ECUs), perception sensors, and vehicle-to-everything (V2X) communications systems within vehicles. Consequently, modern vehicles have become generators of vast quantities of raw data, often reaching one to two terabytes daily. These data contain various information, including driving conditions, terrains, and user preferences. In the prevailing paradigm, automotive network typically consist of numerous vehicles, each independently producing unique datasets. This substantial volume of data is regularly or continuously transmitted to a centralized server to enable monitoring, prognostics, diagnostics, and connectivity features. However, this centralized model raises concerns about the privacy and security of the sensitive information collected by vehicles. Federated Learning (FL) in automotive network offers enhanced privacy, efficient data utilization, a lower latency, and adaptability, making it a suitable approach for deploying machine learning models while addressing the unique challenges and requirements of the automotive domain. For these reasons, our work aims to develop a FL system based on the Intrusion Detection System (IDS) CANdito. We implement and evaluate the performance of famous FL approaches, FedAvg and FedProx, demonstrating their effectiveness against attacks generated from different distributions. These approaches ensure data privacy preservation while improving scalability without compromising individual privacy. We compare them with a centralized system (using the same IDS). Furthermore, through our experiments, we aim to demonstrate how FL exhibits robustness and scalability and supports transferability in a comparable or superior manner in some instances.
CARMINATI, MICHELE
ING - Scuola di Ingegneria Industriale e dell'Informazione
18-lug-2023
2022/2023
Al giorno d'oggi, il progresso della tecnologia automobilistica ha portato a un aumento dei componenti del motore, ECUs, sensori di percezione e sistemi di comunicazione V2X all’interno dei veicoli. Di conseguenza, i veicoli moderni generano grandi quantità di dati, che spesso raggiungono uno o due terabyte al giorno. Questi dati contengono varie informazioni, comprese le condizioni di guida, i terreni e le preferenze dell’utente. Le reti automobilistiche sono tipicamente costituite da numerosi veicoli, ognuno dei quali produce in modo indipendente set di dati unici. Questo notevole volume di dati viene trasmesso regolarmente o continuamente a un server centralizzato per abilitare funzionalità di monitoraggio, prognostica, diagnostica e connettività. Tuttavia, questo modello centralizzato solleva preoccupazioni circa la privacy e la sicurezza delle informazioni sensibili raccolte dai veicoli. Il FL nelle reti automobilistiche offre una maggiore privacy, un utilizzo efficiente dei dati, una latenza inferiore e adattabilità, rendendolo un approccio adatto per l’implementazione di modelli di apprendimento automatico, affrontando al contempo le sfide e i requisiti unici del dominio automobilistico. Per queste ragioni, il nostro lavoro mira a sviluppare un sistema FL basato sull’IDS CANdito. Nel nostro lavoro di ricerca implementiamo e valutiamo le performance di due famosi approcci di FL, FedAvg e FedProx, dimostrando la loro efficacia contro gli attacchi generati da diverse distribuzioni. Questi approcci garantiscono la conservazione della privacy dei dati migliorando al contempo la scalabilità senza compromettere la privacy individuale. I due algoritmi federati vengono confrontati con un sistema centralizzato (implementato utilizzando lo stesso IDS). Inoltre, attraverso i nostri esperimenti, miriamo a dimostrare come un sistema di FL mostri robustezza e scalabilità e supporti la trasferibilità in modo paragonabile o superiore in alcuni casi.
File allegati
File Dimensione Formato  
Panettone.pdf

solo utenti autorizzati a partire dal 25/06/2024

Descrizione: tesi
Dimensione 2.69 MB
Formato Adobe PDF
2.69 MB Adobe PDF   Visualizza/Apri
Executive_Summary_Panettone.pdf

solo utenti autorizzati a partire dal 25/06/2024

Descrizione: executive summary
Dimensione 2.36 MB
Formato Adobe PDF
2.36 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/208003