This thesis explores the development and evaluation of a Privacy-preserving Community Based Federated Learning model for mortality prediction in ICUs. Mortality prediction models are crucial for supporting clinical decision-making and optimizing resource allocation. Traditional machine learning approaches, which rely on centralized data, can pose significant privacy risks whereas FL offers a solution by enabling institutions to collaboratively train models without sharing sensitive data. The research compares the performance of four models: a centralized model, single-site models, a federated model based on the FedAvg algorithm, and the PCBFL model, which introduces clustering techniques to handle non-identically distributed data across hospitals. Results demonstrate that the PCBFL model, which ensures patient privacy using SMPC, outperforms other models, particularly in scenarios with imbalanced data. This study highlights the importance of personalized FL approaches in improving model accuracy while maintaining strict privacy standards in healthcare data sharing.
Questa tesi esplora lo sviluppo e la valutazione di un modello di Privacy-preserving Community-Based Federated Learning per la predizione della mortalità nelle unità di terapia intensiva (ICU). I modelli di predizione della mortalità possono supportare le decisioni cliniche e ottimizzare l'allocazione delle risorse. Gli approcci di machine learning tradizionali, che si basano su dati centralizzati, comportano significativi rischi per la privacy mentre il Federated Learning offre una soluzione consentendo alle istituzioni di addestrare modelli in modo collaborativo senza condividere dati sensibili. La ricerca confronta le prestazioni di quattro modelli: un modello centralizzato, modelli per singolo sito, un modello federato basato sull'algoritmo Federated Averaging, e il modello PCBFL, che introduce tecniche di clustering per gestire dati non identicamente distribuiti tra gli ospedali. I risultati dimostrano che il modello PCBFL, che garantisce la privacy dei pazienti tramite un protocollo crittografico per il calcolo distribuito, SMCP, supera gli altri modelli, specialmente in scenari con dati sbilanciati. Questo studio evidenzia l'importanza di approcci personalizzati al FL per migliorare l'accuratezza del modello, mantenendo rigorosi standard di privacy nella condivisione dei dati sanitari.
Privacy-preserving patient clustering for mortality prediction in a federated lLearning framework
Pagella, Filippo
2023/2024
Abstract
This thesis explores the development and evaluation of a Privacy-preserving Community Based Federated Learning model for mortality prediction in ICUs. Mortality prediction models are crucial for supporting clinical decision-making and optimizing resource allocation. Traditional machine learning approaches, which rely on centralized data, can pose significant privacy risks whereas FL offers a solution by enabling institutions to collaboratively train models without sharing sensitive data. The research compares the performance of four models: a centralized model, single-site models, a federated model based on the FedAvg algorithm, and the PCBFL model, which introduces clustering techniques to handle non-identically distributed data across hospitals. Results demonstrate that the PCBFL model, which ensures patient privacy using SMPC, outperforms other models, particularly in scenarios with imbalanced data. This study highlights the importance of personalized FL approaches in improving model accuracy while maintaining strict privacy standards in healthcare data sharing.File | Dimensione | Formato | |
---|---|---|---|
Thesis___Master_degree.pdf
accessibile in internet per tutti a partire dal 12/09/2025
Dimensione
825.78 kB
Formato
Adobe PDF
|
825.78 kB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/227746