Replication is a fundamental technique in distributed storage systems that ensures dura- bility and availability even in the presence of failures. Traditional replication protocols are typically implemented in software and run on general-purpose CPU, but as data vol- umes grow and networks accelerate to 100 Gb/s and beyond, these approaches struggle with latency overhead and high CPU utilisation. Recent trends point toward hardware acceleration, with RDMA and programmable SmartNICs offering new opportunities to push replication closer to the network. This thesis explores this direction by designing and implementing a custom replication service directly on an FPGA-based SmartNIC. Our implementation targets the AMD Alveo U55C board and is built on top of the OpenNIC open source platform. The key- value store replication happens inside a hash table stored in the on-board High Bandwidth Memory (HBM). Moreover, our service provides a leader election mechanism to ensure that replication can continue in the event of a leader failure. We validate the design through both simulation and hardware experiments. Our bench- marks show that our design presents lower latency with respect to a conventional software based implementation. This latency gain is due to the avoidance of traversing the PCIe connection between the NIC and the host, effectively cutting the critical path in the middle. Finally, we discuss different approaches to offloading leader election protocols, showing a trade-off between the lower latency of the hardware implementation and the better flexibility of the software counterpart.
La replicazione è una tecnica fondamentale nei sistemi di archiviazione distribuiti che garantisce durabilità e disponibilità anche in presenza di guasti. I protocolli di repli- cazione tradizionali sono generalmente implementati in software ed eseguiti su CPU di uso generale, ma con la crescita dei volumi di dati e l’aumento della velocità delle reti fino a 100 Gb/s e oltre, questi approcci faticano a gestire l’elevata latenza e l’elevato uti- lizzo della CPU. Le tendenze più recenti puntano verso l’accelerazione hardware: RDMA e SmartNIC programmabili offrono nuove opportunità per spostare la replicazione più vicino alla rete. Questa tesi esplora tale direzione progettando e implementando un servizio di repli- cazione personalizzato direttamente su una SmartNIC basata su FPGA. La nostra imple- mentazione è destinata alla scheda AMD Alveo U55C ed è costruita sopra la piattaforma open source OpenNIC. La replicazione del key-value store avviene all’interno di una hash table nella High Bandwidth Memory (HBM) integrata sulla scheda. Inoltre, il nostro servizio fornisce un meccanismo di elezione del leader per garantire il proseguimento del processo di replicazione in caso di guasto del leader. Abbiamo validato il progetto sia tramite simulazione che attraverso esperimenti hard- ware. I nostri benchmark mostrano che il design proposto presenta una latenza inferiore rispetto a un’implementazione software convenzionale. Questo miglioramento di latenza è dovuto all’eliminazione del passaggio attraverso la connessione PCIe tra il NIC e l’host. Infine, discutiamo diversi approcci per l’offload dei protocolli di elezione del leader, ev- idenziando un compromesso tra la minore latenza dell’implementazione hardware e la maggiore flessibilità della controparte software
NIC accelerated replication service
FONTANIVE, GIORGIO MASSIMO
2025/2026
Abstract
Replication is a fundamental technique in distributed storage systems that ensures dura- bility and availability even in the presence of failures. Traditional replication protocols are typically implemented in software and run on general-purpose CPU, but as data vol- umes grow and networks accelerate to 100 Gb/s and beyond, these approaches struggle with latency overhead and high CPU utilisation. Recent trends point toward hardware acceleration, with RDMA and programmable SmartNICs offering new opportunities to push replication closer to the network. This thesis explores this direction by designing and implementing a custom replication service directly on an FPGA-based SmartNIC. Our implementation targets the AMD Alveo U55C board and is built on top of the OpenNIC open source platform. The key- value store replication happens inside a hash table stored in the on-board High Bandwidth Memory (HBM). Moreover, our service provides a leader election mechanism to ensure that replication can continue in the event of a leader failure. We validate the design through both simulation and hardware experiments. Our bench- marks show that our design presents lower latency with respect to a conventional software based implementation. This latency gain is due to the avoidance of traversing the PCIe connection between the NIC and the host, effectively cutting the critical path in the middle. Finally, we discuss different approaches to offloading leader election protocols, showing a trade-off between the lower latency of the hardware implementation and the better flexibility of the software counterpart.| File | Dimensione | Formato | |
|---|---|---|---|
|
Executive_Summary.pdf
accessibile in internet solo dagli utenti autorizzati
Descrizione: Executive Summary
Dimensione
1.62 MB
Formato
Adobe PDF
|
1.62 MB | Adobe PDF | Visualizza/Apri |
|
Thesis.pdf
accessibile in internet solo dagli utenti autorizzati
Descrizione: Tesi
Dimensione
4.15 MB
Formato
Adobe PDF
|
4.15 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/247145