As of today, the world gravitates around data. The amount generated each year has been growing exponentially, making it increasingly difficult to keep up and extract useful information. Optimizing techniques to enable this extraction has, therefore, become paramount to deriving meaningful insights from vast datasets in a short time. One of these strategies is pattern matching and it represents the main way to find recurrent structures. In Computer Science, Regular Expressions (RE) are the main tool used for defining these patterns, making efficient management of REs a key area of research. Through the years, different software and hardware solutions have been proposed. Among them, Field Programmable Gate Arrays (FPGA) offer enhanced performance through parallel processing. Although FPGA development has advantages in performance, flexibility, and reconfigurability, different constraints limit its efficiency and accessibility. For example, tool portability and scalability across platforms, represents a serious challenge for these devices. Emulators and simulators help bridge the gap between software and hardware development, minimizing the need for time-consuming trial and error. ALVEARE is a full-stack framework created especially for high-performance, flexible, energy-efficient RE processing, primarily implemented on FPGA. It combines a Domain Specific Language compiler with a Domain Specific Architecture optimized for RE matching. To address its challenges, the EmuALVEARE emulator provides a software-based framework for testing and optimizing ALVEARE’s architecture, enabling faster development and future performance exploration without the need of the physical hardware.
Al giorno d’oggi, il mondo gravita intorno ai dati. La mole di dati generati ogni anno è cresciuta in maniera esponenziale, rendendo sempre più difficile l’estrazione di informazioni utili. L’ottimizzazione delle tecniche che ne consentono l’estrazione è quindi diventata fondamentale per analizzare dataset voluminosi in un breve lasso di tempo. Tra queste, il pattern matching rappresenta il metodo principale per identificare strutture ricorrenti. In informatica le espressioni regolari (RE) sono lo strumento principale utilizzato per definire questi pattern; rendendone la gestione efficiente un tema centrale di ricerca e interesse in molti campi. Negli anni, diverse soluzioni software e hardware sono state proposte. Tra essi, Field Programmable Gate Array (FPGA) permettono il raggiungimento di prestazioni molto alte grazie all’elaborazione parallela. Sebbene lo sviluppo su FPGA presenti numerosi vantaggi in termini di prestazioni, flessibilità e riconfigurabilità, esistono anche una serie di vincoli che ne limitano l’efficienza e l’accessibilità. Per esempio, la mancanza di portabilità e scalabilità tra diverse piattaforme rappresenta una sfida per questi dispositivi. Emulatori e simulatori aiutano a colmare il divario tra sviluppo software e hardware, riducendo al minimo la necessità di sviluppare tramite tentativi ed errori. ALVEARE è un framework full-stack creato appositamente per l’elaborazione flessibile, ad alte prestazioni, ed efficiente dal punto di vista energetico di espressioni regolari. Implementato principalmente su tecnologia FPGA, combina un compilatore di linguaggio a dominio specifico con un’architettura a dominio specifico ottimizzata per il matching delle espressioni regolari. Per affrontarne le sfide, l’emulatore EmuALVEARE fornisce un framework basato su software per testare e ottimizzare l’architettura di ALVEARE, consentendone uno sviluppo più rapido e l’esplorazione delle prestazioni future senza la necessità di utilizzare l’hardware fisico.
An emulation-based approach for fast design space exploration of a domain-specific architecture for regex matching
Van Den Weghe, Tristan Lieven Annemie
2023/2024
Abstract
As of today, the world gravitates around data. The amount generated each year has been growing exponentially, making it increasingly difficult to keep up and extract useful information. Optimizing techniques to enable this extraction has, therefore, become paramount to deriving meaningful insights from vast datasets in a short time. One of these strategies is pattern matching and it represents the main way to find recurrent structures. In Computer Science, Regular Expressions (RE) are the main tool used for defining these patterns, making efficient management of REs a key area of research. Through the years, different software and hardware solutions have been proposed. Among them, Field Programmable Gate Arrays (FPGA) offer enhanced performance through parallel processing. Although FPGA development has advantages in performance, flexibility, and reconfigurability, different constraints limit its efficiency and accessibility. For example, tool portability and scalability across platforms, represents a serious challenge for these devices. Emulators and simulators help bridge the gap between software and hardware development, minimizing the need for time-consuming trial and error. ALVEARE is a full-stack framework created especially for high-performance, flexible, energy-efficient RE processing, primarily implemented on FPGA. It combines a Domain Specific Language compiler with a Domain Specific Architecture optimized for RE matching. To address its challenges, the EmuALVEARE emulator provides a software-based framework for testing and optimizing ALVEARE’s architecture, enabling faster development and future performance exploration without the need of the physical hardware.File | Dimensione | Formato | |
---|---|---|---|
2024_12_VandenWeghe.pdf
accessibile in internet per tutti
Descrizione: Testo della tesi
Dimensione
2.03 MB
Formato
Adobe PDF
|
2.03 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/230747