An adaptive multi-agent based approach to improve DaaS in fog computing

Data as a Service (DaaS) is a data provisioning strategy, in which a data provider enables data access to several users regardless of their geographic location. Due to the increasing of data that nowadays are continuously produced, Data-Intensive Applications (DIAs) are a widely adopted solution to manage and analyse such amount of data. DIAs often use DaaS as data layer, and can have different requirements toward data. Although they can find a scalable and reliable processing environment in the cloud, the significant high latency in data transmission between edge devices and cloud resources prevents its adoption. This issue can be limited adopting the Fog Computing paradigm, which exploits the continuum of devices that connects the cloud to the edge of the network resulting in higher QoS. Unluckily, Fog computing architecture is a dynamic environment where nodes may have uncontrolled behaviors such as drop in QoS metrics. Dealing with such a dynamism is essential to get the benefits of Fog computing. This thesis aims to support data providers which offer DaaS in a Fog environment, providing an automatic and self-adaptive method capable to keep DIAs requirements satisfied at run-time. A decision system is assigned to each DIA, and acts in case of infringements of requirements by moving or duplicating data used.The novelty of this work consists in the application of a distributed approach based on RL techniques. The adoption of this type of approach has advantages, since it produces a reliable, scalable, without a single point of failure, flexible and with higher performances system than a centralized one. However, it introduces higher complexity in the coordination of actions involving shared data sources, since selection of conflicting actions may occur. The choice of the action is guided by the violation of DIA requirements and the impacts that the enactments of actions produce on violated requirements. Also the impacts on the other DIAs bounded to the same data sources are considered in the action selection process. The proposed method have been implemented and tested in an environment that simulates Fog computing scenarios. Encouraging results are reported.

Data as a Service (DaaS) è una strategia di fornitura dei dati, in cui un data provider consente l'accesso ai dati a più utenti indipendentemente dalla loro localizzazione. A causa dell'aumento dei dati prodotti oggigiorno, le Applicazioni ad alta Intensità di Dati (DIAs) sono una soluzione ampiamente usata per gestire e analizzare una tale mole di dati. Le DIAs utilizzano spesso il DaaS come livello dati e possono avere requisiti diversi verso i dati. Sebbene esse possano trovare un ambiente di elaborazione scalabile e affidabile nel cloud, l’alta latenza nella trasmissione dei dati tra dispositivi edge e risorse cloud ne impedisce l'adozione. Questo problema può essere limitato adottando il paradigma del Fog Computing. Purtroppo, l'architettura del Fog Computing è un ambiente dinamico in cui i nodi possono avere comportamenti incontrollati come il calo delle metriche di QoS. Affrontare un tale dinamismo è essenziale per ottenere i vantaggi del Fog computing. Questa tesi mira a supportare i data providers che offrono il DaaS in un ambiente Fog, fornendo un metodo automatico e autoadattivo, che mantiene i requisiti delle DIAs soddisfatti a run-time. Ad ogni DIA viene assegnato un sistema decisionale, che in caso di violazione dei requisiti agisce spostando o duplicando i dati utilizzati. La novità di questo lavoro consiste nell'applicazione di un approccio distribuito basato su tecniche di RL. L'adozione di questo tipo di approccio è vantaggioso, in quanto produce un sistema affidabile, scalabile, senza un singolo punto di guasto, flessibile e con prestazioni superiori rispetto ad uno centralizzato. Tuttavia, introduce una maggiore complessità nel coordinamento delle azioni che coinvolgono dati condivisi, poiché possono verificarsi azioni conflittuali. La scelta dell'azione è guidata dalla violazione dei requisiti della DIA e dagli impatti che le azioni producono sui requisiti violati. Anche gli impatti sulle altre DIAs legate alle stesse fonti di dati sono considerati nel processo di selezione delle azioni. Il metodo proposto è stato implementato e testato in un ambiente che simula scenari di Fog computing. Sono stati riscontrati risultati incoraggianti.