Apache Spark is one of the most fast-evolving and widely used for big data. This research investigates the state of practice in the Apache Spark nexmark suit in both batch and streaming mode. Through designing and writing the code to execute the Nexamrk research paper quires, to compute the throughput and analysis the results.

Apache Spark è uno dei più in rapida evoluzione e ampiamente utilizzato per i big data. Questa ricerca indaga lo stato della pratica nella tuta nexmark di Apache Spark sia in modalità batch che in streaming. Attraverso la progettazione e la scrittura del codice per eseguire i documenti di ricerca Nexamrk, calcolare il throughput e analizzare i risultati.

Nexmark benchmarking analysis using Apache Spark

NEZAM, MOHAMAD
2020/2021

Abstract

Apache Spark is one of the most fast-evolving and widely used for big data. This research investigates the state of practice in the Apache Spark nexmark suit in both batch and streaming mode. Through designing and writing the code to execute the Nexamrk research paper quires, to compute the throughput and analysis the results.
ING - Scuola di Ingegneria Industriale e dell'Informazione
7-ott-2021
2020/2021
Apache Spark è uno dei più in rapida evoluzione e ampiamente utilizzato per i big data. Questa ricerca indaga lo stato della pratica nella tuta nexmark di Apache Spark sia in modalità batch che in streaming. Attraverso la progettazione e la scrittura del codice per eseguire i documenti di ricerca Nexamrk, calcolare il throughput e analizzare i risultati.
File allegati
File Dimensione Formato  
thesis_nezam_v5.docx.pdf

accessibile in internet per tutti

Dimensione 1.04 MB
Formato Adobe PDF
1.04 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/179196