Perbandingan Kinerja Infrastruktur Pararel Dalam Pemrosesan Data Dengan Menggunakan Apache Spark

Prayogi Kardani; I Made Suartana

doi:10.26740/jinacs.v5n03.p304-312

Authors

Prayogi Kardani Universitas Negeri Surabaya
I Made Suartana Universitas Negeri Surabaya

DOI:

https://doi.org/10.26740/jinacs.v5n03.p304-312

Abstract

Abstrak

Pemrosesan yang efektif. Apache Spark, sebuah platform komputasi data, mampu memproses data besar melalui infrastruktur paralel. Evaluasi kinerja Spark diperlukan, mengacu pada penelitian sebelumnya yang menunjukkan peningkatan efisiensi. Studi ini membandingkan kinerja infrastruktur paralel Spark dalam pemrosesan data besar. Apache Spark diimplementasikan dalam cluster dengan 1 node master dan 2 node pekerja untuk memproses big data secara paralel. Penelitian ini mengevaluasi kinerja Apache dalam pemrosesan big data menggunakan cluster yang dikonfigurasi dengan 1 node Master dan 2 node pekerja. Eksperimen tersebut menghasilkan temuan bahwa pada tahap penghitungan, agregasi, dan pemfilteran, cluster dengan 2 node pekerja menunjukkan peningkatan efisiensi yang signifikan, dengan waktu eksekusi yang lebih cepat dibandingkan konfigurasi lainnya.
Analisis penggunaan CPU menjelaskan bahwa cluster dengan satu master dan dua klien menghasilkan penggunaan CPU yang lebih efisien, terutama pada node pekerja. Ditemukan bahwa penggunaan CPU pada node master tetap rendah, sedangkan Node pekerja, terutama dalam mode cluster dengan dua klien, dapat mengoptimalkan penggunaan CPU pada tingkat yang lebih tinggi.

Kata Kunci: Apache Spark, Infrastruktur Paralel, Big Data, Dataset, Perbandingan, Performa, Cluster, Master, Client, Pemrosesan Data

Downloads

Download data is not yet available.

Perbandingan Kinerja Infrastruktur Pararel Dalam Pemrosesan Data Dengan Menggunakan Apache Spark

Authors

DOI:

Abstract

Downloads

Downloads

Published

Issue

Section

Submission

Submissions

menu

Menu

coba

Acreditation

template

Template

statistic

Visitor Statistics

tool

Tools

Alamat kantor Journal of Informatics and Computer Science (JINACS)