Analisis Sentimen Pengguna Platform Belajar Online Coursera menggunakan Random Forest dengan Metode Ekstraksi Fitur Word2vec

Authors

  • Muhammad Jazaal Aufa Universitas Negeri Surabaya
  • Anita Qoiriah Universitas Negeri Surabaya

DOI:

https://doi.org/10.26740/jinacs.v4n02.p244-255

Abstract

Pembelajaran daring mengharuskan para pelajar dan mahasiswa menggunakan platform belajar online sebagai penunjang belajar di luar kelas, menyebabkan penggunanya meningkat, salah satunya Coursera. Berdasarkan grafik data review selama 2015-2020, pengguna Coursera meningkat drastis sebesar 256% saat awal pembelajaran daring. Namun menurun setelahnya sebesar 24%, sehingga diperlukan sistem analisis sentimen untuk mengetahui polaritas pengguna kursus saat itu secara otomatis. Algoritma klasifikasi yang efisien untuk analisis sentimen adalah Random Forest. Pada kasus text classification jumlah fitur adalah jumlah kata, kumpulan teks review yang mengandung banyak kata menghasilkan jumlah fitur yang banyak pula, maka waktu yang dibutuhkan untuk membangun model menggunakan Random Forest akan sangat lama, sehingga kurang efektif. Dibutuhkan ekstraksi yang mampu mereduksi jumlah fitur, seperti Word2vec. Menggunakan Word2vec sebagai ekstraksi fitur bertujuan agar sistem tidak hanya efisien tapi juga efektif untuk analisis sentimen, karena mampu mendeteksi semantik antar kata. Dari hasil pengujian menggunakan proporsi data berbeda dan parameter Word2vec acak, menunjukkan akurasi terbaik pada proporsi data 80:20 dengan ukuran fitur 100 dimensi dan window 5, dengan akurasi train score dan test score sebesar 92,71% dan 91,42%. Selain menghasilkan peforma paling baik, kombinasi Random Forest dengan Word2vec membutuhkan waktu training model 20 kali lebih cepat dibanding Random Forest dengan TF dan Random Forest dengan pembobotan TF-IDF.

Downloads

Download data is not yet available.

Downloads

Published

2023-01-03

Issue

Section

Articles
Abstract views: 291 , PDF Downloads: 487