Eksplorasi Random Forest Berbasis Ekstraksi Fitur dan Metode Sampling untuk Analisis Data Multi-label Sentimen dan Emosi
Abstract
Abstrak— Penggunaan aplikasi mobile dalam bidang teknologi telah memberikan wadah bagi penggunanya dalam mengekspresikan emosi dan opini melalui ulasan pengguna. Klasifikasi emosi pada ulasan pengguna dapat membantu dalam memahami tingkat kepuasan pengguna. Namun, proses klasifikasi emosi masih mengalami permasalahan khususnya dalam menghadapi ketidakseimbangan data. Penelitian ini mengusulkan model klasifikasi emosi menggunakan Random Forest pada dataset ulasan di Google Play Store yang melalui tahapan pre-processing, ekstraksi fitur menggunakan TF-IDF, penerapan metode sampling berupa SMOTE, Tomek-Links, dan SMOTE-Tomek dalam permasalahan ketidakseimbangan data, serta pemanfaatan hyperparameter tuning menggunakan Particle Swarm Optimization (PSO). Model klasifikasi tersebut menunjukkan bahwa penggunaan algoritma Random Forest dengan metode sampling SMOTE pada pembagian data dengan rasio 95:5 mampu menghasilkan kombinasi dengan kinerja paling optimal dengan nilai accuracy dan recall masing-masing sebesar 85,24%, precision 85,32% dan nilai F1-score sebesar 85,20%. Secara keseluruhan, penggunaan Random Forest melalui ekstraksi fitur dan metode sampling serta optimasi hyperparameter mampu memberikan hasil model klasifikasi emosi yang lebih efektif dan efisien dalam menangani data yang tidak seimbang.
Kata Kunci— Random Forest, TF-IDF, Metode Sampling, Particle Swarm Optimization, Klasifikasi Emosi.
Downloads
Abstract views: 7
,
PDF Downloads: 0


View My Stats


