Klasifikasi Berdasarkan Question Dalam Stack Overflow Menggunakan Algoritma Naïve Bayes

Main Article Content

Bagus Geriansyah putra
Naim Rochmawati

Abstract

Abstrak—Stackoverflow merupakan sebuah website yang menyediakan banyak informasi tentang pemrograman. Pengguna dapat berinteraksi dengan pengguna lainnya dalam sebuah forum diskusi yang diajukan. Pengguna dapat mengajukan sebuah pertanyaan yang kemudian akan ditanggapi oleh pengguna lain. Ketika mengajukan sebuah pertanyaan, pengguna harus memasukkan kategori yang tepat pada pertanyaan yang diajukan agar mendapatkan respons atau jawaban yang sesuai. Berdasarkan beberapa kasus yang terjadi masih banyak pengguna website mengalami kebingungan ketika memilih kategori pertanyaan yang diajukan. Akibatnya, pertanyaan yang diajukan tidak mendapat respons yang tepat atau kurang sesuai. Sehingga, penelitian ini diajukan untuk membantu proses pengkategorian pertanyaan pada website Stackoverflow. Penelitian menggunakan Algoritma Naïve Bayes untuk memprediksi kategori pertanyaan yang diajukan. Pada penelitian ini dilakukan beberapa proses, dimulai dengan proses input dataset dilanjutkan dengan pembacaan file dataset. Kemudian dataset akan melalui preprocessing yang dilanjutkan dengan pembobotan dan proses ekstraksi fitur dengan Algoritma TF-IDF. Selanjutnya, data diproses menggunakan Algoritma Naïve Bayes yang akan menghasilkan kategori pertanyaan. Selanjutnya dilakukan proses evaluasi model untuk menentukan model terbaik yang akan digunakan untuk tampilan antarmuka aplikasi. Hasil yang didapat dari tahap evaluasi model dengan 4 kali percobaan menggunakan 10.000-40.000 data menghasilkan nilai akurasi, precision, recall, dan f1-score tertinggi sebesar 75%, 75%, 75% dan 74%. Dari hasil pengujian yang telah dilakukan Algoritma Naïve Bayes dapat digunakan sebagai klasifikasi text dan menghasilkan nilai yang cukup baik.


Kata Kuncitext mining, Algoritma Naïve Bayes, stackoverflow, Algoritma TF-IDF

Article Details

Section
Articles