Klasifikasi Buku Menggunakan Metode Support Vector Machine pada Digital Library

  • Dhiany Hana Amalia Universitas Negeri Surabaya
  • Wiyli Yustanti Universitas Negeri Surabaya

Abstract

Perpustakaan merupakan suatu tempat dimana memiliki berbagai koleksi buku hingga jurnal dan majalah. Namun dengan seiringnya perkembangan teknologi, kini perpustakaan dapat mengembangkan pelayanannya kedalam digital atau disebut dengan e-library. Hal ini sangat memudahkan pemustaka dalam pencarian data buku. Dalam penelitian ini bertujuan untuk menganalisis pada klasifikasi teks, dimana untuk mengetahui kualitas pada metode Support Vector Machine (SVM) dengan menggunakan kernel Linear. Dataset yang digunakan diambil dari https://opac.unesa.ac.id/, dimana terdiri dari sepuluh kategori buku yang disesuaikan dengan Dewey Decimal Classification (DDC). Setelah data terkumpul kemudian memasuki tahapan pre-processing, dimana data terlebih dahulu dilakukan penghapusan terhadap data ganda dan melalui case folding, tokenizing, stopwords. Pada penelitian ini menggunakan data 1.000 records sebagai uji data serta  melakukan pengambilan data secara acak, hal ini dilakukan guna menyeimbangkan pada antar data. Selanjutnya dilakukan tahapan ekstraksi fitur dimana pada tahapan ini dilakukannya pengolahan teks menjadi numerik dengan menggunakan pembobotan pada Term Frequency-Inverse Document Frequency (TF-IDF). Kemudian data memasuki tahap pemodelan klasifikasi dengan menggunakan metode SVM. Dalam penggunaan metode ini terdapat empat jenis fungsi kernel, yaitu kernel Linear, RBF, Polynomial, dan Sigmoid dimana memiliki karakteristik masing-masing pada setiap fungsinya. Tujuan dari penilitian ini, yaitu untuk mengetahui pengaruh pada jumlah data latih terhadap kualitas dan efektivitas metode SVM, dimana dilakukan tiga kali pengujian pada model kombinasi data latih dan data uji, yaitu 60:40, 70:30, dan 80:20. Setelah ketiga pengujian telah memasuki tahap proses klasifikasi, maka  dapat diambil kesimpulan bahwa metode SVM dalam klasifikasi teks pada digital library dapat digunakan dan menghasilkan akurasi tertinggi yang didapat dengan nilai 69,24% pada penggunaan kernel Linear dibandingkan dengan kernel lainnya, dimana memiliki nilai precision 71%, recall 61%, dan f1-score 64%.

Published
2021-08-07
Section
Articles
Abstract Views: 513
PDF Downloads: 410