Analisis Perbandingan Metode Burkhard Keller Tree dan SymSpell dalam Spell Correction Bahasa Indonesia

  • Muhammad Hafizh Ferdiansyah Universitas Negeri Surabaya
  • I Kadek Dwi Nuryana Universitas Negeri Surabaya

Abstract

Dalam pembuatan sistem spell correction banyak faktor yang perlu diperhatikan untuk membuat sistem yang efektif dan berkualitas, salah satunya adalah kecepatan dan kebutuhan sistem. Beberapa metode dapat diterapkan untuk membuat sistem ini. Salah satu metode yang sering ditemui adalah Burkhar Keller Tree atau BK Tree. BK Tree merupakan metode populer yang digunakan dalam sistem spell correction karena kemudahannya, kemudian ada metode Symmetric Delete Spelling Correction atau SymSpell yang dikatakan memiliki kinerja yang sangat baik. Penelitian ini dilakukan untuk menguji dan menganalisa kinerja dari kedua metode tersebut sebagai sistem spell correction untuk Bahasa Indonesia. Hasil penelitian dengan kamus berisi 1.597.416 kosakata membuktikan metode BK Tree memiliki kinerja kecepatan yang lebih rendah dimana dalam pengujian catatan waktu tertinggi metode ini menyentuh 52 detik, namun metode memiliki kebutuhan sistem yang lebih kecil. Sedangkan metode SymSpell memiliki kinerja kecapatan yang jauh lebih cepat dengan nilai catatan waktu dalam pengujian tertinggi adalah 0.05 detik, namun kebutuhan sistem yang lebih besar. Pada pengujian akurasi didapatkan bahwa kedua metode memiliki hasil yang sama dengan rata-rata nilai accuracy, precision, dan recall secara berurutan sebesar 0,95, 0,89, dan 0,73. Dalam penelitian juga diketahui pentingnya sumber corpus yang digunakan untuk menyusun kamus, dimana penggunaan corpus yang bersumber dari Wikipedia Indonesia yang digunakan dalam penelitian ini masih kurang tepat karena masih ditemukannya kata-kata yang salah dalam penulisan dalam corpus tersebut.

Published
2023-01-25
Section
Articles
Abstract Views: 114
PDF Downloads: 135