Implementasi Algoritma Jaro-Winkler Distance dan N-Gram untuk Deteksi dan Prediksi Perbaikan Kesalahan Penulisan Kata Bahasa Indonesia pada Karya Tulis Ilmiah Mahasiswa

Abstract

Karya tulis ilmiah merupakan sebuah tulisan yang berisi suatu permasalahan yang ditulis dan disajikan berdasarkan fakta dan data hasil penelitian. Kesalahan berbahasa yang sering terjadi pada karya tulis ilmiah mahasiswa adalah kesalahan penulisan kata. Untuk menghasilkan karya tulis ilmiah tanpa ada kesalahan penulisan kata, diperlukannya teknik tertentu untuk memperbaikinya. Penelitian ini membuat sebuah sistem deteksi dan prediksi perbaikan kesalahan penulisan kata. Algoritma Jaro-Winkler Distance merupakan algoritma yang digunakan untuk mengukur kemiripan antara 2 string. Algoritma Jaro-Winkler Distance pada sistem ini digunakan untuk daftar saran kandidat perbaikan kata. Saran kandidat perbaikan kata tersebut akan dicari yang sesuai dengan kalimat dengan menggunakan metode N-Gram. Metode N-Gram pada sistem ini digunakan untuk mencari saran perbaikan terbaik dari daftar kandidat yang dihasilkan oleh Algoritma Jaro-Winkler Distance.  Hasil terbaik yang diberikan oleh sistem ini adalah sebesar 85.7% dan hasil terkecil sebesar 45%. Hasil tersebut dipengaruhi oleh kuantitas korpus yang digunakan untuk deteksi maupun prediksi perbaikan kata. Semakin baik kuantitas korpus/kamus yang digunakan pada sistem, maka sistem dapat memberikan prediksi perbaikan kata yang sesuai dengan perbaikan kata salah dalam kalimat.

PDF