Abstract :
Penelitian ini menunjukkan bagaimana memperbaiki kesalahan ejaan dengan Algoritma SymSpell dalam pengetikan kata bahasa Indonesia di Question Answering System. Memperbaiki kesalahan ejaan sangat bergantung pada jumalh kamus yang digunakan. Namun ketika menggunakan pendekatan tradisional dengan mengecek score tiap kata dikamus akan mengakibatkan waktu eksekusi menjadi sangat lama ketika kamus yang digunakan sangat banyak.Algoritma SymSpell mengurangi kompleksitas dari pencarian kamus dengan melakukan penghapusan saja. Berbeda dengan pendekatan Peter Norvig yang melakukan penghapsusan, penukaran, pengisipan, dan penggantian huruf di kata yang akan dicek, pendekatan Symspell ini melakukan penghapusan saja namun tidak hanya pada kata yang akan dicek namun kata yang ada di kamus, sehingga bisa lebih cepat.Berdasarkan hasil yang didapat dalam penelitian ini, maka dapat diperoleh kesimpulan bahwa implementasi Algoritma SymSpell untuk pendeteksi dan pengkoreksi kesalahan dalam pengetikan kata bahasa Indonesia menghasilkan akurasi 88% dan rata-rata waktu yang digunakan untuk menghasilkan rekomendasi kata adalah 2,848ms atau sekitar 0,2 detik. Sedangkan dataset yang dihasilkan untuk kamus sebanyak 40357 kata dan edit distance 2 adalah 49,3MB dengan rata-rata waktu yang digunakan untuk melakukan load dataset adalah 4551ms atau sekitar 4,5 detik.