DETAIL DOCUMENT
Penerapan Algoritma Enhance Confix Stripping Stemmer untuk Klasifikasi Dataset Multiclass pada Teks Berita Menggunakan K-Nearest Neighbor
Total View This Week0
Institusion
Universitas Telkom
Author
ALVIANDA RICKY LUKMAN PRATAMA
Subject
Machine Learning 
Datestamp
2021-11-02 00:00:00 
Abstract :
Kebutuhan informasi berita semakin meningkat sejak perubahannya dari media fisik ke media online. Berita dikelompokan sesuai kategori sehingga memudahkan pembaca memperoleh berita yang diinginkan. Pengelompokan untuk menentukan kategori informasi berita dikenal dengan istilah klasifikasi teks. Banyaknya kata pada teks berita menimbulkan keberagaman kata yang ada dan dapat diminimalisir dengan proses stemming, yaitu mengubah suatu kata berimbuhan menjadi kata dasarnya. Penelitian ini membandingkan penggunaan stemming dan tanpa stemming serta mencari nilai K terbaik dan perhitungan jarak optimum pada algoritma K-Nearest Neighbor dalam mengklasifikasikan teks berita. Hasil terbaik klasifikasi didapat dengan kondisi tanpa menerapkan algoritma stemming dengan jumlah K=9 menggunakan cosine distance untuk perhitungan jarak yang menghasilkan akurasi sebesar 0,9671. Hasil tersebut lebih besar daripada klasifikasi yang menerapkan algoritma stemming pada kondisi K=7 menggunakan cosine distance yang menghasilkan akurasi sebesar 0,9660. 

Institution Info

Universitas Telkom