Abstract :
Penelitian ini dilakukan dengan tujuan menganalisis dan mengimplementasikan metode K-NN dan Naïve Bayes pada sentiment analysis terhadap pengguna tiktok di google play store, serta ingin mengetahui perbandingan dari hasil penerapan metode K-NN dan Naïve Bayes. Penelitian ini dimulai dengan mengidentifikasi masalah, studi literatur, pengumpulan data, preprocessing (case folding, text cleaning, stopword removal, tokenization, stemming), di lanjtkan tahapan weight (TF-IDF), kemudian klasifikasi dengan menerapkan metode K-NN dan Naïve Bayes, dan dilanjutkan proses validation (confusion matrix, dan k-fold cross validation), setelah semua proses selesai di lanjutkan dengan membuat kesimpulan serta membuat laporan. Dalam penelitian penelitain ini jumlah sentiment yang digunakan sebanyak 4402 data dengan jumlah positif sentiment 3513, netral sentiment 169, dan negatif sentiment 720. Dari 20% hingga 90% data uji, Naïve Bayes memiliki akurasi lebih tinggi (81.25%) daripada K-Nearest Neighbor (78%). K-Nearest Neighbor memiliki precision dan recall tinggi untuk sentiment positif (82% dan 90.25%), sementara Naïve Bayes lebih baik mengenali sentiment negatif dengan precision 63.25%, meskipun recall lebih rendah (17.13%). Dalam uji confusion matrix, keduanya unggul mengenali sentiment positif, sementara kesulitan muncul pada negatif dan netral akibat ketidakseimbangan data. Naïve Bayes memiliki akurasi rata-rata lebih tinggi (81.35%) dibanding K-Nearest Neighbor (75.42%). K-fold cross-validation menunjukkan akurasi 77% untuk K-Nearest Neighbor dan 81% untuk Naïve Bayes. Secara keseluruhan, penelitian ini menunjukkan bahwa Naïve Bayes memberikan akurasi lebih baik, sementara aplikasi TikTok cenderung mendapat sentimen positif, terlihat dari word cloud yang mencakup kata-kata 'tiktok,' 'good,' dan 'love'.