Abstract :
Pengaruh gaya hidup masyarakat era modern dalam mengakses informasi lebih banyak dilakukan membaca secara online daripada membaca di media cetak. Akibatnya, setiap hari jumlah dokumen teks khususnya dokumen berita online di internet semakin meningkat dan sulit dalam memperoleh informasi berita yang diinginkan dengan cepat. Sehingga diperlukan sebuah teknik pengelompokkan dokumen yang dapat mengelompokkan dokumen berita ke dalam kategori yang telah ditentukan. Teknik ini adalah klasifikasi dokumen. Salah satu metode klasifikasi yang baik dan populer adalah Naïve Bayes atau lebih dikenal Naïve Bayes Classifer (NBC). Metode probabilistik Naïve Bayes Classifer memiliki kelebihan keserhanaan dalam komputasinya. Penelitian ini mengkaji kinerja NBC untuk kategorisasi teks dokumen berita berbahasa Indonesia. Penelitian ini menggunakan data sebanyak 270 set data. Hasil penelitian yang dihitung menggunakan tabel Matriks Confusion (Confusion Matrix) menunjukkan tingkat akurasi maksimal dicapai 97%. Menggunakan pemrograman Java, program klasifikasi dengan Naïve Bayes Classifer berhasil membuktikan bahwa algoritma ini mampu mengelompokkan dokumen ke dalam kategori yang telah ditentukan.