Abstract :
Diabetes adalah penyakit metabolic kronis yang ditandai dengan peningkatan kadar gula atau glukosa darah, yang dari waktu ke waktu menyebabkan kerusakan serius pada jantung, pembuluh darah, mata, ginjal dan saraf. Menurut International Diabetes Federation (IDF) Indonesia menjadi negara urutan kelima dengan jumlah penderita diabetes terbanyak didunia dan diabetes menjadi penyebab kematian atas 6,7 juta kematian yang terjadi pada tahun 2021 setiap 5 detik. Data mining adalah teknik dalam dunia komputer yang sering digunakan dalam memprediksi apa yang akan terjadi pada masa depan, ini menjadi salah satu metode yang banyak digunakan dalam memprediksi apakah suatu individu terdiagnosa positif atau negatif diabetes. Salah satu metode yang paling popular adalah C4.5 dan Naïve Bayes. Data sendiri didapatkan dari website kaggle dari Pima Indian heritage dengan 9 atribut dan 769 records yang nantikan akan di cleaning menjadi 220 data. Hasil pemrosesan data mining membuktikan algoritma Naïve Bayes menghasilkan akurasi yang lebih besar dibandingkan C4.5 dengan nilai 85.00% dibandingkan C4.5 dengan nilai akurasi 78.86%. Naïve Bayes juga menghasilkan nilai AUC 0.936 dari 1 yang membuktikan bahwa klasifikasi ini termasuk kedalam excellent classification. Dari tulisan diatas dapat disimpulkan bahwa algoritma Naïve Bayes merupakan metode yang lebih baik dibandingkan dengan algoritma C4.5 dalam memprediksi apakah seseorang terdiagnosa positif/negatif diabetes.