Institusion
Universitas Muhammadiyah Jember
Author
Rahayu, Puput Tri
Subject
004 Data Processing, Computer Science
Datestamp
2021-10-30 01:55:19
Abstract :
Data mining merupakan pemrosesan suatu data menggunakan cara statistik, matematik, dll untuk mengidentifikasi suatu informasi pengetahuan potensial dan berguna yang tersimpan dalam basis data besar. Klasifikasi adalah salah satu tugas dari data mining yang bertujuan untuk memprediksi label kategori benda yang tidak diketahui sebelumnya, dalam membedakan antara objek yang satu dengan yang lainnya berdasarkan atribut atau fitur Terdapat beberapa algoritma yang dapat digunakan untuk mengklasifikan seperti algoritma K-Nearest Neighbor yang memiliki keunggulan yaitu lebih efektif didata training yang besar, dapat menghasilkan data yang lebih akurat dan Gaussian Naïve Bayes dimana metode ini hanya membutuhkan jumlah data trainng yang kecil untuk menentukan estimasi parameter yang diperlukan dalam proses pengklasifikasian. Setelah dilakukan penelitian menggunakan kedua algoritma tersebut, penelitian menggunakan algoritma K-Nearest Neigboar menghasilkan accuracy sebesar 71.27%, sensitivity sebesar 76.86%, specifity sebesar 81.59%%, precision sebesar 76.15% dan error rate sebesar 35.05% sedangkan pada saat mengguakan algoritma Gaussian Naïve Bayes menghasilkan accuracy sebesar 73.50%, sensitivity sebesar 96.14%, specifity sebesar 86.45%, precision sebesar 78.98% dan error rate sebesar 29.47%. berdasarkan hasil penelitian tersebut menunjukkan untuk algoritma Gaussian Naïve Bayes mempunyai accuracy yang lebih akurat bila dibandingkan dengan algortima K-Nearest Neighbor dalam mengklasifikasi data Diabetes Melitus.
Kata kunci : Diabetes Mellitus, Gaussian Naïve Bayes, K-Nearest Neighbor