Abstract :
Air adalah salah satu kebutuhan utama manusia. Meskipun jumlah air sangat melimpah di Indonesia, tetapi tidak semua air layak untuk dikonsumsi. Pada penelitian ini, algoritma Random Forest dan Naive Bayes digunakan untuk melakukan klasifikasi terhadap kualitas air di DKI Jakarta. Penelitian ini dirancang untuk mengetahui efektivitas penggunaan Data Mining dalam melakukan klasifikasi kualitas air. Dalam prosesnya metode Random Forest dan Naive Bayes digunakan untuk mengetahui algoritma yang paling akurat dalam melakukan klasifikasi. Algoritma Random Forest dan Naive Bayes akan digunakan dalam proses klasifikasi kualitas air. Proses klasifikasi dilakukan menggunakan data terkumpul dengan parameter yang telah ditentukan. Proses pengujian menghasilkan nilai performa dari masing-masing kategori. Algoritma Random Forest memiliki akurasi sebesar 85.23%, presisi 88.11%, recall 79.89%, dan F1-score 83.35. Sedangkan algoritma Naïve Bayes memiliki akurasi sebesar 72.51%, presisi 76.19%, recall 74.51%, dan F1-score 73.08%. Dengan begitu disimpulkan bahwa Algoritma Random Forest memiliki performa lebih baik dibandingkan dengan naïve bayes.