Abstract :
Data mining adalah bagian dari proses Knowledge Discovery in Database(KDD). Dengan data mining kita dapat melakukan deskripsi, prediksi, pengelompokan, asosiasi, peramalan, pengurutan dan klasifikasi. Klasifikasi adalah suatu bentuk analisis data dengan merepresentasikan suatu model data penting melalui fitur-fitur tertentu. Beberapa algoritma dalam klasifikasi tersebut antara lain SVM, K-NN, Naive Bayes, Random Forest, Logistics Regression dan Decision Tree. Decision Tree merupakan struktur yang digunakan untuk membantu proses pengambilan keputusan. Chi square merupakan salah satu jenis uji komparatif(Independency Test) untuk membandingkan dua variabel kategori atau berupa proporsi yang tidak berpasangan (independen). Dengan hasil yang didapatkan yaitu dengan 19 parameter maka dilakukan seleksi fitur dengan pembuktian bahwa parameter tersebut memiliki pengaruh terhadap kelas data kanker serviks yaitu 9 parameter dan memperoleh hasil akurasi sebesar 100%.