Institusion
Universitas Komputer Indonesia
Author
Ismatulloh, Mochamad Fajar
Subject
004_Data Processing & Computer Science
Datestamp
2022-01-11 07:23:58
Abstract :
Penelitian ini bertujuan untuk mengukur akurasi dari metode Reduced Support Vector Machine (RSVM) dalam memprediksi penyakit diabetes dengan dataset Pima Indian Diabetes Database, sama seperti pada penelitian-penelitian sebelumnya. Tahap pertama dari penelitian ini adalah pre-processing, berisi proses menghilangkan noise, normalisasi dengan metode min-max, dan proses split data. Karena dataset tidak seimbang, maka digunakan teknik oversampling dengan metode SMOTE dengan tujuan membuat dataset menjadi seimbang. Data hasil proses pre-processing kemudian dilatih menggunakan metode RSVM dengan kernel linier. Parameter yang diuji adalah besarnya nilai v, dan besarnya data acak A ̅. Nilai v yang digunakan adalah 1,2,10,20,50, dan 100, sedangkan untuk A ̅ adalah 5% – 10% karena sistem memiliki keterbatasan saat nilai A ̅ di bawah 5%. Pengujian dilakukan menggunakan K-fold cross validation dengan K = 5. Didapatkan akurasi terbaik 90%, pada saat keadaan dataset seimbang , nilai v = 50, dan A ̅ = 10%.