Institusion
Universitas Komputer Indonesia
Author
Putra, Bagas Hendrawan
Subject
005_Computer Programming, Programs & Data
Datestamp
2019-12-17 06:06:35
Abstract :
Ekstraksi informasi merupakan salah satu dari cabang text mining yang bertujuan untuk mengambil informasi dari teks yang tidak terstruktur menjadi data yang terstruktur. Ekstraksi informasi dokumen yang menggunakan klasifikasi rule-based memiliki masalah penurunan akurasi pada pola dokumen yang tidak sama. Oleh karena itu, penelitian ini menggunakan machine learning Support Vector Machine (SVM) sebagai klasifikasi ekstraksi informasi dokumen daftar riwayat hidup. Tujuan dari penelitian ini adalah melakukan ekstraksi informasi menggunakan machine learning dan mengukur kinerja algoritma Support Vector Machine (SVM) dalam ekstraksi informasi daftar riwayat hidup. Penelitian ini menggunakan media konversi berupa API berikut praproses yaitu filtering, tagging dan tokenization, serta menggunakan metode pembobotan boolean. Ekstraksi fitur yang digunakan memiliki 23 parameter serta memiliki 7 kelas. Pengujian yang dilakukan menggunakan pengujian black box dan perhitungan akurasi dengan confusion matrix. Hasil analisis pengujian akurasi menunjukkan bahwa nilai akurasi klasifikasi SVM one vs all dengan fungsi kernel RBF lebih baik dari pada menggunakan kernel linear dan polynomial dengan 93,07% berbanding 92,21% dan 92,64%. Berdasarkan hasil tersebut, disimpulkan bahwa algoritma SVM dapat diterapkan dalam ekstraksi informasi daftar riwayat hidup.