Abstract :
Ekstraksi Informasi merujuk pada ekstraksi otomatis dari informasi terstruktur seperti entitas, hubungan antar entitas, dan atribut deskripsi entitas dari sumber yang tidak terstruktur. Ekstraksi Informasi dilakukan dengan cara mendeteksi bagian-bagian yang ada pada suatu dokumen, salah satunya adalah dokumen Surat Keputusan. Pada penelitian ini menggunakan metode Conditional Random Fields (CRF) dengan menggunakan fitur node yang merupakan asosiasi antara data dengan label, edge yang merupakan fitur transisi dari suatu data ke data berikutnya dengan memperhatikan label. Terdapat beberapa tahapan dalam penelitian ini, yaitu preprocessing, yang meliputi filtering simbol dan tokenizing. Dilanjutkan dengan pelatihan pada CRF dengan Stochastic Gradient Method untuk mendapatkan bobot parameter. Tahap klasifikasi dilakukan dengan Viterbi Decoding untuk menentukan label paling optimal untuk data uji, dilanjutkan dengan pengujian dengan menggunakan Confusion Matrix. Penelitian ini menggunakan data latih yang didapat dari 20 dokumen surat keputusan dengan data uji yang didapat dari 6 dokumen surat keputusan. Didapat hasil akurasi tertinggi yaitu 91.73% dan akurasi terendah sebesar 77,81%. Hasil akurasi tersebut dipengaruhi oleh nilai awal bobot parameter pada tahap pelatihan.