Abstract :
Optical Character Recognition (OCR) adalah metode pengenalan karakter huruf dan angka pada citra atau gambar menjadi tulisan. Sertifikat adalah tanda atau surat keterangan (pernyataan) tertulis dari orang yg berwenang yang dapat digunakan sebagai bukti pemilikan atau suatu kejadian. Penelitian ini akan membahas tentang OCR pada Sertifikat dengan menggunakan algoritma Least Square Support Vector Machines (LS-SVM). Pada penelitian ini terdapat beberapa tahapan yaitu preprocessing yang meliputi proses grayscale, thresholding, segmentasi, dan resize. Data latih yang digunakan adalah sebanyak kumpulan 70 jenis font citra dan data uji berupa citra Sertifikat sebanyak 5 citra. Berdasarkan hasil pengujian didapatkan persentasi akurasi OCR tertinggi sebesar 74,45% dengan rata-rata akurasi yang didapatkan sebesar 68,15%. Tingkat akurasi yang didapatkan dikategorikan cukup baik,, tetapi belum optimal dikarenakan terdapat masalah yang didapatkan pada penelitian ini yaitu untuk pengenalan tulisan berjenis cursive atau huruf sambung dan tipe teks underline, sistem belum bisa mengenali karakter atau huruf yang benar, yang mengakitbatkan sistem menerjemahkannya menjadi karakter yang tidak sesuai dengan yang tertulis di dokumen sertifikat, serta background dan logo yang terdapat pada dokumen sertifikat masih menjadi noise pada saat proses segmentasi berlangsung yang mengakibatkan sistem OCR mendeteksi dan menerjemahkannya menjadi karakter huruf atau angka menggunakan klasifikasi yang telah dipasang di sistem.