Abstract :
Optical Character Recognition (OCR) merupakan teknologi yang memungkinkan mesin untuk mengenali tulisan pada sebuah citra digital. Ada banyak metode yang dapat digunakan pada sistem OCR, salah satu metode tersebut adalah metode Long Short-Term Memory (LSTM). Penelitian ini berfokus pada implementasi metode LSTM pada sistem OCR, lalu mengukur tingkat akurasi pengenalan karakter pada citra hasil scan halaman abstrak dokumen karya tulis ilmiah. Sistem yang dibangun dibagi menjadi dua tahapan utama, yaitu tahap pelatihan LSTM dan pengujian LSTM. Sebelum kedua tahap tersebut dilakukan, citra melalui tahap preprocessing terlebih dahulu, yaitu grayscaling, thresholding, segmentasi (baris, kata, dan karakter), resize, binerisasi, serta ekstraksi fitur zoning. Data latih yang digunakan berupa karakter dalam bentuk citra digital 24x24 pixel, yang berjumlah 1370 data dengan 71 jenis karakter. Dari hasil pengujian terhadap 30 data uji hasil scan halaman abstrak, diperoleh akurasi terbaik sebesar 88.24% dengan rata-rata akurasi sebesar 80.87%. Kurang maksimalnya hasil akurasi yang didapatkan dipengaruhi oleh proses segmentasi yang digunakan kurang mampu menyelesaikan permasalahan pemisahan karakter yang berdempet, dan banyaknya noise yang terdeteksi.