DETAIL DOCUMENT
Optical Character Recognition (Ocr) Pada Dokumen Karya Tulis Ilmiah Menggunakan Metode Long Short-Term Memory (Lstm)
Total View This Week0
Institusion
Universitas Komputer Indonesia
Author
Madhani, Rifki Dwi
Subject
004_Data Processing & Computer Science 
Datestamp
2022-01-18 04:34:01 
Abstract :
Optical Character Recognition (OCR) merupakan teknologi yang memungkinkan mesin untuk mengenali tulisan pada sebuah citra digital. Ada banyak metode yang dapat digunakan pada sistem OCR, salah satu metode tersebut adalah metode Long Short-Term Memory (LSTM). Penelitian ini berfokus pada implementasi metode LSTM pada sistem OCR, lalu mengukur tingkat akurasi pengenalan karakter pada citra hasil scan halaman abstrak dokumen karya tulis ilmiah. Sistem yang dibangun dibagi menjadi dua tahapan utama, yaitu tahap pelatihan LSTM dan pengujian LSTM. Sebelum kedua tahap tersebut dilakukan, citra melalui tahap preprocessing terlebih dahulu, yaitu grayscaling, thresholding, segmentasi (baris, kata, dan karakter), resize, binerisasi, serta ekstraksi fitur zoning. Data latih yang digunakan berupa karakter dalam bentuk citra digital 24x24 pixel, yang berjumlah 1370 data dengan 71 jenis karakter. Dari hasil pengujian terhadap 30 data uji hasil scan halaman abstrak, diperoleh akurasi terbaik sebesar 88.24% dengan rata-rata akurasi sebesar 80.87%. Kurang maksimalnya hasil akurasi yang didapatkan dipengaruhi oleh proses segmentasi yang digunakan kurang mampu menyelesaikan permasalahan pemisahan karakter yang berdempet, dan banyaknya noise yang terdeteksi. 
Institution Info

Universitas Komputer Indonesia