Institusion
Universitas Komputer Indonesia
Author
Azizi, Izyan
Subject
005_Computer Programming, Programs & Data
Datestamp
2021-07-12 02:50:24
Abstract :
Optical Character Recogntion (OCR) adalah pengenalan karakter dari suatu citra digital. OCR sudah banyak digunakan untuk berbagai hal seperti pengenalan tulisan tangan aksara arab, pengenalan aksara sunda, judul novel dengan akurasi yang dihasilkan masing-masing sebesar 82,2%, 78,67%, dan 55,62%. Pada penelitian kali ini OCR akan dilakukan menggunakan metode Learning Vector Quantization (LVQ), sebelumnya metode LVQ digunakan dalam beberapa penelitian OCR seperti pengenalan tulisan tangan aksara arab, tulisan tangan latih bersambung, focus pada penelitian ini yaitu mengukur tingkat akurasi yang dihasilkan oleh metode LVQ dan ekstraksi ciri zoning dalam mengenali karakter yang terdapat pada citra hasil scan dokumen karya tulis ilmiah. Sebelum tahap pelatihan dan pengujian LVQ, dilakukan tahapan preprocessing yang terdiri dari grayscaling, binerisasi, thresholding, segmentasi baris, segmentasi kata, segmentasi karakter dan juga ekstraksi ciri zoning, dari hasil tahapan preprocessing didapatkan nilai ciri dari setiap citra untuk masukan pelatihan dan juga pengujian. Dari hasil pengujian yang dilakukan terhadap 30 dokumen scan citra abstrak, didapatkan hasil akurasi tertinggi mencapai 10,08% dengan parameter learning rate 0,05 dan epoch 200 dan akurasi terendah sebesar 2,49 % dengan parameter leraning rate 0,1 dan epoch 200. Rendahnya akursai yang didapatkan dipengaruhi oleh hasil preprocessing yang belum maksimal, hasil segmentasi karakter yang kurang baik dan juga hasil ekstraksi ciri zoning yang kurang baik untuk zona yang dipilih.