Implementasi Convolutional Neural Network Untuk Klasifikasi Kata Pada Citra Teks

Donni S Silalahi, Mayanda Mega Santoni, Anita Muliawati

Abstract


Optical Character Recognition (OCR) adalah proses untuk mencari dan mengenali karakter dalam sebuah gambar dan kemudian mengekstrak karakter tersebut sehingga menjadi karakter digital (editable character). Dalam penelitian ini, akan merancang sebuah sistem untuk mengenali kata bahasa Indonesia dalam sebuah gambar / citra. Penelitian ini akan melalui beberapa tahapan, dimulai dari tahap praproses citra, kemudian tahap segmentasi karakter pada citra dengan menggunakan algoritma Connected Component Analysis (CCA) lalu dilanjutkan ke tahap mengklasifikasikan karakter tersebut dengan menggunakan metode Convolutional Neural Network (CNN). Setelah itu, akan dilakukan penggabungan karakter menjadi sebuah kata. Penelitian ini menggunakan data alfabet yang digunakan untuk melatih model CNN, dan data citra teks bahasa Indonesia untuk diklasifikasi oleh model. Hasil yang didapat yaitu akurasi klasifikasi alfabet sebesar 97%, kemudian untuk klasifikasi kata didapat akurasi sebesar 34,54%. Akurasi pada klasifikasi kata ini dipengaruhi oleh praproses citra yang dilakukan sebelumnya, hasil dari praproses tersebut banyak citra yang mengalami kegagalan sehingga salah saat diklasifikasi. Kegagalan praproses disini yaitu seperti citra yang blur atau rusak sehingga salah diklasifikasi dan juga bisa salah disegmentasi, kemudian terdapat citra teks yang mengandung huruf “i” dan “j” yang dianggap sebagai 2 karakter berbeda.

Full Text:

PDF

References


S. Shreya, Y. Upadhyay, M. Manchanda, R. Vohra, and G. D. Singh, “Optical character recognition using convolutional neural network,” Proc. 2019 6th Int. Conf. Comput. Sustain. Glob. Dev. INDIACom 2019, pp. 55–59, 2019.

A. Haryoko and S. H. Pramono, “Pengenalan Karakter Plat Kendaraan Bermotor Berbasis Citra Dengan Menggunakan Metode Canny Dan Algoritma Backpropagation,” J. Ilm. NERO, vol. 2, no. 2, pp. 123–130, 2016.

I. W. Notonogoro, Jondri, and A. Arifianto, “Indonesian license plate recognition using convolutional neural network,” 2018 6th Int. Conf. Inf. Commun. Technol. ICoICT 2018, vol. 0, no. c, pp. 366–369, 2018.

I. J. Kim and X. Xie, “Handwritten Hangul recognition using deep convolutional neural networks,” Int. J. Doc. Anal. Recognit., vol. 18, no. 1, pp. 1–13, 2014.

I. Sehgal, “Connected Component Labeling for Binary Images.,” Int. J. Adv. Res., vol. 7, no. 8, pp. 916–927, 2019.

A. Rizki et al., “Connected Component Analysis Sebagai Metode Pencarian Karakter Plat Dalam,” Technology, no. Sitia, 2010.

L. Deng and O. Abdel-hamid, “A DEEP CONVOLUTIONAL NEURAL NETWORK USING HETEROGENEOUS POOLING Research , One Microsoft Way , Redmond , W A , USA,” Acoust. Speech Signal Process. (ICASSP), 2013 IEEE Int. Conf., pp. 6669–6673, 2013.

A. Nasuha, T. A. Sardjono, and M. H. Purnomo, “Pengenalan Viseme Dinamis Bahasa Indonesia Menggunakan Convolutional Neural Network,” J. Nas. Tek. Elektro dan Teknol. Inf., vol. 7, no. 3, pp. 258–265, 2018.


Refbacks

  • There are currently no refbacks.


Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.