В данной работе рассматривается проблема сегментации текста на отдельные буквы. Зачастую для решения задачи сегментации
применяются различные специализированные алгоритмы, использующие методы обработки изображений. Однако такие алгоритмы
бывают сложны и слишком неробастны по отношению к алфавиту и шрифту сегментируемого текста и не решают задачу полностью.
Существуют также нейросетевые методы, у которых такие недостатки отсутствуют, но классические функции потерь плохо
подходят для поставленной задачи. Мы предлагаем способ обучения сверточного нейросетевого энкодера вместо классической
схемы для построения оценок наличия разрезов между символами. В результате работы показана эффективность данного подхода
на примере задачи сегментации строк полей паспорта гражданина РФ и показано преимущество предлагаемого метода обучения в
сравнении с классическим.
Ключевые слова:
cверточные нейронные сети, глубокое обучение, сегментация текста, кумулятивная сумма
DOI: 10.1134/S0235009219020094
Цитирование для раздела "Список литературы":
Шешкус А. В., Чернышова Ю. С., Чирвоная А. Н., Николаев Д. П.
Новый критерий обучения нейросетевого энкодера в задаче сегментации строки на символы.
Сенсорные системы.
2019.
Т. 33.
№ 2.
С. 171-178. doi: 10.1134/S0235009219020094
Цитирование для раздела "References":
Sheshkus A. V., Chernyshova Y. S., Chirvonaya A. N., Nikolaev D. P.
Novyi kriterii obucheniya neirosetevogo enkodera v zadache segmentatsii stroki na simvoly
[New criteria for neural network encoder learning in the string segmentation problem].
Sensornye sistemy [Sensory systems].
2019.
V. 33(2).
P. 171-178
(in Russian). doi: 10.1134/S0235009219020094
Список литературы:
- Чернов Т.С., Ильин Д.А., Безматерных П.В., Фараджев И.А., Карпенко С.М. Исследование методов сегментации изображений текстовых блоков документов с помощью алгоритмов структурного анализа и машинного обучения. Вестник РФФИ. 2016. № 4 (92). С. 55–71. DOI: 10.22204/2410-4639-2016-092-04-55-71
- Bulatov K., Arlazarov V.V., Chernov T., Slavin O., Nikolaev D.P. Smart IDReader: Document Recognition in Video Stream. The 14th IAPR International Conference on Document Analysis and Recognition. 2018. P. 39–44. DOI: 10.1109/ICDAR.2017.347.
- Casey R.G., Lecolinet E. A Survey of Methods and Strategies in Character Segmentation. IEEE Transactions on Pattern Analysis and Machine Intelligence. 1996. V. 18 (7). P. 690–706. DOI: 10.1109/34.506792.
- Chernyshova Y., Gayer A., Sheshkus A. Generation method of synthetic training data for mobile OCR system. Proc. SPIE 10696, Tenth International Conference on Machine Vision. 2018. P. 1–7. DOI: 10.1117/12.2310119.
- Chomphuwiset P. Printed Thai Character Segmentationand Recognition. IEEE 4th International Conference on Soft Computing & Machine Intelligence. 2017. P. 123–127. DOI: 10.1109/ISCMI.2017.8279611.
- Firdaus F.I., Khumaini A., Utaminingrum F. Arabic Letter Segmentation using Modified Connected Component Labeling. International Conference on Sustainable Information Engineering and Technology. 2017. P. 392–397. DOI: 10.1109/SIET.2017.8304170.
- Grafmuller M., Beyerer J. Performance improvement of character recognition in industrial applications using prior knowledge for more reliable segmentation. Expert Systems with applications. 2013. V. 40(17). P. 6955–6963. DOI: 10.1016/j.eswa.2013.06.004.
- Jacobs C.E., Rinker J.R., Simard P.Y., Viola P.A. Low resolution OCR for camera acquired documents. US Application. No. US20050259866A1. 2005.
- Jia F., Shi C., Wang Y., Wang C., Xiao B. Grayscale-projection based Optimal Character Segmentation for Camera-captured Faint Text Recognition. 14th IAPR International Conference on Document Analysis and Recognition. 2017. P. 1301–1306. DOI: 10.1109/ICDAR. 2017.214
- Manwatkar P.M., Yadav S.H. Text Recognition from Images. IEEE International Conference on Innovations in Information, Embedded and Communication Systems. 2015. P. 1–6.
- Mai B.Q.L., Huynh T.H., Doan A.D. An Independent Character Recognizer for Distantly Acquired Mobile Phone Text Images. International Conference on Advanced Technologies for Communications. 2016. P. 85–90. DOI: 10.1109/ATC.2016.7764836.
- Mei Y., Wang X., Wang J. An Efficient Character Segmentation Algorithm for Printed Chinese Documents. Advanced Science and Technology Letters. 2013. V. 22. P. 183–189.
- Mollah A.F., Basu S., Nasipuri M. Segmentation of Camera Captured Business Card Images for Mobile Devices. International Journal of Computer Science and Applications. 2010. V. 1 (1). P. 33–37.
- Qi W., Li X., Yang B. A Character Segmentation Method without Character Verification. International Symposium on Intelligent Information Technology Application Workshops. 2008. P. 581–584. DOI: 10.1109/IITA
- Radhiah A., Machbub C., Hidayat E.M.I., Prihatmanto A.S. Printed Arabic Letter Recognition Based on Images. International Conference on Signals and Systems. 2018. P. 86– 91. DOI: 10.1109/ICSIGSYS.2018.8373574.
- Rehman A. Offline Touched Cursive Script Segmentation Based on Pixel Intensity Analysis. Twelfth International Conference on Digital Information Management. 2017. P. 324–327. DOI: 10.1109/ICDIM.2017.8244641.
- Ryan M., Hanafiah N. An Examination of Character Recognition on ID card using Template Matching Approach. Procedia Computer Science. 2015. V. 59. P. 520–529. DOI: 10.1016/j.procs.2015.07.534.
- Sahare P., Dhok S.B. Multilingual Character Segmentation and Recognition Schemes for Indian Document Images. IEEE Access. 2018. V. 6. P. 10603–10617. DOI: 10.1109/ACCESS.2018.2795104.
- Shivakumara P., Bhowmick S., Su B., Tan C. L., Pal U. A New Gradient based Character Segmentation Method for Video Text Recognition. International Conference on Document Analysis and Recognition. 2011. P. 126–130. DOI: 10.1109/ICDAR.2011.34.
- Vuckovic V., Azinovic B. General Character Segmentation Approach for Machine-Typed Documents. Proceedings of 4th International Conference on Electrical, Electronics and Computing Engineering. 2017. P. RTI2.2.1-6.