• 1990 (Том 4)
  • 1989 (Том 3)
  • 1988 (Том 2)
  • 1987 (Том 1)

Том 33 №2

Содержание

  1. РАСЧЕТ ОПТИЧЕСКОЙ СИСТЕМЫ ГЛАЗА КИТООБРАЗНЫХ
  2. НЕЙРОФИЗИОЛОГИЧЕСКИЕ МЕХАНИЗМЫ СРАВНЕНИЯ ДВУХ ПОСЛЕДОВАТЕЛЬНЫХ ОРИЕНТАЦИЙ В ЗАДАЧЕ РАБОЧЕЙ ПАМЯТИ
  3. ВКЛАД КРАЙНЕЙ ПЕРИФЕРИИ СЕТЧАТКИ В КОНСТАНТНОСТЬ ЦВЕТОВОСПРИЯТИЯ: СВИДЕТЕЛЬСТВА, ПОЛУЧЕННЫЕ БЛАГОДАРЯ КОНТАКТНЫМ ЛИНЗАМ С ИМПЛАНТИРОВАННЫМИ ОККЛЮДЕРАМИ
  4. УЧАСТИЕ СПЕКТРАЛЬНОГО И ВРЕМЕННОГО МЕХАНИЗМОВ В АНАЛИЗЕ СЛОЖНЫХ ЗВУКОВЫХ СИГНАЛОВ
  5. РОЛЬ ДОНОРА МОЛЕКУЛ NO В РЕГУЛЯЦИИ ОТВЕТОВ ПЕРВИЧНОГО СЕНСОРНОГО НЕЙРОНА
  6. ИСПОЛЬЗОВАНИЕ МОБИЛЬНЫХ УСТРОЙСТВ ДЛЯ ВЫЯВЛЕНИЯ ПРИЗНАКОВ ФАБРИКАЦИИ ДОКУМЕНТОВ, УДОСТОВЕРЯЮЩИХ ЛИЧНОСТЬ
  7. ПЕРЕХОДНЫЕ ПРОЦЕССЫ ЗРИТЕЛЬНЫХ ВЫЗВАННЫХ ПОТЕНЦИАЛОВ В ЗАДАЧАХ ИНТЕРФЕЙСОВ ЧЕЛОВЕК-КОМПЬЮТЕР
  8. АЛГЕБРАИЧЕСКАЯ РЕКОНСТРУКЦИЯ В УСЛОВИЯХ НЕДОСТАТКА ПАМЯТИ ГРАФИЧЕСКОГО ПРОЦЕССОРА В ЗАДАЧЕ КОМПЬЮТЕРНОЙ ТОМОГРАФИИ
  9. НОВЫЙ КРИТЕРИЙ ОБУЧЕНИЯ НЕЙРОСЕТЕВОГО ЭНКОДЕРА В ЗАДАЧЕ СЕГМЕНТАЦИИ СТРОКИ НА СИМВОЛЫ

НОВЫЙ КРИТЕРИЙ ОБУЧЕНИЯ НЕЙРОСЕТЕВОГО ЭНКОДЕРА В ЗАДАЧЕ СЕГМЕНТАЦИИ СТРОКИ НА СИМВОЛЫ

© 2019 г. А. В. Шешкус1,2, Ю. С. Чернышова1,2, А. Н. Чирвоная3, Д. П. Николаев4

1ООО “Смарт Энджинс Сервис” 117312 Москва, проспект 60-летия Октября, 9, Россия
asheshkus@smartengines.biz
2Федеральное государственное учреждение “Федеральный исследовательский центр “Информатика и управление” Российской академии наук” 119333 Москва, Вавилова, д. 44, кор. 2, Россия
3Национальный исследовательский технологический университет “МИСиС” 119049 Москва, Ленинский проспект, д. 4, Россия
4Институт проблем передачи информации им. А.А. Харкевича РАН 127051 Москва, Большой Каретный пер., 19, Россия

Поступила в редакцию 10.09.2018 г.

В данной работе рассматривается проблема сегментации текста на отдельные буквы. Зачастую для решения задачи сегментации применяются различные специализированные алгоритмы, использующие методы обработки изображений. Однако такие алгоритмы бывают сложны и слишком неробастны по отношению к алфавиту и шрифту сегментируемого текста и не решают задачу полностью. Существуют также нейросетевые методы, у которых такие недостатки отсутствуют, но классические функции потерь плохо подходят для поставленной задачи. Мы предлагаем способ обучения сверточного нейросетевого энкодера вместо классической схемы для построения оценок наличия разрезов между символами. В результате работы показана эффективность данного подхода на примере задачи сегментации строк полей паспорта гражданина РФ и показано преимущество предлагаемого метода обучения в сравнении с классическим.

Ключевые слова: cверточные нейронные сети, глубокое обучение, сегментация текста, кумулятивная сумма

DOI: 10.1134/S0235009219020094

Цитирование для раздела "Список литературы": Шешкус А. В., Чернышова Ю. С., Чирвоная А. Н., Николаев Д. П. Новый критерий обучения нейросетевого энкодера в задаче сегментации строки на символы. Сенсорные системы. 2019. Т. 33. № 2. С. 171-178. doi: 10.1134/S0235009219020094
Цитирование для раздела "References": Sheshkus A. V., Chernyshova Y. S., Chirvonaya A. N., Nikolaev D. P. Novyi kriterii obucheniya neirosetevogo enkodera v zadache segmentatsii stroki na simvoly [New criteria for neural network encoder learning in the string segmentation problem]. Sensornye sistemy [Sensory systems]. 2019. V. 33(2). P. 171-178 (in Russian). doi: 10.1134/S0235009219020094

Список литературы:

  • Чернов Т.С., Ильин Д.А., Безматерных П.В., Фараджев И.А., Карпенко С.М. Исследование методов сегментации изображений текстовых блоков документов с помощью алгоритмов структурного анализа и машинного обучения. Вестник РФФИ. 2016. № 4 (92). С. 55–71. DOI: 10.22204/2410-4639-2016-092-04-55-71
  • Bulatov K., Arlazarov V.V., Chernov T., Slavin O., Nikolaev D.P. Smart IDReader: Document Recognition in Video Stream. The 14th IAPR International Conference on Document Analysis and Recognition. 2018. P. 39–44. DOI: 10.1109/ICDAR.2017.347.
  • Casey R.G., Lecolinet E. A Survey of Methods and Strategies in Character Segmentation. IEEE Transactions on Pattern Analysis and Machine Intelligence. 1996. V. 18 (7). P. 690–706. DOI: 10.1109/34.506792.
  • Chernyshova Y., Gayer A., Sheshkus A. Generation method of synthetic training data for mobile OCR system. Proc. SPIE 10696, Tenth International Conference on Machine Vision. 2018. P. 1–7. DOI: 10.1117/12.2310119.
  • Chomphuwiset P. Printed Thai Character Segmentationand Recognition. IEEE 4th International Conference on Soft Computing & Machine Intelligence. 2017. P. 123–127. DOI: 10.1109/ISCMI.2017.8279611.
  • Firdaus F.I., Khumaini A., Utaminingrum F. Arabic Letter Segmentation using Modified Connected Component Labeling. International Conference on Sustainable Information Engineering and Technology. 2017. P. 392–397. DOI: 10.1109/SIET.2017.8304170.
  • Grafmuller M., Beyerer J. Performance improvement of character recognition in industrial applications using prior knowledge for more reliable segmentation. Expert Systems with applications. 2013. V. 40(17). P. 6955–6963. DOI: 10.1016/j.eswa.2013.06.004.
  • Jacobs C.E., Rinker J.R., Simard P.Y., Viola P.A. Low resolution OCR for camera acquired documents. US Application. No. US20050259866A1. 2005.
  • Jia F., Shi C., Wang Y., Wang C., Xiao B. Grayscale-projection based Optimal Character Segmentation for Camera-captured Faint Text Recognition. 14th IAPR International Conference on Document Analysis and Recognition. 2017. P. 1301–1306. DOI: 10.1109/ICDAR. 2017.214
  • Manwatkar P.M., Yadav S.H. Text Recognition from Images. IEEE International Conference on Innovations in Information, Embedded and Communication Systems. 2015. P. 1–6.
  • Mai B.Q.L., Huynh T.H., Doan A.D. An Independent Character Recognizer for Distantly Acquired Mobile Phone Text Images. International Conference on Advanced Technologies for Communications. 2016. P. 85–90. DOI: 10.1109/ATC.2016.7764836.
  • Mei Y., Wang X., Wang J. An Efficient Character Segmentation Algorithm for Printed Chinese Documents. Advanced Science and Technology Letters. 2013. V. 22. P. 183–189.
  • Mollah A.F., Basu S., Nasipuri M. Segmentation of Camera Captured Business Card Images for Mobile Devices. International Journal of Computer Science and Applications. 2010. V. 1 (1). P. 33–37.
  • Qi W., Li X., Yang B. A Character Segmentation Method without Character Verification. International Symposium on Intelligent Information Technology Application Workshops. 2008. P. 581–584. DOI: 10.1109/IITA
  • Radhiah A., Machbub C., Hidayat E.M.I., Prihatmanto A.S. Printed Arabic Letter Recognition Based on Images. International Conference on Signals and Systems. 2018. P. 86– 91. DOI: 10.1109/ICSIGSYS.2018.8373574.
  • Rehman A. Offline Touched Cursive Script Segmentation Based on Pixel Intensity Analysis. Twelfth International Conference on Digital Information Management. 2017. P. 324–327. DOI: 10.1109/ICDIM.2017.8244641.
  • Ryan M., Hanafiah N. An Examination of Character Recognition on ID card using Template Matching Approach. Procedia Computer Science. 2015. V. 59. P. 520–529. DOI: 10.1016/j.procs.2015.07.534.
  • Sahare P., Dhok S.B. Multilingual Character Segmentation and Recognition Schemes for Indian Document Images. IEEE Access. 2018. V. 6. P. 10603–10617. DOI: 10.1109/ACCESS.2018.2795104.
  • Shivakumara P., Bhowmick S., Su B., Tan C. L., Pal U. A New Gradient based Character Segmentation Method for Video Text Recognition. International Conference on Document Analysis and Recognition. 2011. P. 126–130. DOI: 10.1109/ICDAR.2011.34.
  • Vuckovic V., Azinovic B. General Character Segmentation Approach for Machine-Typed Documents. Proceedings of 4th International Conference on Electrical, Electronics and Computing Engineering. 2017. P. RTI2.2.1-6.