• 1990 (Том 4)
  • 1989 (Том 3)
  • 1988 (Том 2)
  • 1987 (Том 1)

Том 32 №1

Содержание

  1. ИЗМЕНЧИВОСТЬ РАЗНЫХ ФУНКЦИОНАЛЬНЫХ ТИПОВ СИГНАЛОВ У AELIA ACUMINATA L. (HETEROPTERA, PENTATOMIDAE)
  2. РАЗМЕРЫ РЕЦЕПТИВНЫХ ПОЛЕЙ СПОНТАННО-АКТИВНЫХ ГАНГЛИОЗНЫХ КЛЕТОК СЕТЧАТКИ СЕРЕБРЯНОГО КАРАСЯ
  3. КОМПЛЕКСИРОВАНИЕ РАДИОЛОКАЦИОННЫХ ИЗОБРАЖЕНИЙ И ОПТИЧЕСКИХ СНИМКОВ В ВИДИМОМ И ТЕПЛОВОМ ДИАПАЗОНАХ С УЧЕТОМ РАЗЛИЧИЙ В ВОСПРИЯТИИ ЯРКОСТИ И ЦВЕТНОСТИ
  4. МОДЕЛИРОВАНИЕ ПРОЦЕССА НАВИГАЦИИ БЕСПИЛОТНОГО ЛЕТАТЕЛЬНОГО АППАРАТА С ИСПОЛЬЗОВАНИЕМ ДВУХ БОРТОВЫХ КАМЕР, СМЕЩЕННЫХ ПО ВЫСОТЕ
  5. ВИЗУАЛЬНАЯ ЛОКАЛИЗАЦИЯ АЭРОФОТОСНИМКОВ НА ВЕКТОРНОЙ КАРТЕ С ИСПОЛЬЗОВАНИЕМ ЦВЕТОТЕКСТУРНОЙ СЕГМЕНТАЦИИ
  6. СРАВНЕНИЕ ОЦИФРОВАННЫХ СТРАНИЦ ДЕЛОВЫХ ДОКУМЕНТОВ НА ОСНОВЕ РАСПОЗНАВАНИЯ
  7. АЛГОРИТМ ОПРЕДЕЛЕНИЯ ПОЛОЖЕНИЯ ПУЧКА ЭПИПОЛЯРНЫХ ЛИНИЙ ДЛЯ СЛУЧАЯ ПРЯМОЛИНЕЙНОГО ДВИЖЕНИЯ КАМЕРЫ
  8. СЕГМЕНТАЦИЯ РЕГИСТРАЦИОННЫХ НОМЕРОВ АВТОМОБИЛЕЙ С ПРИМЕНЕНИЕМ АЛГОРИТМА ДИНАМИЧЕСКОЙ ТРАНСФОРМАЦИИ ВРЕМЕННОЙ ОСИ
  9. УСТАНОВЛЕНИЕ СООТВЕТСТВИЯ МЕЖДУ ЗАМКНУТЫМИ КОНТУРАМИ ОБЪЕКТОВ ПРИ ПРОЕКТИВНЫХ ИСКАЖЕНИЯХ
  10. АЛГЕБРАИЧЕСКАЯ РЕКОНСТРУКЦИЯ АППАРАТНОЙ ФУНКЦИИ СМАЗАННОГО ИЗОБРАЖЕНИЯ ПО ЯРКОСТНЫМ ПРОФИЛЯМ ГРАНИЦ ОБЪЕКТОВ
  11. АЛГОРИТМ ВЗВЕШЕННОГО ПОИСКА ПРОЕКТИВНОГО ОПТИЧЕСКОГО ПОТОКА, УСТОЙЧИВЫЙ К БЛИКАМ
  12. АЛГЕБРАИЧЕСКИЕ МЕТОДЫ РЕКОНСТРУКЦИИ В ЗАДАЧАХ ТОМОГРАФИИ
  13. КОЛИЧЕСТВЕННЫЙ АНАЛИЗ ДВОЕНИЯ ОПТИЧЕСКОГО ИЗОБРАЖЕНИЯ ТОЧЕЧНОГО ИСТОЧНИКА СВЕТА ПРИ ПОДВОДНОМ СТЕРЕОЗРЕНИИ

СРАВНЕНИЕ ОЦИФРОВАННЫХ СТРАНИЦ ДЕЛОВЫХ ДОКУМЕНТОВ НА ОСНОВЕ РАСПОЗНАВАНИЯ

© 2018 г. Е. И. Андреева1, Т. В. Манжиков1,2, О. А. Славин2,3

1Федеральное государственное автономное образовательное учреждение высшего образования “Московский физико-технический институт (государственный университет)”, 141701 Долгопрудный, Московская область, Институтский пер., д. 9
andreeva@phystech.edu
2ООО “Смарт Энджинс Сервис”, 117312 Москва, просп. 60-летия Октября, д. 9
3Институт системного анализа Федерального исследовательского центра “Информатика и управление” Российской академии наук, 117312 Москва, просп. 60-летия Октября, д. 9

Поступила в редакцию 21.08.2017 г.

В работе исследуется задача сравнения оцифрованных страниц деловых документов. Такая задача возникает при сравнении двух экземпляров документов, подписанных двумя сторонами с целью найти возможные модификации, внесенные одной стороной. Данная задача является практически значимой в банковской сфере при заключении договоров в бумажной форме. Предложен способ сравнения двух оцифрованных экземпляров на основе алгоритмов распознавания текста, состоящий в сравнении наборов слов, полученных в результате применения такого рода алгоритмов к эталонной и тестовой страницам. Описанные эксперименты были проведены с использованием OCR Tesseract. Достоинствами предложенного способа является универсальность алгоритма сравнения и высокая точность сравнения. В качестве главного недостатка предложенного алгоритма можно отметить – зависимость от гарнитуры и размера шрифта, использованного для печати.

Ключевые слова: алгоритмы сравнения оцифрованных копий документов, автоматическое распознавание текста, расстояние Левенштейна

DOI: 10.7868/S0235009218010067

Цитирование для раздела "Список литературы": Андреева Е. И., Манжиков Т. В., Славин О. А. Сравнение оцифрованных страниц деловых документов на основе распознавания. Сенсорные системы. 2018. Т. 32. № 1. С. 35-41. doi: 10.7868/S0235009218010067
Цитирование для раздела "References": Andreeva E. I., Manzhikov T. V., Slavin O. A. Sravnenie otsifrovannykh stranits delovykh dokumentov na osnove raspoznavaniya [Comparison of the digitized pages of business documents by means of recognition]. Sensornye sistemy [Sensory systems]. 2018. V. 32(1). P. 35-41 (in Russian). doi: 10.7868/S0235009218010067

Список литературы:

  • Булатов К.Б., Ильин Д.А., Полевой Д.В., Чернышова Ю.С. Проблемы распознавания машиночитаемых зон с использованием малоформатных цифровых камер мобильных устройств. Труды Института Системного Анализа Российской Академии Наук. 2015. Т. 65. № 3. С. 85–94.
  • Славин О.А. Метод классификации распознанных страниц деловых документов на основе метода template matching. Труды Седьмой Международной конференции “Системный анализ и информационные технологии” САИТ – 2017. 2017. С. 667–671.
  • Смирнов С.В. Технология и система автоматической корректировки результатов при распознавании архивных документов. Канд. дисс. СПб. 2015. 130 с.
  • Khanipov Т.М., Nikolaev D.P. Issledovanie metoda slijanija oblastej v zadache cvetovoj segmentacii [Investigation of the regions fusion method in the problem of color segmentation]. Proceedings of the conference Information Technologies and Systems ITaS. 2010. Р. 151–155. [in Russian])."
  • Usilin S., Nikolaev D., Postnikov V. Structural Compression of Document Images with PDF/A. Proc. 24th European Conf. Modelling and Simulation. 2010. P. 242–246.