Детектирование прямоугольных объектов является важной частью распознавания документов и автоматизации документооборота.
При этом в процессе детектирования может появляться выбросовый шум – ложноопределенные координаты расположения
документа, негативно влияющий на общее качество детектирования объекта и дальнейшей обработки. В работе поставлена
задача фильтрации такого шума при детектировании плоского прямоугольного объекта на кадрах видеопоследовательности путем
построения единой системы координат. Предлагаемый метод основывается на согласовании графа оцененных проективных
преобразований кадров с шаблонами и кадров между собой. В проведенных экспериментах использовался смоделированный
выбросовый шум, применяющийся к некоторым кадрам видеопоследовательности. Для оценки качества работы алгоритма
сравниваются результаты расположения объекта до и после модуля согласования графа с истинным расположением объекта.
Данная оценка представлена на основе открытой базы данных MIDV-500 видеосъемки документов, удостоверяющих личность. На
этом наборе данных продемонстрировано снижение накопленной ошибки по сравнению с результатами до использования
согласования графа при вычислении проективных преобразований.
Ключевые слова:
согласование графа преобразований, проективное преобразование, единая система координат, видеопоследовательность,
детектирование объектов, накопленная ошибка
DOI: 10.31857/S0235009220010084
Цитирование для раздела "Список литературы":
Емельянова Е. В., Савельев Б. И., Булатов К. Б.
Фильтрация ошибочных покадровых результатов в процессе локализации прямоугольных плоских объектов при видеосъемке с использованием согласования графа преобразований.
Сенсорные системы.
2020.
Т. 34.
№ 1.
С. 57–63. doi: 10.31857/S0235009220010084
Цитирование для раздела "References":
Emelyanova E. V., Saveliev B. I., Bulatov K. B.
Filtratsiya oshibochnykh pokadrovykh rezultatov v protsesse lokalizatsii pryamougolnykh ploskikh obektov pri videosemke s ispolzovaniem soglasovaniya grafa preobrazovanii
[Filtering erroneous frame-by-frame results for planar rectangular objects localization in a video using matching transform graph].
Sensornye sistemy [Sensory systems].
2020.
V. 34(1).
P. 57–63
(in Russian). doi: 10.31857/S0235009220010084
Список литературы:
- Савельев Б.И., Мамай И.Б., Николаев Д.П., Арлазаров В.Л., Булатов К.Б., Скорюкина Н.С. Метод согласования графа проективных преобразований для задачи панорамирования плоских объектов. Тр. и-та системного анализа. 2018. Т. 68. № S1. С. 124–133.
- Хартсхорн Р. Основы проективной геометрии. М.: Мир, 1970. 160 с.
- Babu N., Soumya A. Character recognition in historical handwritten documents. Proceedings of the 2019 IEEE International Conf. Communic. and Signal Processing. 2019. P. 299–304.
- Fan B., Qingqun K., Tomasz T., Zhiheng W. Receptive fields selection for binary feature description. IEEE Transactions on Image Processing. 2014. V. 23. № 6. P. 2583–2595.
- Iglewicz B., Hoaglin D. How to Detect and Handle Outliers. The ASQC Basic References in Quality Control: Statistical Techniques. Eds F. Edward, P. Mykytka. 1993. 77 p.
- Kelson R.T., Andre M.S., Adelardo A.D. Optical Flow Using Color Information. ACM New York. NY, USA. 2008. P. 5–10.
- Lukoyanov A.S., Nikolaev D.P., Konovalenko I.A. Modification of YAPE keypoint detection algorithm for wide local contrast range image. Information technologies and nanotechnology. 2018. P. 1193–1204.
- Martin A.F., Robert C.B. Random sample consensus: A paradigm for model fitting with applications to image analysis and automated cartography. Comm. of the ACM. 1981. V. 24. P. 381–395.
- Moreno-García C.F., Elyan E., Jayne C. New trends on digitisation of complex engineering drawings. Neural Computing and Applications. 2019. V. 31 (6). P. 1695–1712.
- Newman P., Ho K. SLAM-loop closing with visually salient features. IEEE Proc. of International Conference on Robotics and Automation. 2005. P. 635–642.
- Novack G.D., Lim M.C. Retinal Detachment: Patient Perspective and Electronic Health Records. American Journal of Ophthalmology. 2019. V. 208. P. 64–67.
- Olson D. L. Delen D. Advanced Data Mining Techniques. Springer, 1st edition. 2008. 138 p.
- Skoryukina N., Nikolaev D., Arlazarov V. 2D art recognition in uncontrolled conditions using one-shot learning. ICMV. 2018. P. 1–8.
- Skoryukina N., Nikolaev D.P., Sheshkus A., Polevoy D. Real time rectangular document detection on mobile devices. In Seventh International Conference on Machine Vision. 2015. V. 9445. P. 1–6.
- Turcot P., Lowe D.G. Better matching with fewer features: The selection of useful features in large database recognition problems. Computer Vision Workshops (ICCV Workshops). 2009. P. 2109–2116.