Affiliation:
1. Financial University under the Government of the Russian Federation, Moscow, Russia
Abstract
В статье показана актуальность задачи преобразования в текстовой
формат элементов изображений, содержащих последовательности машинописных
цифр. На примере распознавания табличной информации из отсканированных
документов ППК «Роскадастр» предложено возможное решение этой задачи
с использованием свёрточных нейронных сетей (CNN). Описаны принципы
формирования наборов данных и моделей CNN для распознавания
последовательностей из двух, трёх и четырёх цифр. Приведены результаты
экспериментального исследования этих моделей и показана их
эффективность. Описана интеграция моделей CNN в разрабатываемую
в настоящее время информационную систему (ИС), предназначенную для
автоматизированного перевода отсканированных документов в их текстовые
аналоги.
Publisher
Ailamazyan Program Systems Institute of Russian Academy of Sciences (PSI RAS)