Отечественный ИИ обучили распознавать рукописный шрифт
Новая нейросеть различает всю картинку целиком, по её признакам, подобно человеческому глазу. Благодаря подходу (end-to-end) искусственный интеллект за 3-4 секунды и с точностью от 80% распознает даже «шумные» рукописные данные в штампе регистрации паспорта, а такжеи в любых других типах документов. Сетка может работать без мощных видеокарт (GPU), на обычных процессорах. Разработчик технологии — компания «Биорг», резидент «Сколково».
Сначала ИИ тренировали на простых строках рукописного текста, затем обучили разбирать сложные, зашумленные фрагменты. Нейросеть определяет признаки символов, анализирует их вектор и декодирует в распознанные электронные данные, независимо от типа документа.
Модель обучили на открытых массивах и собственном наборе данных «Биорг» с применением реальных и синтетических изображений — всего использовали более 30 тыс. вариантов рукописных фрагментов. При обучении на дополнительных датасетах точность превысит 90%.
«Технология востребована для оцифровки рукописных фрагментов в паспортах, справках, трудовых книжках и военных билетах, что актуально для бизнес-процессов банков, страховых компаний и других корпоративных заказчиков. Далее мы адаптируем ее из SaaS в „коробочную“ версию ПО „Биорг.Документы“. Это веха в нашей стратегии непрерывных улучшений», — отмечает гендиректор «Биорг» Руслан Алигаджиев.
Традиционные подходы распознавания рукописных данных страдают от вариативности почерка: в штампах паспортов мешает «шум» от печатного текста, неровных строк и нестандартных адресов.
End-to-end модель Биорг обрабатывает изображение как единый массив данных, минимизируя ошибки.
Кстати, а вы знали, что на «Сделано у нас» статьи публикуют посетители, такие же как и вы? И никакой премодерации, согласований и разрешений! Любой может добавить новость. А лучшие попадут в наш Телеграм @sdelanounas_ru. Подробнее о том как работает наш сайт здесь👈
Комментарии 0