MAX
Подпишись
стань автором. присоединяйся к сообществу!
2 дня назад 9

ИИ извлекает автора и заголовки из изображений книг, а также определяет их рубрики

Корпорация ЭЛАР расширяет применение технологий искусственного интеллекта в задачах обработки библиотечных и архивных фондов. Сформирован подход к извлечению автора и заглавия непосредственно из изображений книжных обложек, а также к определению предметных рубрик.

© elar.ru

Речь идёт не просто о распознавании текста, а об анализе обложки как единого визуального объекта, в котором важно не только содержание строк, но и их роль в общей композиции.

Книжная обложка — сложный для автоматизации объект. Информация распределена по разным зонам, отличается по размеру, композиции и графическому оформлению. Название может быть визуально доминирующим или, наоборот, встроенным в художественный элемент, имя автора — вынесенным в отдельный блок или интегрированным в общий дизайн. В таких условиях недостаточно извлечь текст, необходимо корректно определить роль каждого элемента.

Реальные фонды как обучающая среда

Подход реализован с использованием комплекса локальных нейросетевых моделей, основанных на архитектуре трансформеров, применяемых для анализа документальных и книжных материалов. Модели дообучены на цифровых массивах, сформированных в ходе масштабных проектов ЭЛАР по оцифровке государственных и культурных коллекций.

Работа с разнородными фондами позволила сформировать алгоритмы, устойчивые к вариативности оформления и структуре подачи информации. Это делает обработку применимой к большим исторически сложившимся массивам без предварительной унификации источников.

Метаданные из визуальной иерархии

Разработанный механизм позволяет автоматически формировать ключевые элементы библиографического описания, — автора, заглавие и предметные рубрики на основе анализа композиционной структуры обложки. При массовой обработке записи создаются по единой логике, что повышает сопоставимость данных и снижает вариативность описаний в электронных каталогах.

Новая практика работы с книжными фондами

Технология может использоваться при массовой оцифровке для формирования первичных метаданных, при ретроконверсии карточных каталогов и при актуализации существующих записей. Однако её значение шире: анализ обложек становится частью системной обработки фондов, где важно не только сохранить изображение, но и сразу встроить его в цифровую структуру поиска и навигации.

Для архивов и библиотек это означает возможность ускорить ввод больших массивов изданий в электронный оборот без потери управляемости каталогов. Формирование автора, заглавия и предметных рубрик на основе анализа оформления снижает нагрузку на ручную каталогизацию и делает обработку масштабируемой при сохранении логики и сопоставимости описаний.

Таким образом, работа с обложкой превращается из вспомогательной операции в инструмент упорядочивания фондов и повышения качества цифровых коллекций.

Кстати, а вы знали, что на «Сделано у нас» статьи публикуют посетители, такие же как и вы? И никакой премодерации, согласований и разрешений! Любой может добавить новость. А лучшие попадут в наш Телеграм @sdelanounas_ru. Подробнее о том как работает наш сайт здесь👈

Источник: elar.ru

Комментарии 0

Для комментирования необходимо войти на сайт