Корпорация ЭЛАР расширяет применение технологий искусственного интеллекта в задачах обработки библиотечных и архивных фондов. Сформирован подход к извлечению автора и заглавия непосредственно из изображений книжных обложек, а также к определению предметных рубрик. Речь идёт не просто о распознавании текста, а об анализе обложки как единого визуального объекта, в котором важно не только содержание строк, но и их роль в общей композиции. Книжная обложка — сложный для автоматизации объект. Информация распределена по разным зонам, отличается по размеру, композиции и графическому оформлению. Название может быть визуально доминирующим или, наоборот, встроенным в художественный элемент, имя автора — вынесенным в отдельный блок или интегрированным в общий дизайн. В таких условиях недостаточно извлечь текст, необходимо корректно определить роль каждого элемента. Подход реализован с использованием комплекса локальных нейросетевых моделей, основанных на архитектуре трансформеров, применяемых для
ИИ судит по обложке: визуальный анализ становится инструментом интеллектуальной каталогизации
13 февраля13 фев
5
2 мин