Попробовать технологию в действии можно уже сейчас в сервисе «Поиск по архивам». Пресс-служба компании сообщила радиостанции «Говорит Москва», что поиск открывает всем желающим доступ к более чем 2,5 млн страниц исторических документов с текстовой расшифровкой. Новый алгоритм, построенный на основе системы оптического распознавания символов, учитывает особенности почерка, узнаёт утратившие актуальность буквы и понимает особую структуру архивных документов. Отмечается, что специалисты компании обучили нейросеть на массиве данных из сотен тысяч рукописных строк из реальных текстов XVIII–XIX веков и десятков миллионов сгенерированных примеров. Материалы для обучения размечали и расшифровывали эксперты, они же контролировали качество распознавания. В базе сервиса можно быстро находить документы с упоминанием фамилии, населённого пункта или любых других слов, сказала радиостанции «Говорит Москва» руководитель «Яндекс.Поиск» Елена Бубнова. «Для расшифровки одной страницы архивного рукописног
«Яндекс» запустил поиск и расшифровку архивных рукописных документов с помощью нейросетей
25 января 202325 янв 2023
21
1 мин