Состояние исторической памяти современного российского общества часто вызывает обеспокоенность у ученых и публицистов, общественных и государственных деятелей. Накопленного исторического и документального материала много, но он хранится в архивах, работать с ним неудобно, информацию искать долго. Но, как и в любом другом большом массиве данных, здесь на помощь историкам может прийти искусственный интеллект.
Константин Могилевский - Председатель правления, Российское историческое общество:
«Сегодня мы даже не можем представить какой шлейф из документов оставляем за собой, и на какой круг вопросов можно ответить, анализируя весь этот объём документов».
Современные архивы столкнулись с проблематикой доступа к документам при этом сохраняя состояние первоисточника.
Каждый архив, будь то исторических архив, или архив делопроизводства самостоятельно начал оцифровку своих материалов, отвечая на запрос общества работать с документами удалённо.
При создании своих собственных электронных баз архивы столкнулись с проблемой удобного поиска документов для исследователей, а также с местом хранения всего электронного массива данных.
Ещё одну проблему, которую стоит отметить, с которыми столкнулись архивы при обработке информации, это распознавание вручную рукописных материалов. Это огромный человеческий ресурс, которым не обладает ни один архив в нашей стране.
Одним из выходов для упрощения распознавания письменных источников, применение искусственного интеллекта, и одним из успешно применённых проектов на практике, является Digital Пётр, созданный при поддержке Сбера.
Благодаря применению искусственного интеллекта были распознаны скорописные документы Петра I с точностью до 97%.
Оцифровка документов для всех архивов нашей страны требует единого электронного каталога с удобной системой поиска и работой документов. Поэтому сейчас создаётся пилотная программа по созданию общей электронной базы для архивов.
Для быстрой и наиболее точной работы искусственного интеллекта по распознаванию скорописных документов необходимо создать единую каллиграфическую базу.
Одной оцифровки документов недостаточно, нужно реформировать всю работу системы архивов:
- Совершенствовать законодательную базу;
- Совершенствовать работу архивов;
- Создавать качественные описи дел;
- Создать понятийный аппарат.
#КМУ2022
Материал в нашем Телеграм-канале: https://t.me/scienpolicy/29317