11,9 тыс подписчиков

Сможет ли искусственный интеллект расшифровать рукописи Петра I

12 августа 202012 авг 2020

123

2 мин

Подписывайтесь на канал «Другая фаза», чтобы быть в курсе самых горячих тем.

В архивах хранятся миллионы рукописей, которые пока не поддаются расшифровке. А между тем учёные крайне заинтересованы в том, чтобы прочесть эти документы, перевести в машинописный текст и в идеале опубликовать. Почему бы не подключить к этому искусственный интеллект? Казалось бы, решение на поверхности. Но не всё так просто.

Идея обратиться к машинным технологиям для расшифровки древних манускриптов всплывает в учёных кругах постоянно. Недавно об этом снова задумались в связи с проектом Сбербанка по освоению творческого наследия Петра I.

Петр I оставил после себя миллионы рукописных страниц. И проблема не только в количестве. Почерк у царя не слишком читаем, поэтому перед исследователями стоит непростая задача. Идея расшифровать записи государя родилась ещё в XIX веке, но, как говорится, воз и ныне там. Учитывая объёмы и сложность работы, надежда только на современные компьютеры.

Искусственный интеллект прочтёт то, что не под силу человеку?

Машинные технологии давно используются для подобных целей. Скажем, западные учёные разработали программу, которая умеет изучать и переводить давно забытые языки. Ещё один пример — проект «Пифия», в котором машинный интеллект используют для того, чтобы восстанавливать повреждённые фрагменты исторических манускриптов. Похоже, роботы умнее человека, и им под силу сделать то, над чем люди бьются на протяжении веков.

Но не всё так просто, как хотелось бы. Роман Душкин, директор по науке и технологиям АИИ (Агентства Искусственного Интеллекта) объясняет почему.

Технологии распознавания текстов при помощи машинных технологий существуют давно и вполне отработаны. Берутся блоки рукописного текста, делается специальная разметка, затем программа обучается переводу отсканированного текста в символы, то есть в машиночитаемый текст. По мере обучения ИИ начинает сам переводить текст и отмечать места, где это сделать затруднительно. Это несложная задача для современных программ. Но вот работа с древними рукописями — совсем другое дело.

Проблема в том, что для тренировки машинного интеллекта в его память нужно поместить гигантское количество образцов. Лишь в этом случае он способен научиться распознавать тексты и даже расшифровывать закодированные послания.

Сложнее обстоят дела в случае, если есть только один образец текста, как в случае манускрипта Войнича. Известно, что программа, созданная канадскими разработчиками, сумела расшифровать лишь начальную фразу текста. Увы, дальше дело не пошло.

Резюмируя, сегодня пока рано говорить о том, что ИИ намного превосходит человеческие возможности в области расшифровки исторических рукописей. Скорее это отдалённая перспектива.

Что касается рукописей Петра I, то, скорее всего, в ближайшем будущем их быстрее прочтут сами исследователи. В конце концов, как признают специалисты, у царя был не такой уж и плохой почерк.

Спасибо, что дочитали! Не забывайте, пожалуйста, оценить запись лайком. Это вдохновляет нас на новые уникальные материалы для вас. До новых встреч!

Дополнительная информация: https://www.kommersant.ru/doc/4389344