600-летняя рукопись Войнича — одна из самых больших загадок в криптологии. Ученые пытаются прочесть ее с помощью ИИ.
Канадские криптоаналитики, возможно, разгадала тайну 600-летней книги, которая ставила в тупик экспертов по шифрованию. Однако, скорее всего, их успех — лишь иллюзия.
В исследовании, опубликованном в журнале Transactions of the Association of Computational Linguistics , ученые-компьютерщики из Университета Альберты использовали алгоритм, чтобы попытаться расшифровать части Манускрипта Войнича — средневековой книги, написанной на неизвестном языке.
Однако другие ученые настроены скептически, и рукопись остается документом, окутанным тайной.
Что такое «Рукопись Войнича»?
Рукопись Войнича — это зашифрованный текст, созданный в Центральной Европе в XV веке. Книга чуть больше современной мягкой обложки, содержит 246 хрупких страниц из пергамента или кожи животных. В ней нет индекса, но были развороты, которые исчезли. Номера страниц не сохранились, а порядок может отличаться от изначального.
Элегантный, петлевой шрифт из 25–30 символов идет слева направо короткими абзацами вниз по страницам, перемежаясь подробными иллюстрациями. Визуализации показывают каракули замков и драконов вместе с диаграммами растений, планет, обнаженных фигур и астрономических символов, все детализировано зелеными, коричневыми, желтыми, синими и красными чернилами. Один особенно любопытный отрывок показывает десятки обнаженных женщин, купающихся в бассейнах взаимосвязанной зеленой жидкости.
С 1969 года рукопись находится в Библиотеке редких книг и рукописей Бейнеке при Йельском университете. Она названа в честь Вильфрида Михаэля Войнича, польского книготорговца, который купил ее в иезуитской библиотеке Италии в 1912 году. Он пытался найти желающих перевести ее, но безуспешно.
На основе иллюстраций ученые полагают, что книга разделена на шесть разделов: травяной, астрономический, биологический, космологический, фармацевтический и рецепты. Возможно, рукопись имеет магический или научный характер.
Исторические записи показывают, что текст попадал в руки как алхимиков, так и императоров. В конце XVI века немецкий император купил рукопись у английского астролога за 600 венецианских дукатов, думая, что это работа средневекового монаха Роджера Бэкона . Оттуда она в конечном итоге перешла к богемскому фармацевту.
Что нового в этом исследовании?
Авторы исследования пишут, что рукопись Войнича представляет собой «самую сложную задачу дешифровки», поскольку мы не знаем ее секретного кода, но — что, возможно, еще важнее — не знаем и языка, на котором она написана.
Они подошли к тексту, вооружившись компьютерной программой собственной разработки. Первоначально ученые подозревали, что рукопись была сделана из типа безгласной альфаграммы или анаграммы, в которой буквы в слове переписаны в алфавитном порядке. (Например, «manuscript» будет записано в виде «acimnprstu».) Поэтому они обучили алгоритм расшифровывать 380 версий «Всеобщей декларации прав человека» ООН на разных языках .
После того, как ИИ показал 97-процентный успех в сопоставлении анаграмм с современными словами, исследователи ввели в него текст с первых десяти страниц Рукописи Войнича. Алгоритм обнаружил, что 80 процентов закодированных слов, по-видимому, были написаны на иврите.
Теперь у ученых был язык. Им нужно было понять его смысл. Они показали первое предложение коллеге-носителю иврита. Он не смог перевести его на связный английский. Тогда исследователи обратились к Google Translate. После исправления орфографических ошибок предложение выглядело так: «Она дала рекомендации священнику, мужчине в доме, мне и людям». Это странное высказывание, но в нем все же есть смысл.
Ученые также перевели раздел из 72 слов, известный как «травяная» глава, и смогли расшифровать слова «фермер», «свет», «воздух» и «огонь» с помощью своего нового кода.
Подождите… Google переводит?
Да, Google Translate. Машинный переводчик работает, анализируя сотни миллионов документов , переведенных людьми. Затем, используя статистику, инструмент выдает перевод на основе этих документов. Хотя инструмент переводит слова группами , а не пословно, он все равно не так эффективен, как переводчики-люди.
А теперь вернемся к рукописи.
Какие еще проблемы есть в исследовании?
Для начала, программа ИИ была обучена путем перевода различных современных языков на английский, в отличие от языков 15-го века. Хотя Манускрипт Войнича мог быть написан на иврите, это был бы средневековый иврит, а не современный эквивалент, который использует Google Translate.
Хотя искусственный алгоритм сопоставил 80 процентов текста с ивритом, это оставляет еще 20 процентов, совпадающих с другими языками. Согласно исследованию, другие языки, которые могли быть использованы в рукописи, это малайский, арабский и амхарский, которые сильно отличаются от иврита.
Справедливости ради, исследователи не утверждают, что раскрыли секреты всей рукописи Войнича. Скорее, они говорят, что определили язык и схему кодирования текста. Следующий шаг — найти ученого, хорошо разбирающегося в иврите и алфавитных знаках, и они с нетерпением ждут возможности применить эту технику взлома кодов к другим древним рукописям.
В прошлом люди ошибались, и многие теории быстро рушились под натиском научных фактов. Даже Алан Тьюринг, легендарный взломщик нацистского кода «Энигма», не смог расшифровать рукопись Войнича.
Мы до сих пор не знаем, написан ли текст на каком-то зашифрованном языке или это просто искусственно созданный набор символов. Возможно, он вообще не имеет смысла.
Какие еще теории о рукописи существуют?
Помимо канадской команды, другие исследователи предположили, что рукопись написана на иврите. Десятки других языков также были поставлены под сомнение, включая латынь и язык, происходящий от сино-тибетской семьи.
Некоторые предполагают, что книга содержит ранние открытия и изобретения Роджера Бэкона. Но это также может быть пиджин-молитвенник еретической христианской секты или бессмысленный набор тарабарщины, продаваемый оккультным философом за деньги.
Рукопись Войнича остается одной из крупнейших нерешенных проблем в истории криптологии. Каждый год предлагается множество переводов, но окончательный код еще не определен.