Прорыв в области искусственного интеллекта делает возможным расшифровку свитков Геркуланума, обугленных в результате извержения вулкана две тысячи лет назад. Теперь исследователи узнали, о чем думал по крайней мере один римский философ-эпикурейец: о еде!
Это открытие стало кульминацией Vesuvius Challenge — конкурса, запущенного в марте 2023 года исследователем из Университета Кентукки Брентом Силсом и предпринимателем и инвестором Дэниелом Гроссом. Цель состояла в том, чтобы сделать компьютерную томографию (КТ) так называемых свитков Геркуланума, а потом обработать данные с помощью ИИ. После чего передать информацию в руки специалистов со всего мира в надежде, что кто-нибудь сможет прочитать свитки, даже не прикасаясь к ним.
При поддержке Кремниевой долины организаторы выделили призовые деньги за прогресс в прочтении рукописей. 700 000 должны быть разделены между членами команды-победителя: Юсефом Надерой, Люком Фарритором и Джулианой Шиллигер. Они представили 15 колонок текста, которые по предварительному анализу содержат рассуждение о том, влияет ли дефицит или изобилие товаров (например, еды), на то, насколько приятными их находят люди.
Никогда ещё учёные не были так близки к прочтению сокровищницы древних текстов. На самом деле, дедлайн конкурса не имел особого значения. Важно, что задача вызвала интерес и привлекла новых сотрудников, чей вклад равносилен 10 годам человеческой работы. Исследователь, изучавший свитки, подсчитал, что все эти усилия могут привести к появлению около 200 новых книг. Коллекция также является единственной сохранившейся библиотекой древности.
Как это было
Учёный Брент Силс несколько лет занимался проблемой обугленных текстов. Он не собирался тратить два десятилетия на попытку развернуть свитки. Он был специалистом по визуализации и интересовался искусственным интеллектом, но тогда развитие ИИ шло медленно. Однако в области компьютерного зрения наблюдался значительный прогресс.
В середине 1990-х годов он встретил профессора Университета Кентукки, который работал над оцифровкой рукописи англосаксонской эпической поэмы «Беовульф». Цифровизация перешла в реставрацию. Когда текст стал цифровым, появилась возможность повысить качество изображения. Если специалисты смогли разгладить смятый документ в цифровом формате, почему аналогичным способом нельзя развернуть свиток?
В 2004 году Силс, наконец, нашел что-то, что можно было развернуть. Это были обугленные Свитки Геркуланума.
Копаем прошлое
В наше время извержение Везувия вызывает в памяти жуткие образы погребенных в пепле тел, отчаянно держащихся друг за друга. Единственное свидетельство того времени взято из писем римского писателя и юриста Плиния Младшего, который описал паникующие толпы и «густое черное облако», которое поглотило землю, как наводнение.
Когда облако рассеялось настолько, что сквозь него проник дневной свет, Плиний Младший увидел, что всё погребено глубоко под пеплом, напоминавшим снег.
В Геркулануме — городе, расположенном примерно в 10 милях к западу от Помпеи и даже ближе к извергающемуся вулкану — весь падающий пепел и обломки похоронили виллу, когда-то принадлежавшую тестю Юлия Цезаря. На рендерах поместья виден гигантский двор, сады и арки. Важно отметить, что на вилле также располагалась библиотека свитков папируса.
Хотя около 65 футов горячего пепла могут показаться худшим из возможных последствий для папируса, жар обуглил свитки, предохранив их от естественного разрушающего воздействия воздуха.
Лишь в 1700-х годах фермер, копая колодец, наткнулся на мрамор и начал раскопки, в ходе которых было обнаружено более 600 неоткрытых свитков.
Свитки перешли под опеку Антонио Пьяджо, ученого из Ватиканской библиотеки, который изобрел машину, позволяющую разворачивать некоторые из наиболее хорошо сохранившихся свитков. Правда, не всегда успешно.
То, что удалось развернуть, содержало в основном эпикурейскую философию, что позволило предположить, что оставшиеся свитки имеют ту же природу. Возможно, они не изменят взгляд ученых на древний мир, но, учитывая нехватку произведений того времени, еще 200 книг могли бы стать приличным уловом.
Это не «эксперимент»
Сегодня свитки хранятся в нескольких местах по всей Европе, а основная часть находится в Национальной библиотеке Неаполя в Италии.
Конечно, большинство людей не могут прийти и возиться с хрупкими свитками, которым 2000 лет. Силсу потребовались годы, чтобы выстроить доводы в пользу финансирования и получения доступа
Силс, имевший опыт в хирургических инновациях, таких как лапароскопия, хотел использовать компьютерную томографию для сканирования свитков, а затем создать программное обеспечение для упаковки этих сканов.
В 2005 году Силзу представилась возможность поделиться своей идеей на лекции в Оксфорде. К тому времени он и его команда собрали образец папируса, заключенного в полиуретановую сферу, которую они отсканировали и виртуально развернули.
Реакция была положительной, но для реставраторов это все равно звучало как эксперимент, а «эксперимент» — ругательное слово, когда оно применяется к чему-то столь редкому и старому.
После четырех лет напряженной работы и налаживания отношений, в 2009 году Силс и его команда отправились в Институт Франции, чтобы сделать свои первые микроКТ-сканирования папирусов.
Несмотря на то, что получить, наконец, сканы свитков, было большим достижением, Силс изо всех сил старался заставить программное обеспечение работать так, как того хотела команда.
Поиск неисправностей
Сказать, что Силс работал над свитками Геркуланума в течение 20 лет, может означать, что он каждый день приходил и выходил из офиса с единственной целью.
На самом деле были отрезки времени, когда команда не могла работать над свитками или работала над цифровым сканированием и развертыванием других текстов, что некоторым образом все же помогало им приблизиться к конечной цели.
В 2006 году команда Сила развернула средневековую копию Книги Экклезиаста, написанную на иврите. Год спустя, в 2007 году, Силс был в составе команды, которая отправилась в Венецию, чтобы оцифровать старейшую полную копию «Илиады» Гомера.
Несмотря на все усилия, в 2012 году развитие Геркуланума пришло в упадок. В следующем году Силс взял творческий отпуск и провел год в Париже в качестве приглашенного ученого в Институте культуры Google. Это дало ему шанс восстановить уверенность и получить приток новых людей и новых идей. Как раз в тот период Google собиралась приобрести исследовательскую лабораторию искусственного интеллекта DeepMind.
Примерно в то же время Силс начал реализовывать идею сканирования внутри ускорителя частиц, что значительно повысило бы разрешение изображений.
Одной из главных проблем была так называемая сегментация. Хотя свитки довольно маленькие, их сканы подробные. Технический руководитель Стивен Парсонс, который впервые работал с Силзом, будучи студентом Университета Кентукки, описал попытку разделения слоев частично измельченного оцифрованного папируса и сети волокон, видимых на сканах. Он сравнил это с тем, как могло бы выглядеть бревно в поперечном сечении, но несколько разбитое.
Еще одной проблемой было чтение чернил на папирусе. Парсонс сказал, что лучшая технология визуализации, которую они могут увидеть внутри свитков, — это рентгеновская микроКТ. Проблема в том, что контраста недостаточно для чтения чернил.
Свитки Геркуланума были написаны сажей масляных ламп, которая по химическому составу представляет собой почти чистый углерод. Поскольку папирус также химически представляет собой углерод, команда вынуждена была разглядывать серое на сером.
В других проектах, таких как свиток Эн-Геди в 2016 году — самый старый свиток Пятикнижия (относящийся к первым пяти книгам Библии) со времен свитков Мертвого моря, использовались чернила. В их состав входило железо, которое проявляется в ярких пятнах на рентгеновских лучах.
Потребовались годы работы, проверка идеи на оцифрованных свитках и фрагментах свитков Геркуланума, чтобы прочитать два символа из слоев, расположенных глубоко внутри свитка.
Проблема с программным обеспечением
Сегментация и обнаружение чернил намекают на то, что получение сканов было лишь частью общей задачи, связанной со свитками. Получение данных и их алгоритмическая сортировка — это совсем другая история.
После нескольких итераций команда Силса создала Volume Cartographer, написанный главным образом руководителем проекта Сетом Паркером, который присоединился к команде в 2012 году. Это программное обеспечение с открытым исходным кодом, используемое для картирования внутренней части свитков.
Когда-то Паркер специализировался в области средств массовой информации и коммуникаций, а затем получил докторскую степень в области информатики.
Он также получал дополнительную помощь с Volume Cartographer от людей, нанятых Vesuvius Challenge, которые работают над списком пожеланий по исправлению ошибок.
Создание Vesuvius Challenge означало, что над проектом теперь смогут работать люди со всего мира. По оценкам Парсонса, более 1000 человек работали над проектом большую часть года, и это одновременно пугает и волнует.
В конце концов, именно студенты-компьютерщики впервые расшифровали слово «фиолетовый».
И это не конец
Хотя 15 колонок текста — это больше, чем ожидал Силс, это вряд ли конец истории.
Паркер и Парсонс полагают, что их работа может также вдохновить другие области, использующие многомерные изображения.
КТ и МРТ уже являются мощными инструментами, но что, если от невооруженного глаза врачей все еще скрывается информация, которая могла бы улучшить обнаружение опухолей и тому подобное?
И еще есть древние тексты, которые стоит прочитать. Параллельно исследователи работают над средневековой рукописью из библиотеки Моргана — коптским Евангелием, страницы которого сплавлены. Учёные сделали несколько компьютерных томографий и снова пытаются распутать рукопись, чтобы открыть написанное внутри.
Краткосрочная цель на 2024 год — прочитать 90% свитка, начатого Надером, Фарритором и Шиллигером.
Древние тексты говорят о любви, войне, музыке, риторике, поэзии — темах, которые до сих пор тревожат умы людей. А ещё еда, конечно.
«Мы должны это прочитать», — сказал Силс. «Мы должны это изучить. Мы не можем этого забыть».