Найти в Дзене
Классические розы

Рукописи не горят! Свитки из Геркуланума может читать искусственный интеллект.

Заметка №29

Город Геркуланум, как и Помпеи, известен тем, что в 79 году погиб в результате извержения вулкана Везувий. Раскопки в этих местах идут с XVIII столетия и по сей день.

В Геркулануме, под 20 метрами окаменевшей грязи и пепла, было обнаружено настоящее сокровище - библиотека с античными свитками. Она находилась на вилле, которая когда-то принадлежала тестю Юлия Цезаря. Открыл виллу один счастливый фермер в 1750 году, пытаясь выкопать колодец на своем участке.

Реконструкция виллы в Геркулануме, где была обнаружена библиотека. Источник: https://scrollprize.org/
Реконструкция виллы в Геркулануме, где была обнаружена библиотека. Источник: https://scrollprize.org/

Но вот беда - свитки спеклись и обгорели. Они больше походили на окаменевшие комки пепла, которые, тем не менее, сохранили внутри себя античные тексты.

Карбонизированный свиток из библиотеки в Геркулануме. Источник: https://scrollprize.org/
Карбонизированный свиток из библиотеки в Геркулануме. Источник: https://scrollprize.org/

Попытки развернуть их и прочитать содержимое приводили каждый раз к тому, что они рассыпались. Одному монаху, правда, удалось развернуть некоторые из них (этот процесс занял десятилетия) и прочитать греческие тексты. Но это счастливое исключение. В остальных случаях, свитки превращались в горстку крошек:

Результаты попыток развернуть античные свитки из библиотеки в Геркулануме. Источник: https://scrollprize.org/
Результаты попыток развернуть античные свитки из библиотеки в Геркулануме. Источник: https://scrollprize.org/

В наше время ученые попытались отсканировать свитки, не разворачивая их. Эта заслуга принадлежит Бренту Силзу из Университета Кентукки. Он использовал томографию, компьютерные программы, для того, чтобы научиться «виртуально» читать поврежденные тексты и восстанавливать их.

В марте 2023 года ученые объявили открытый конкурс под названием «Вызов Везувия», с задачей распознать и дешифровать эти свитки. Один из призов достался студенту Люку Фарритору (21 год). Он разработал алгоритм на базе нейросети, который анализировал микроскопические различия в рельефе и текстуре листов свитков.

Скан неразвернутого свитка Филодема Гадарского и буквы, которые складываются в слово «ΠΟΡΦΥΡΑΣ» - (porphyras), «порфирный», благодаря искусственному интеллекту. Вне контекста не очень понятно окончание этого слова и его перевод. Дешифровка продолжается. Источник: https://scrollprize.org/firstletters.
Скан неразвернутого свитка Филодема Гадарского и буквы, которые складываются в слово «ΠΟΡΦΥΡΑΣ» - (porphyras), «порфирный», благодаря искусственному интеллекту. Вне контекста не очень понятно окончание этого слова и его перевод. Дешифровка продолжается. Источник: https://scrollprize.org/firstletters.

В итоге, он смог «надрессировать» искусственный интеллект определять чернила в отсканированном Силзом свитке и даже прочитать несколько слов!

Задача это не из легких, потому что античные авторы не использовали пробелы и в текстах тяжело определить границы слов, особенно, если «чернильный» сигнал слабый.

Текст PHerc. Paris. 4 (Institut de France), невидимый в течение 2000 лет. Примерно 95% свитка еще предстоит прочитать. Источник: https://scrollprize.org/grandprize
Текст PHerc. Paris. 4 (Institut de France), невидимый в течение 2000 лет. Примерно 95% свитка еще предстоит прочитать. Источник: https://scrollprize.org/grandprize

Пока сканировали и прочитали 5% первого свитка и оказалось, что он принадлежит перу Филодема Гадарского (ок. 110 - ок. 30 г. до н. э.), стихи которого высоко ценил Цицерон. Считается, что он как раз работал на вилле, которая сгорела вместе с библиотекой в Геркулануме во время извержения Везувия. О его текстах ничего и не было известно, до этой дешифровки. Это абсолютно уникальный текст, который посвящен эпикурейской философии.

В 2000-летнем свитке обсуждается музыка, еда и то, как наслаждаться жизнью, используя аскезу на фоне всеобщего изобилия.

Это ли не чудо? 

В этой библиотеке могут храниться давно утерянные рукописи, о которых мы знаем только благодаря упоминаниям известных античных авторов. Теперь есть способ, не разворачивая папирус, прочитать обуглившийся текст.

Следующим шагом ученых и энтузиастов станет масштабирование процессов сканирования, сегментации и определения текста, чтобы без труда читать свитки целиком.

Если и нужно было изобрести нейросеть, то только для этого!

Ознакомится с процессом этой работы, можно здесь:

Vesuvius Challenge