Найти тему
РБК Тренды

Искусственный интеллект перевел записи на древних глиняных табличках

Оглавление

Группа израильских ученых обучила модель искусственного интеллекта переводить клинопись древнего аккадского языка. Результаты их работы уже радуют археологов

   Unsplash
Unsplash

А в чем тренд?

Масштабная эволюция искусственного интеллекта привела к тому, что за последние несколько лет он стал помощником в решении глобальных задач в науке. ИИ-инструменты могут заменить или дополнить работу человека почти во всех случаях, когда решение нужно принимать на основе предыдущего опыта — в том числе в сфере перевода с древних языков.

Перевод — это не просто замена слов. При переводе важно понимать, как оба языка связывают мысли между собой, а затем использовать эти знания для сохранения нюансов оригинала. Этот процесс значительно усложняется в задачах по адаптации древних языков, которые нужно не только воскресить, но и восполнить культурный контекст, который часто утерян из-за нехватки источников.

Пример — аккадский язык, который использовался в Древней Месопотамии (территория современных Сирии и Ирака) в период между 2800 годом до н. э. и 500 годом н. э. Чтобы ускорить его изучение, группа из археологов и IT-специалистов разработала ИИ-инструмент, способный практически мгновенно переводить с аккадского.

Сохранившийся язык

Аккадский язык дошел до нашего времени в виде текстов, нанесенных на таблички, — писец наносил клинопись тростниковым стилусом на влажные глиняные прямоугольники перед их обжигом. Это оказалось на руку современным археологам — материал лучше противостоит пожарам и наводнениям, чем папирус или пергамент.

Трудности перевода

Несмотря на обилие табличек, крайне трудно правильно перевести древние библиотеки. Дело в том, что аккадский язык поливалентен: клинописные знаки могут иметь несколько различных прочтений в зависимости от того, как каждый из них функционирует в предложении, какое место в нем занимает.

Перевод с аккадского языка состоит из двух этапов. Сначала ученые должны транслитерировать клинописные знаки — зафиксировать схожие по фонетике звуки. После этого наступает этап адаптации с учетом поливалентных особенностей.

Машинный перевод от ИИ

Команда израильских исследователей разработала нейронную модель машинного перевода с аккадского. Похожая технология лежит в основе «Google Переводчика». Ученые обучили модель ИИ на выборке из клинописных текстов. После этого она смогла переводить их двумя способами — через транслитерацию или напрямую, адаптируя знаки в слова. В итоге модель прошла оценку способностей. Она продемонстрировала, что результаты работы ИИ были «высококачественными» в обоих случаях. Исследователи отмечают: «Практически в каждом случае тип речи текста был узнаваем. Перспективный сценарий на будущее заключается в том, чтобы модель показывала еще и список источников, от которых отталкивалась при переводе, что было бы особенно полезно для научных целей».

Работа над ошибками

Над результатами еще предстоит поработать. В обоих случаях некоторые из тестовых предложений были переведены неправильно. Как и другие модели ИИ, эта склонна к «галлюцинациям» — моментам, когда ответ не имеет никакой связи с исходным текстом.

Пример галлюцинации ИИ

Перевод, сделанный человеком: «Почему мы должны вести судебный процесс перед человеком из Либби-Али?»

Перевод ИИ: «Они находятся во Внутреннем городе во Внутреннем городе».

Модель ИИ лучше всего работает при переводе коротких и средних по длине предложений. Кроме того, она эффективнее справляется с более шаблонными жанрами вроде указов и отчетов, чем с мифами, гимнами и пророчествами. С увеличением числа тренировок на большем наборе данных команда намерена повысить точность ИИ и использовать его в качестве ассистента, результаты работы которого проверяют ученые.