Найти в Дзене

Загадка из «Одиссеи» в книге про LLM (байки ИТ-переводчика)

Казалось бы, ну как может быть связана греческая мифология и большие языковые модели? А вот как. Недавно я работал над переводом книги Томажа Братанича и Оскара Хана, где они описывают, как подружить графовую СУБД (neo4j) с разными пайплайнами RAG. С прискорбием вынужден сообщить, что несмотря на хорошее понимание матчасти (я эти пайплайны у себя настроил), это один из самых торопливых и неловких моих переводов (до сих пор стыдно перед проверявшими мой перевод редакторами - и поделом), так что писать про разного рода факапы и инсайты по этой книге я буду еще долго. Как бы то ни было, в одной из глав дело дошло до описания пайплайна Microsoft GraphRAG. Суть этого пайплайна в том, что база знаний здесь работает аналитически — т.е. сначала анализируются ключевые сущности, потом вокруг них собираются факты, факты собираются в сводки/резюме, и дальше семантический поиск по базе знаний уже идет по этим сводкам. И вот в качестве рабочего текста авторы не придумали ничего забавнее, чем взят

Казалось бы, ну как может быть связана греческая мифология и большие языковые модели? А вот как.

Недавно я работал над переводом книги Томажа Братанича и Оскара Хана, где они описывают, как подружить графовую СУБД (neo4j) с разными пайплайнами RAG. С прискорбием вынужден сообщить, что несмотря на хорошее понимание матчасти (я эти пайплайны у себя настроил), это один из самых торопливых и неловких моих переводов (до сих пор стыдно перед проверявшими мой перевод редакторами - и поделом), так что писать про разного рода факапы и инсайты по этой книге я буду еще долго.

Как бы то ни было, в одной из глав дело дошло до описания пайплайна Microsoft GraphRAG. Суть этого пайплайна в том, что база знаний здесь работает аналитически — т.е. сначала анализируются ключевые сущности, потом вокруг них собираются факты, факты собираются в сводки/резюме, и дальше семантический поиск по базе знаний уже идет по этим сводкам.

И вот в качестве рабочего текста авторы не придумали ничего забавнее, чем взять «Одиссею» Гомера с сайта проекта Gutenberg. Возможно, для англоязычных ИТ-шников выбор произведения был бы вполне ОК, но с точки зрения фактчекинга и перевода — получился полный "пердимонокль".

Начнем с того, что выбранный английский вариант — это перевод Сэмюэла Батлера (Samuel Butler), британского переводчика XIX века.

-2

Странности его перевода я начал замечать, когда мне по тексту встретился такой фрагмент, который попал в одну из сводок базы знаний:

It highlights the central figures Minerva, Telemachus, and Ulysses—along with their roles in the narrative, emphasizing divine guidance, familial loyalty, and challenges faced by the household of Ulysses.

Внимательный читатель, возможно, уже заметил момент, который меня смутил: дело в том, что Odyssey (который присутствует) на обложке, и Ulysses (который присутствует в цитате) — это одно и то же. Просто первое имя из греческой мифологии, а второе - из римской (ну типа как "Геракл" и "Геркулес").

Так получается Батлер переводил «Одиссея» с какой-то древнеримской версии поэмы, с латыни? Нет, с древнегреческой. Тогда зачем эти огороды? Поиски привели к следующим объяснениям переводчика:

The gods, whom Butler called by their Roman names, on the argument that the general reader would be more familiar with them, have here been restituted their Greek names; likewise the hero here goes by his original Greek name Odysseus, as fits the Odyssey, rather than his Latin name Ulysses. Menelaus has been given the Greek form of his name, Menelaos. All other names and geographical denominations have been left unchanged from Butler’s version.

Иными словами переводчик решил причинить публике удобства и дал героям более понятные имена. Ок, ладно, правда русским читателям конечно непривычно будет читать про "Юпитера" и "Минерву" в Одиссее, учитывая, что в русском переводе Одиссеи используются "Зевс" и "Афина". Оставим на совести авторов (тем более, что переводимая книжка все-таки про ИТ, ИИ и LLM, а не про мифологию).

-3

ДАЛЕЕ.

В саму «Одиссею», как я ни пытался избежать этой радости, тоже пришлось нырнуть. Дело было так. В одной из сводок для базы знаний попалось такое предложение:

Mentes is involved in a voyage to Temesa, known for its iron cargo, and claims kingship over the Taphians.

Если переводить через ИИ в лоб, мы получаем что-то типа:

Ментес участвует в плавании к Темесе, славящейся своими железными грузами, и претендует на царский престол тафийцев.

Практически любая энциклопедия разбивает этот перевод вдребезги, ибо:

Афина, в образе Мента сообщает Телемаху, что он отплывет в город Темеза со своей командой на поиски меди.

Иными словами, Темеза/Темеса славится медью, а не железом. Поискал в других энциклопедиях, там тоже про медь. Может изъян перевода? Как ни крути, надо идти в первоисточники: к С. Батлеру и В. А. Жуковскому (ибо древнегреческим я не владею).

Читаем следующее:

I am Mentes, son of Anchialus, and I am King of the Taphians. I
have come here with my ship and crew, on a voyage to men of a foreign
tongue being bound for Temesa with a cargo of iron, and I shall bring
back copper. As for my ship, it lies over yonder off the open country
away from the town, in the harbour Rheithron under the wooded mountain
Neritum.

Все откровенно тебе расскажу; я царя Анхиала
Мудрого сын, именуюся Ментесом, правлю народом
Веслолюбивых тафийцев; и ныне корабль мой в Итаку
Вместе с моими людьми я привел, путешествуя темным
Морем к народам иного языка; хочу я в Темесе
Меди добыть, на нее обменявшись блестящим железом;
Свой же корабль я поставил под склоном Нейона лесистым
На поле, в пристани Ретре, далеко от города.

Ага, вот теперь картинка нарисовалась: Мент/Ментес приплыл в г. Темезу на корабле, корабль гружен железом для обмена на медь. Таким образом, перевод приобретает примерно такой вид:

Мент участвует в плавании к Темесу на загруженных железом суднах и претендует на царство над тафийцами.

Пока всё. Спасибо за внимание.