Добавить в корзинуПозвонить
Найти в Дзене
karpobor23

Некоторые приемы преподавания суахили (часть 11)

Mbinu Fulani za Kufundishia Kiswahili 11
Некоторые приемы преподавания суахили 11 Miujiza ya Tafsiri ya Kimashine. Natija Yake Ipi? Чудеса машинного перевода. Каков результат?
Прежде, чем непосредственно перейти к проблеме связанной с «чудесами» машинного перевода» в условиях Танзании, хотелось бы особо подчеркнуть, что руководство страны еще с конца прошлого века стало по мере возможностей заниматься вопросами, связанными с внедрением и развитием информационно-коммуникационных технологий (ИКТ), как общей базы для «цифровой среды». Уже в 2003 была принята Национальная политика ОРТ в области ИКТ (“Sera ya TEHAMA”). Эта политика продолжает неоднократно дорабатываться, и она в определенной степени позволила стране сделать серьезный шаг в областях телекоммуникаций, в становлении цифровой инфраструктуры, развитии человеческого капитала и использования ИКТ для предоставления услуг населению. В соответствии с принятыми установками созданием и развитием киберпространства в Танзании занимаютс
Оглавление

Mbinu Fulani za Kufundishia Kiswahili 11
Некоторые приемы преподавания суахили 11

Miujiza ya Tafsiri ya Kimashine. Natija Yake Ipi?

Machine learning AI generated
Machine learning AI generated

Чудеса машинного перевода. Каков результат?

Прежде, чем непосредственно перейти к проблеме связанной с «чудесами» машинного перевода» в условиях Танзании, хотелось бы особо подчеркнуть, что руководство страны еще с конца прошлого века стало по мере возможностей заниматься вопросами, связанными с внедрением и развитием информационно-коммуникационных технологий (ИКТ), как общей базы для «цифровой среды». Уже в 2003 была принята Национальная политика ОРТ в области ИКТ (“Sera ya TEHAMA”). Эта политика продолжает неоднократно дорабатываться, и она в определенной степени позволила стране сделать серьезный шаг в областях телекоммуникаций, в становлении цифровой инфраструктуры, развитии человеческого капитала и использования ИКТ для предоставления услуг населению. В соответствии с принятыми установками созданием и развитием киберпространства в Танзании занимаются в той или иной степени практически все госструктуры. Это позволило

руководству ОРТ реально много сделать и для создания инфраструктуры, необходимой для функционирования искусственного интеллекта (ИИ).

В результате чего появились реальные островки такой инфраструктуры, что, в свою очередь, вполне может использоваться для работы по расширению возможностей ИКТ.

Будем надеяться, что усилия руководства страны, с учетом вероятного привлечения внутреннего и внешнего бизнеса будут более эффективно служить делу «цифровизации» страны и, соответственно, более широкому применению ИИ. Другое дело, что пока в африканских странах вообще и в Танзании в частности связанные с ИИ технологии в большинстве случаев исполняют роль «помощника», либо «продвинутого» секретаря-референта.

Ну, вот мы и подошли к интересующим нас проблемам машинного перевода на и с суахили, которые во многом связаны с тем, что используемые в Танзании ИИ-переводчики применяют иностранные ИИ-программы. Получаемый в результате транслят (т.е. «результат перевода» согласно «Толковому переводоведческому словарю» замечательного Льва Львовича Нелюбина), воспринимается местным населением, не как «живой» язык, а скорее, как продукт “tafsiri ya mashine” (машинного перевода). Более того, многие «продвинутые» танзанийцы вполне себе серьезно считают, что машины для перевода совместно с ИИ и другими инструментами ИКТ якобы обязательно приведут, если уже не приводят к безработице среди танзанийских специалистов и вообще образованных людей.

Работе конец. Фото из газеты TaifaLeo Febr 5 2026
Работе конец. Фото из газеты TaifaLeo Febr 5 2026

Кстати, вслед за М. Л. Ростовой и Е. В. Семеновой, для целей данной заметки, под термином «машинный перевод» понимается « процесс автоматического перевода текстов с одного языка на другой с помощью ИИ и без вмешательства со стороны человека» (Теория и практика перевода: учеб. пособие / М. Л. Ростова, Е. В. Семенова. – Красноярск: Сиб. федер. ун-т, 2025. – 71 с).

Вообще-то машинный перевод – наиболее популярен среди ИКТ пользователей Танзании, т.к. чаще всего бесплатно переводит сразу большие куски, хоть устной, хоть письменной речи и без заумной «промптовой» подготовки. Конечно, даже в Танзании можно найти специалистов, которые говорят, что машинный перевод это не совсем, либо совсем не ИИ-перевод. Однако, как представляется, более практично обращаться к таким системам машинного перевода, как Google, бесплатно обеспечивающей беглость речи и скорость перевода «на основе использования искусственной нейронной сети» (Википедия). Кроме того Google Translate все время дорабатывается. Только что сообщалось, что он якобы уже получил, либо получает поддержку ИИ Gemini, что «позволит лучше передавать смысл фраз, включая идиомы, разговорные выражения и сленг, а также учитывать контекст, а не переводить текст дословно». (см. «Дзен»).

И, наконец, возможности современного машинного перевода многократно превосходят те возможности, что, впервые, официально были продемонстрированы еще в 1954. Современные «машинные» переводчики позволяют танзанийским госструктурам, информационным организациям, бизнесу и отдельным блогерам переводить на суахили тексты практически любой сложности (кроме художественных) с приличным качеством. Тем не менее, обязательным остается условие последующего редактирования, тем более что в «правильном» и «красивом» чисто ИИ-переводе на суахили даже местные специалисты не всегда сразу замечают встречающиеся ляпы и огрехи.

А то, что в начальный период своего применения переводческие машины были практически не способны качественно переводить художественные тексты, ярко показал поляк Станислав Лем в своем философско-футурологическом трактате «Сумма Технологий». (СССР.1968). Якобы машина выдала следующий «незабываемый» перевод: «Запах сильный, хоть мясо размякло». Оригинал же гласил: «Крепок дух, хоть немощна плоть».

Надо прямо сказать, что этот «сильный запах» преследовал машинный перевод десятилетиями, пока не появились продукты и инструменты на основе ИИ. Хотя уже к началу 70-х годов прошлого века существовало мнение, что до 70% научно - и военно-технических, строго юридических и прочих специальных текстов успешно переводилось машинами в соответствующих организациях ведущих стран того времени.

Когда я писал эту заметку, то решил все же проверить пример С.Лема, воспользовавшись Google-переводчиком. Получил вполне себе приличный вариант: ‘Roho ina nguvu, ingawa mwili ni dhaifu’ (Дух силен, хоть немощна плоть)

Уже в своих заметках №№ 7 и 8 (Mbinu Fulani za Kufundishia KMiswahili) я предлагал не забывать, что ИИ – не совсем интеллект. Ведь даже на суахили для термина ИИ мне известны три варианта: Akili Mnemba, Akili Unde (удивил словарь Glosbe дав вариант «неразвитый ум) и Akili Bandia , который строго говоря переводится как «ум искусственный, имитационный, поддельный».

При использовании продуктов ИИ следует помнить, что конкретный, рабочий инструмент с которым вы работаете – это, старого говоря, то, «что получено» в результате того, «что было загружено». А это может привести к некоторому «стопорению» и ненужному закреплению достигнутого уровня.

Тем временем, до сих пор будущее местных инновационных стартапов в Танзании пока продолжает оставаться в значительной степени лишь «многообещающим». Этим обстоятельством пользуются достаточно серьезные иностранные компании (прежде всего китайские и не только), «откликнувшиеся» на появившиеся ИКТ возможности, активно укрепляя и расширяя свое, хотя бы и виртуальное, присутствие в Танзании.

Предлагаемые большинством AI-инструментов переводы в очередной раз показывают, что пока ИИ-переводчики хотя и могут лихо, связно и даже красиво переводить с и на языки, но это относится главным образом к языкам, в которых уже давно и в полной мере все переведено, осмыслено и широко используется во всех сферах жизни. А вот когда такие инструменты начинают, занимаясь словотворчеством, особенно в африканских языках (включая суахили), то практически все они не всегда, скажем так, соответствуют выдвигаемым ими же собственным параметрам.

Размышляющий мужчина. Фото из библиотеки газеты TaifaLeo
Размышляющий мужчина. Фото из библиотеки газеты TaifaLeo

Рассмотрим варианты «машинных» переводчиков, которы предлагают иностранные компании, связанные с производством, реализацией и имплементацией ИКТ продуктов. При этом все они наперебой продвигают «доморощенные» программы перевода, реализуемые как в «мобильных» инструментах перевода, так и в собственных технических публикациях и рекламных материалах.

Показательным иллюстративным материалом может служить статья, которую представила на своем сайте известная и достаточно активная на международном рынке Wonderful PCB&PCBA — китайская компания, специализирующаяся на производстве «пустых» печатных плат (PCB), плат «в сборе» (PCBA), а также других электронных компонентов.

Статья, озаглавленная ‘Ubunifu na utengenezaji wa Mashine za Tafsiri za AI’ («Проектирование и производство машин для ИИ-перевода»), в ярко выраженной дидактической форме настоятельно призывает использовать возможности «машин-переводчиков на основе ИИ, которые помогают людям быстро и практически безошибочно говорить на разных языках в режиме реального времени».

Особо отмечается, что «инструменты перевода на основе ИИ экономят деньги. Они обеспечивают неизменно высокое качество перевода. Регулярные проверки обеспечивают исправную работу ваших устройств и помогают поддерживать высокое качество работы». При этом возможность «настройка систем перевода на основе ИИ позволяет адаптировать их к каждой конкретной задаче, что делает переводы более качественными и полезными». Авторы статьи особенно отмечают преимущества «перевода с использованием ИИ в реальном времени»:

- на многих производствах используются инструменты, обеспечивающие перевод в режиме реального времени, что помогает получать быстрые ответы и четкие указания, а это снижает количество ошибок и помогает быстрее завершать работу;

- перевод речи /беседы в реальном времени помогает сторонам однозначно понимать правила и инструкции.

- при таком переводе практически все знают, что делать, а это помогает избегать ошибки и задержки.

То есть, после начального ознакомления с рассматриваемой статьей, вполне может прийти на ум вывод о том, что для профессионалов языковедов и специалистов практиков появилась вероятность решения классических проблем переводоведения. Достаточно лишь воспользоваться возможностями «мобильных» машин для ИИ-перевода.

Так ли это, поможет определить простенький проверочный тест на применение «расширенного промпта», который каждый раз перед переводом прокручивает в своей голове профессионал переводчик, не вдаваясь в заумные ‘fancy definitions’. Я сознательно применил определение на ‘Kimombo’, чтобы не обижать добросовестных филологов и лингвистов. Итак, какие, например, «оценочные» возможности можно порекомендовать …:

Предмет перевода, – который на «бытовом уровне» - просто знание языка, умение его использовать при переводе, с учетом особенностей и закономерностей функционирования языков, при достижении эквивалентности текстов оригинала и перевода (транслята).

Тема перевода – это то, что предстоит переводить. Если в общем смысле, то это что-то научно-техническое, общественно-политическое, бытовое и т.п. Например, развитие ИКТ или разведение кур …

Стороны перевода – для практических целей крайне важно точно знать, кто представляет противоположную сторону перевода или на кого рассчитан результат перевода.

Время перевода – что касается времени перевода, то здесь перевод инструментами ИИ не имеет равных - перевод происходит практически мгновенно. Кроме того, оставив «по умолчанию» разграничение устного и письменного перевода, обратим внимание на такие аспекты, как перевод до, во время или после определенный событий, выполнения условий и т.п. Не забудем также о времени года и суток…

Отдав должное общепринятым понятиям переводоведения, можно напомнить и о таких немаловажных практических аспектах переводческой деятельности, как «участники» перевода (если «стороны» перевода – организации, то участники – живые люди и желательно старые знакомые). Не следует забывать и об «условиях» и «месте» перевода. Например, это может быть офис, конференц-зал, строй площадка, лобби отеля и т.д..

Важность соблюдения основных вышеперечисленных положений великолепно, с большим чувством юмора еще в 1957 году показал опять же Станислав Лем в своем удивительном рассказе «Вторжение с Альдебарана», когда оказавшиеся в польской глубинке негуманоидные пришельцы из созвездия Тельца пытались понять пьяного крестьянина, транслят гласил: "Предок по женской линии четвероногого млекопитающего, подвергнутый действию части четырехколесного экипажа в рамках религиозного обряда, основанного на..." (оригинал - А, мать вашу сучью, дышлом крещенную...)

Так вот, абсолютно точно, что в настоящее время все эти вопросы и проблемы хоть и решаются при использовании возможностей технологий ИИ, но при условии устного перевода. Особенно, когда вдруг выясняется, что на Занзибаре «местные разговаривают на своем африканском языке».

Далее статья на сайте Wonderful PCB&PCBA все же отмечает, что использование машин ИИ-переводчиков не избавляет от следующих «распространенных проблем» (так в тексте):

- неточность перевода, что приводит к пропуску сложных слов или грамматических конструкций. Отсюда возможны не только ошибки, но и пропуски текста;

- обязательность помощи человека для проверки и исправления важных переводов;

- использование ИИ для перевода по-новому ставит задачу безопасности переводимых данных, т.к. «конфиденциальная информация может быть использована для обучения других моделей, поэтому вы должны защитить её»;

- невыразительность текста перевода (я бы назвал это «склонностью транслята к канцеляризму»). Очевидная «простота» перевода может привести к утрате «истинного смысла». Небольшое замечание – хотя специалисты Wonderful PCB&PCBA и не касаются в прямой постановке этно-страноведческих проблем перевода, учитывающих культурные, исторические и языковые особенности, включая быт и традиции носителей языка суахили, тем не менее, указанные особенности реально проявились непосредственно в тексте этой статьи. Рассмотрим пример: Wafanye watafsiri na wachuuzi wasaini NDA kabla ya kuona taarifa za siri

Переводчики и поставщики должны подписывать соглашения о неразглашении информации, прежде чем они получат доступ к секретным данным.

Использование слова wachuuzi (розничные торговцы; разносчики), как «поставщики» является стилистической неточностью и указывает на слабую страноведческую подготовку.

Просмотрев статью еще раз, я отметил и другие шероховатости транслята, которые явно указывали на «английский субстрат». Например, в статье приводится очередной оптимистический пассаж: «Вы можете адаптировать системы машинного перевода на основе ИИ под свою отрасль. Вы поддерживаете точность и актуальность своих переводов по мере изменения вашего бизнеса». Затем следует пример якобы подтверждающий точность перевода:

Michezo. Hutafsiri maoni na miongozo, na kuongeza thamani kwa biashara yako.

Автотранспорт.Переводит отзывы и руководящие документы, принося пользу вашему бизнесу.

Понять, что слово Michezo (игры) в данном предложении должно означать Автотранспорт можно только, если принимать в расчет англоязычный исходник, с которого, скорее всего, машина и переводила. На такую возможность указывает и сомнительный вариант использования kwa в суахилийском переводе, где он явно замещает английский for.

Наконец, привожу пример маленькой грамматической неточности:

Термин Data Usalama, который, скорее всего, должен означать «Безопасность данных».

Даже только вышеуказанных примеров, причем из одного и того же текста, многовато для «эталонного» примера использования переводческих машин с использованием ИИ.

Считаю необходимым показать несколько примеров по-настоящему «удивительных» переводов, но уже из другой тематики. Вот «близкий» для меня пример. Просматривая открытый информационный материал Командования ВВС ОРТ, я наткнулся на фразу: ‘vikosi vya makombora matiifu ya kutungulia ndege’, что должна была означать «части и подразделения ЗУР». Однако английское сокращение ‘SAM’ (ЗУР) почету-то было переведено как ‘makombora matiifu‘ (где -tiifu - «послушный, покорный»), т.е. получались «послушные / покорные ракеты». Если бы ракеты так подчинялись бы на деле! Это был бы праздник для тех, кто их применяет: только подумал, а они уже летят куда надо!, т.к. «подвластны взгляду / мысли…».

Однако, при более внимательном рассмотрении «покорных ракет», достаточно легко проследить цепочку (не скажу, что логическую), скорее всего использованную при переводе. Как я уже отмечал, требовалось перевести английское сокращение SAM (surface-to-air missile - «зенитная управляемая ракета»), а «управляемый» - ‘guided’, означает, кроме всего прочего и «ведомый, подконтрольный; послушный». Вот тут и появляется -tiifu – «послушный, покорный».

В материале ‘Wakandarasi wa Ukarabati wa Nyumba’ (Georgestones.com) термин «генеральный подрядчик» (mkandarsi mkuu) был переведен как ‘mkandarasi wa jumla’– налицо буквальный перевод.

Теперь зададимся вопросом – а как обстоят дела с переводом с суахили на руксский. Я как-то раньше особо не обращал на это внимание, т.к. меня больше интересовали вопросы лексикографии вообще и образования терминов в частности. Однако для целей данной заметки я достаточно внимательно просмотрел результаты переводов при помощи Google-переводчика, как самого доступного и безотказного бесплатного инструмента мгновенного перевода.

Сразу хочу сказать, что предварительные результаты меня вполне порадовали. Для эксперимента я взял пару абзацев «типовой» статьи из Wikipedia, и получил интересный вариант.

-4

Представленный пример говорит сам за себя и практически не требует каких-либо особых пояснений. Точно такие же, либо подобные результаты (средняя колонка) пока дают многочисленные «доморощенные» переводческие инструменты (явно не относящиеся к Google) многочисленных средств массовой информации Танзании и Кении.

Но из этого не следует, что я склонен превозносить и как-то рекламировать Google-переводчик. Буквально небольшая проверка результатов переводов этого инструмента с суахили на русский сразу же показывает наличие неточностей и «шероховатостей».

Для иллюстрации я взял Google-перевод открытого информационного материала Командования ВМС ОРТ. Ниже приведены два варианта перевода, между которыми от одного до двух лет.

-5

Из приведенных выше вариантов перевода видно, что Goggle-переводчик не стоит на месте, а расширяет свои возможности осмысления большого контекста для его последующего перевода., что подтверждается нижеприведенными примерами.

-6

Что же касается «нежелания» Google-переводчика перевести должным образом слово kombania (рота), то это всего лишь «взбрык» Google. К сожалению, наличие подобных «взбрыков» у достаточно надежного инструмента бесплатного перевода носит вполне себе «системный» характер.

Я попытался сгруппировать неточности и «шероховатости», которые, на мой взгляд, допускает Google при переводе с суахили на русский, и которые, опять же, по моему мнению, можно отнести к «системным». Получились три очень разные по частотности группы.

Первая группа отражает, если хотите, «своеволие» Google как системы, для которой английский язык является основным, главным, прямо «светом в окошке». В результате достаточно часто Kiswahili переводится, как «английский язык».

Вторую группу объединяют многочисленные «взбрыки». Пример одного из них я уже привел (перевод kombania как компания). Теперь хотелось бы привести «взбрык так взбрык». Танзанийский блог Michuzi Blog опубликовал 2 мая 2024 материал под заголовком "Преимущества и недостатки ИИ широко обсуждаются во Всемирный день свободы СМИ» (‘Faida na Hasara za Akili Mnemba Kujadiliwa kwa Upana Maadhimisho ya Uhuru wa Vyombo vya Habari Duniani’. MICHUZI BLOG, May 02, 2024). В этом материале термин ‘Akiili Mnemba’ (ИИ) встречается 14 раз, из которых в 4 случаях мы читаем – «обезьяний разум». Вот так.

Третья группа представлена устойчивыми случаями, когда Google переводит скорее английский субстрат, чем сам суахилийский вариант текста.

-7

Очевидно, что в англоварианте данного предложения использовался термин ‘Army’ – «армия; сухопутные войска», который при переводе с английского языка на русский стал ‘Jeshi’ – «армия». А уже при переводе на русский язык, явно под влиянием англоварианта (‘Army’), вместо ‘Jeshi’ появились «сухопутные войска», это привело к расширение смысла, что в отдельных случаях можно рассматривать как искажение.

Перевод англосубстрата характерен для перевода на суахили установочных документов государственных и общественных структур Танзании. Поэтому бывает, что тексты на двух языках хоть чуть-чуть, да отличаются, правда только в деталях и «акцентах значения».