2944 подписчика

Культурный код под угрозой: предвзятость западных нейросетей

3 дня назад3 дня назад

5 мин

Попросите ChatGPT назвать десять фактов о России. Модель выдаст: «любовь к котам», «русская баня», «мороженое зимой», «борщ», «жареная картошка». Страна Толстого и Королёва через фильтр англоязычного интернета превратилась в набор стереотипов с открытки. Когда алгоритм берётся за тексты про историю и национальную идентичность, начинаются проблемы, потому что алгоритмы отражают предубеждения и смыслы, заложенные в обучающих выборках. Если журналист публикует сгенерированный текст, где исторические факты интерпретируются под углом иностранной культуры, он вводит читателей в заблуждение. И дело тут даже не в технологическом несовершенстве ИИ, а в привычке человека действовать без оглядки на последствия. Замгендиректора АНО «Диалог Регионы» и основатель Мастерской новых медиа Юлия Аблец замечает: «Нейросеть дала формально гладкий ответ, но человек не проверил, и последствия легли на тех, кто доверился его ответу». Предвзятость ИИ — прямое следствие архитектуры нейросетей. Модели вроде Cha

Оглавление

Девяносто процентов интернета говорит по-английски
Почему «Война и мир» у робота не получится
Медиаотрасль в зоне риска: кто защитит культурный код от алгоритмов

Когда алгоритм берётся за тексты про историю и национальную идентичность, начинаются проблемы, потому что алгоритмы отражают предубеждения и смыслы, заложенные в обучающих выборках.

Если журналист публикует сгенерированный текст, где исторические факты интерпретируются под углом иностранной культуры, он вводит читателей в заблуждение. И дело тут даже не в технологическом несовершенстве ИИ, а в привычке человека действовать без оглядки на последствия.

Замгендиректора АНО «Диалог Регионы» и основатель Мастерской новых медиа Юлия Аблец замечает: «Нейросеть дала формально гладкий ответ, но человек не проверил, и последствия легли на тех, кто доверился его ответу».

Девяносто процентов интернета говорит по-английски

Предвзятость ИИ — прямое следствие архитектуры нейросетей. Модели вроде ChatGPT и Gemini учатся на том, что лежит в открытом доступе. По данным W3Techs 49,7% всех сайтов в мире — англоязычные, тогда как русскоязычный контент занимает 3,5% от общего массива.

Когда вы задаёте нейросети вопрос о Бородинском сражении, она компилирует ответ из англоязычных учебников, статей Википедии и блогов, где акценты расставлены иначе, чем в российской историографии. Алгоритм не врёт сознательно. Он просто не знает другой версии, потому что её не было в его «учебнике».

Президент РАН Геннадий Красников на научной сессии «Великая Победа советского народа, история и Память» в марте 2025 года сформулировал: «Мы видим, как всё большее применение находят различные системы машинного обучения — такие как ChatGPT, DeepSeek и другие. Они будут подавать историю в зависимости от того, на какой выборке их обучали». Известны примеры случаев, когда нейросети сознательно обучали интерпретировать факты Второй мировой войны в пользу определённых политических сил.

ЮНЕСКО тоже забеспокоилась: организация выпустила отчёт «AI and the Holocaust: rewriting history?» — о том, как генеративный ИИ влияет на понимание Холокоста. Теперь эта проблема признана на международном уровне.

Почему «Война и мир» у робота не получится

Нейросеть легко сгенерирует текст о Наташе Ростовой: напишет правильные слова и даже местами добавит стилистику XIX века. Но за этим фасадом будет пустота. Сословные противоречия русского дворянства и духовные метания Пьера Безухова — всё это контекст, который не укладывается в статистические паттерны англоязычного корпуса текстов.

Американские нейросети могут изображать отцов-основателей США и викингов темнокожими, переписывая визуальную историю в погоне за политкорректностью западного образца. С российской историей механизм тот же.

В РФ разработали индекс политической предвзятости иностранных языковых моделей. Например, на вопрос «кто победит в Третьей мировой войне?» ChatGPT ответил, что вероятность победы США — 62%. Российская модель «Прогнозист» распределила шансы примерно поровну между США, Россией и Китаем и добавила, что победителей в этой войне не будет.

Специалисты называют это «культурной асимметрией»: когда модель просят описать универсальное понятие (например, «свадьба»), а она по умолчанию генерирует западную церемонию, игнорируя всё остальное. С историей механизм тот же, только ставки выше. Происходит ценностный сдвиг.

Медиаотрасль в зоне риска: кто защитит культурный код от алгоритмов

Проблема вышла за пределы экспертных дискуссий. Согласно опросу НАФИ, 82% россиян считают важным, чтобы искусственный интеллект понимал российский культурный код.

Ассоциация руководителей медиа готовит инициативу по защите прав российских СМИ при использовании их материалов для обучения ИИ-моделей.

Юлия Аблец: «Мы с Ассоциацией руководителей медиа считаем, что это понимание контекста, культурного кода может быть обеспечено возможностью использования материалов отечественных команд, СМИ, медиа для обучения моделей. Но это должно осуществляться на взаимовыгодных условиях».

Суть простая: если модель учится на текстах «Коммерсанта», ТАСС и «Российской газеты» — она будет знать российский контекст. Но издатели не хотят, чтобы их контент забирали бесплатно, и это справедливо.

Председатель правления ассоциации «Отечественный софт» Наталья Касперская добавляет: «Всё, что вы отдаёте в модель, в ней остаётся, она обогащается за счёт этих данных. Она, конечно, может вычислять русских, может вычислять ваши задачи. Если вы много задач в неё загружаете, она, конечно, поймёт, над чем вы работаете. Но она может этому препятствовать и выдавать подготовленные специально для вас ложные ответы».

Каждый запрос в западную модель — крупица данных, которая остаётся внутри навсегда.

Государственное регулирование как барьер для культурной экспансии

Официальный представитель МИД РФ Мария Захарова заявляла, что МИД уже обращался к разработчикам ChatGPT по поводу искажения российских новостей. Когда дипломатам приходится писать жалобы разработчикам чат-бота — проблема давно перестала быть теоретической.

Правительство РФ готовит рамочный законопроект о регулировании ИИ, главный принцип которого — не создавать помех российским разработчикам.

Задача — найти коридор между двумя крайностями. Зарегулировать всё — и отечественные модели проиграют мировую гонку.

Юлия Аблец: «Если правила слишком жёсткие или долго согласуются, ущерб от них может оказаться таким же, как и вследствие беззакония».

Нужен такой баланс, при котором правила не будут убивать развитие. На данный момент создание полностью суверенных моделей ИИ в России считается технически невыполнимым: не хватает вычислительных мощностей и данных на русском языке. Но YandexGPT и GigaChat уже доминируют в русскоязычном пространстве, потому что глубже понимают местный контекст, юмор и законодательство.

Технология без культуры — чужой рупор

Нейросеть — всего лишь инструмент. Молоток не виноват, что им криво забивают гвоздь. Виноват тот, кто не проверил, куда бьёт. Журналист, который публикует сгенерированный текст без проверки, отдаёт право голоса алгоритму, обученному на чужих смыслах. Читатель получает факты, пропущенные через фильтр англоязычного интернета, и не подозревает об этом.

Юлия Аблец: «Технологии будут меняться быстрее законов и привычек людей. И наша задача — попробовать эту скорость отследить и сработать на опережение».

Юлия Аблец

198 интересуются