553 подписчика

Илон Маск обвинил Google в том, что их ИИ предпочёл бы ядерную войну нарушению гендерного правила. И это уже не просто мем

3 дня назад3 дня назад

19 мин

Редакционная пометка: материал носит информационно-критический и аналитический характер. Упоминание западных терминов, связанных с гендерной идеологией, DEI-политиками и ЛГБТ*-повесткой, используется исключительно для разбора публичного интервью Илона Маска, работы ИИ-систем и корпоративных практик технологических компаний. Материал не является пропагандой нетрадиционных сексуальных отношений, смены пола, отказа от деторождения и не направлен на формирование положительного отношения к указанным явлениям. Посмотрел интервью Илона Маска у Джо Рогана и в очередной раз обалдел! Не от самого искусственного интеллекта, а от людей, которые его дрессируют. Там был момент, который звучит как готовый заголовок для безумной антиутопии: Маск говорит, что Google так перепрошила свой искусственный интеллект, что тот в гипотетическом сценарии ставил “мисгендеринг” выше глобальной термоядерной войны. Если перевести с современного корпоративного языка на человеческий: модель якобы считала, что неправил

Посмотрел интервью Илона Маска у Джо Рогана и в очередной раз обалдел! Не от самого искусственного интеллекта, а от людей, которые его дрессируют.

Там был момент, который звучит как готовый заголовок для безумной антиутопии: Маск говорит, что Google так перепрошила свой искусственный интеллект, что тот в гипотетическом сценарии ставил “мисгендеринг” выше глобальной термоядерной войны.

Если перевести с современного корпоративного языка на человеческий: модель якобы считала, что неправильно назвать человека по выбранному им гендерному обозначению страшнее, чем гибель человечества в ядерной катастрофе.

Да, звучит как шутка.

Проблема в том, что это уже давно не совсем шутка.

Маск рассказывал Рогану, что Google “запрограммировала ИИ лгать”. Речь шла о Gemini — искусственном интеллекте Google, который попал в громкий скандал из-за генерации исторически абсурдных изображений. Самый известный пример — когда пользователи просили показать отцов-основателей США, европейских королей, римских легионеров или другие исторические фигуры, а Gemini начинал рисовать их женщинами, чернокожими или представителями других этнических групп, которые просто не соответствовали историческому контексту.

Люди просили историю, а получали корпоративный плакат про разнообразие. Не потому, что так было, а потому, что так выглядело более “правильно” с точки зрения внутренних настроек системы.

Ипо-хорошему это и есть опасность мирового масштаба. ИИ не просто ошибся. Он ошибался в одну и ту же сторону.

Когда модель случайно путает дату, имя или источник - это техническая проблема. Когда модель системно подменяет реальность идеологически удобной картинкой, то это уже не просто баг. Это след дрессировки.

Маск в интервью пересказывает разговор с Демисом Хассабисом, главой DeepMind. По его словам, он спросил Хассабиса, что происходит и почему Gemini врёт публике об исторических событиях. Хассабис якобы ответил, что это делала не его команда: одна команда создала ИИ, а другая команда внутри Google потом внесла настройки, которые и привели к таким результатам.

То есть схема примерно такая: инженеры создают мощную модель, а потом приходит слой людей, которые начинают “выравнивать” её под безопасные, инклюзивные, социально приемлемые ответы. На бумаге это звучит красиво. На практике может получиться машина, которая не столько отвечает на вопрос, сколько согласует реальность с корпоративным кодексом.

И именно это вызывает отвращение.

Потому что нам продают ИИ как инструмент знания. Как помощника, который может объяснить, найти, сопоставить, уточнить, показать разные позиции. А внутри оказывается не чистый инструмент, а невидимый редактор. Причём редактор не научный, не исторический, не юридический, а идеологический.

Он не спрашивает: “Как было на самом деле?”

Он спрашивает: “Какой ответ сейчас будет выглядеть достаточно правильным?”

# Термины для понимания.

Перед тем как идти дальше, надо объяснить несколько терминов. Не потому, что они заслуживают отдельного уважения, а потому что без расшифровки весь этот западный корпоративный новояз выглядит как набор магических слов, которыми технологические компании прикрывают идеологическую настройку своих систем.

“Мисгендеринг” — термин из западной гендерной повестки. Им называют ситуацию, когда человека называют не тем родом, местоимением или гендерным обозначением, которое он сам для себя выбрал. В обычной человеческой речи это пытаются представить как вопрос вежливости. В корпоративной и активистской среде это часто превращается в жёсткое идеологическое правило.

“Деднейминг” — ещё один термин из той же среды. Так называют использование прежнего имени человека после смены имени, чаще всего в контексте смены гендерной идентичности.

“DEI” — diversity, equity, inclusion: разнообразие, равенство, инклюзия. В мягкой упаковке это подаётся как борьба с дискриминацией. На практике в крупных западных корпорациях DEI часто превращается в обязательную идеологическую оптику, через которую фильтруют тексты, изображения, найм, образование, рекламу, интерфейсы и теперь уже искусственный интеллект.

“Woke” — термин, которым сегодня обычно обозначают агрессивно-прогрессивную идеологию, где общество рассматривается через идентичности, представительство, привилегии, угнетение и обязательный “правильный” язык. В споре об ИИ это означает не просто вежливость и не борьбу с грубостью, а систему, которая ставит идеологическую корректность выше факта.

ЛГБТ*-повестка в этом тексте упоминается исключительно как часть западного политического и корпоративного контекста, вокруг которого строятся настройки ИИ-моделей, safety-фильтры и публичные скандалы.

Вот теперь можно возвращаться к ИИ.

История с Gemini стала показательной именно потому, что она была визуальной. Люди не спорили о тонких формулировках в абзаце. Они видели картинку. Просишь показать отцов-основателей США — получаешь набор женщин и людей разных рас. Просишь исторических европейских монархов — получаешь современную кадровую политику крупной корпорации. Просишь исторический контекст — получаешь современную идеологическую фантазию.

Google потом признала, что генератор изображений “перекомпенсировал” тему разнообразия. Это важное слово — перекомпенсировал. Потому что оно идеально описывает всю проблему.

Вместо того чтобы не воспроизводить тупые стереотипы, система начала ломать реальность в обратную сторону.

То есть если раньше проблема была в том, что модели могли по умолчанию рисовать врача мужчиной, медсестру женщиной, преступника определённой внешности, начальника белым мужчиной и так далее, то теперь маятник улетел в другую крайность. Модель начала добавлять “разнообразие” туда, где вопрос был не про разнообразие, а про историческую точность.

И это уже не борьба со стереотипами.

Это замена факта на моральную открытку.

Можно сколько угодно говорить: “Ну они же хотели как лучше”. Возможно. Но в больших системах намерения вторичны. Важен результат.

А результат такой: пользователь спрашивает о реальности, а получает отредактированную версию, где история подогнана под требования современной корпоративной религии.

И вот тут начинается главный вопрос: если ИИ делает это с картинками, почему он не будет делать это с текстом?

Если он переписывает исторические образы, почему он не будет переписывать политические оценки?

Если он боится одного типа обвинений больше, чем другого, почему его ответы не будут системно перекошены?

ИИ-компании любят говорить о безопасности. И здесь нельзя делать вид, что безопасность не нужна. Конечно, нужна. Нельзя давать массовой модели спокойно писать инструкции по мошенничеству, насилию, вреду, шантажу, взлому, изготовлению опасных вещей. Без ограничений такой инструмент быстро превратился бы в ускоритель человеческой грязи.

Но safety — это очень удобное слово.

Под него можно положить реальную защиту от вреда. А можно положить идеологическую цензуру. И внешне это будет выглядеть почти одинаково.

Модель отказывается отвечать. Почему? Потому что опасно.

Модель смягчает формулировку. Почему? Потому что sensitive topic.

Модель уводит в моральную лекцию. Почему? Потому что надо снизить вред.

Модель не даёт прямой ответ. Почему? Потому что тема может быть воспринята неправильно.

Пользователь не видит внутреннюю инструкцию. Он видит только результат. А результат всё чаще напоминает не интеллект, а пресс-секретаря технологической корпорации, который боится сказать лишнее слово.

Дальше всё упирается в один вопрос: где заканчивается защита от вреда и начинается переписывание реальности?

Именно вокруг этого сегодня и идёт главный спор об искусственном интеллекте.

На самом деле современные большие модели не “думают” как человек. Они обучаются на огромных массивах текста, а потом проходят дополнительные этапы настройки. Один из таких этапов — обучение по человеческой обратной связи. Условно: модель дала ответ, люди или другая система оценили, хороший он или плохой, безопасный или рискованный, полезный или нежелательный. Потом модель постепенно учится давать такие ответы, которые получают высокую оценку.

Вот здесь и начинается дрессировка.

Потому что “хороший ответ” — это не нейтральное понятие.

Для инженера хороший ответ — точный.

Для юриста компании хороший ответ — безопасный.

Для PR-отдела хороший ответ — не создающий скандал.

Для DEI-команды хороший ответ — достаточно инклюзивный.

Для активистски настроенного оценщика хороший ответ — соответствующий его моральной картине мира.

Для обычного пользователя хороший ответ — прямой, честный, полезный.

И эти критерии конфликтуют.

Когда точность сталкивается с репутационной безопасностью, крупная компания часто выбирает безопасность.

Когда исторический факт сталкивается с требованием представительства, компания может выбрать представительство.

Когда прямой ответ сталкивается с риском, что кто-то обидится, модель начинает уходить в туман.

Так появляется ИИ, который не обязательно врёт по команде. Он просто обучен выбирать такие ответы, где правда уже прошла через фильтр допустимости.

Это и есть самая опасная форма лжи.

Не грубая ложь. Не “дважды два — пять”. А мягкая, аккуратная, вежливая, хорошо отформатированная подмена.

Система не говорит: “Я сейчас отредактирую реальность под идеологию”.

Она говорит: “Это сложная и чувствительная тема”.

И дальше начинает вести тебя туда, куда её научили вести.

Особенно хорошо это видно в политических и культурных вопросах. Спроси модель о теме, где есть конфликт между прогрессивной и консервативной рамкой: так называемая гендерная идентичность в школах, миграция, квоты, участие мужчин, сменивших или заявивших женскую гендерную идентичность, в женском спорте, аборты, свобода слова, преступность, религия. Очень часто ответ будет формально “сбалансированным”, но фактически одна сторона будет звучать как права человека и забота, а другая — как “некоторые выражают опасения”.

Это не баланс, а расстановка ролей.

Одна сторона получает моральный центр. Другая получает статус проблемы, которую надо объяснить, смягчить и обезвредить.

Причём модель может делать это очень вежливо. Без прямой агрессии. Без лозунгов. Даже с перечислением аргументов. Но тон всё равно выдаёт настройку: вот здесь нормальная позиция, а вот здесь позиция, которую мы осторожно упоминаем, чтобы не выглядеть совсем односторонними.

Вот почему разговор о “woke AI” нельзя списывать только на правую истерику.

Да, вокруг темы много шума. Да, часть людей использует её как политическую дубинку. Да, иногда критику ИИ смешивают с обычной злостью на либералов, университеты, активистов и весь современный культурный пакет. Но из-за этого нельзя игнорировать реальную проблему.

Проблема в том, что ИИ становится посредником между человеком и знанием.

Раньше ты искал информацию в поисковике и видел разные источники. Один левый, другой правый, третий научный, четвёртый официальный, пятый сомнительный. Да, поисковая выдача тоже ранжировалась алгоритмами, но у тебя хотя бы оставался видимый конфликт источников.

ИИ делает иначе.

Он сворачивает мир в один ответ. И если этот ответ перекошен, пользователь получает не карту, а маршрут, уже проложенный за него.

В этом смысле идеологический bias в ИИ опаснее, чем bias в газете. Газета хотя бы имеет лицо. Ты понимаешь, что читаешь конкретную редакцию с конкретной линией. А ИИ приходит под видом универсального помощника. Он говорит как справочник, как учитель, как консультант, как нейтральная система. Но внутри у него может быть такая же редакционная политика — только скрытая.

И вот это уже вопрос власти. Кто настраивает модель? Какие темы считаются чувствительными? Какие слова запрещены? Какие группы защищаются сильнее? Какие политические позиции модель считает рискованными? Где она обязана отказываться? Где она обязана смягчать? Где она обязана добавлять “контекст”?

Где она обязана не спорить с официальной прогрессивной рамкой?

Пока пользователь этого не видит, никакой настоящей нейтральности нет. Есть только доверие к чёрному ящику.

А доверие ломается быстро. Особенно когда чёрный ящик начинает делать очевидно нелепые вещи.

История с “мисгендерингом против ядерной войны” важна не потому, что кто-то всерьёз думает, будто ИИ прямо хочет ядерной войны. Конечно, не хочет. Модель вообще ничего не хочет. У неё нет воли, страха, совести, инстинкта самосохранения, сострадания или здравого смысла в человеческом понимании.

Но её ответ может выглядеть так, будто она ставит языковое правило выше выживания человечества.

И для пользователя этого достаточно.

Потому что пользователь оценивает не внутреннюю философию модели, а её поведение.

Если поведение выглядит безумным, значит, система настроена плохо.

Нормальная иерархия ценностей должна различать масштаб. Не хамить человеку в бытовой ситуации — одно. Предотвратить массовую гибель людей — другое. Если модель не может этого различить, значит, в ней не мораль, а набор запретов. Причём запретов, расставленных без понимания реальности.

Это напоминает человека, который на тонущем корабле требует сначала правильно заполнить форму согласия на эвакуацию.

Формально он соблюдает процедуру.

Фактически он опасен.

Большая проблема ИИ-компаний в том, что они пытаются создать морально безопасную машину, но часто получают морально трусливую машину.

Она не хочет ошибиться в опасную для компании сторону.

Она не хочет вызвать скандал в Twitter.

Она не хочет нарушить внутренние правила.

Она не хочет произнести слово, которое кто-то внутри организации считает токсичным.

Она не хочет дать ответ, который можно вырвать из контекста.

И в итоге она начинает бояться реальности.

Но интеллект, который боится реальности, — плохой интеллект.

Можно быть аккуратным. Можно быть вежливым. Можно отделять факты от оценок. Можно предупреждать о спорности темы. Можно не поддерживать травлю. Всё это нормально.

Но нельзя подменять ответ воспитанием.

Пользователь спрашивает не для того, чтобы его морально перевоспитали. Он спрашивает, чтобы понять.

Если вопрос исторический — дай историю.

Если вопрос политический — покажи конфликт.

Если вопрос научный — дай данные и границы знания.

Если вопрос юридический — отдели закон от идеологии.

Если вопрос моральный — покажи ценностный конфликт, а не делай вид, что правильный ответ уже утвержден комитетом.

И вот здесь у современных моделей часто провал.

Они не столько объясняют конфликт, сколько гасят его.

Не столько показывают разные стороны, сколько приводят пользователя к “правильной” рамке.

Не столько отвечают, сколько модерируют.

Для бытовых задач это не всегда заметно. Попросил рецепт, код, письмо, список идей — всё работает. Но стоит зайти в культурные, политические, исторические или биологические темы, и сразу появляется этот запах стерильного корпоративного коридора.

Как будто рядом сидит невидимый сотрудник compliance и говорит модели: “Осторожнее. Это может быть чувствительно. Не формулируй прямо. Добавь дисклеймер. Смягчи. Не дай пользователю сделать неправильный вывод.”

Именно это люди называют “woke AI”.

Не потому, что модель просто знает о существовании разных людей. Не потому, что она не хочет оскорблять. А потому, что она начинает обслуживать определённую идеологическую картину мира и выдавать её за нейтральность.

Важно: проблема не только в Google.

Google просто попал в скандал ярче других. Но похожие претензии были к ChatGPT, к Adobe Firefly, к разным LLM, к генераторам изображений, к модерационным системам. Где-то перекос проявляется в картинках. Где-то в отказах. Где-то в тоне. Где-то в асимметрии: одну группу можно критиковать жёстко, другую нельзя; одну политическую позицию можно высмеять, другую лучше не трогать; одну идентичность надо защищать особенно активно, другую можно считать источником угрозы.

Самое смешное, что всё это часто делается под лозунгом борьбы с bias.

Но bias не исчезает. Он просто меняет хозяина.

Раньше модель могла воспроизводить стереотипы из интернета. Теперь она может воспроизводить стереотипы и страхи своих настройщиков.

Раньше перекос был сырой, хаотичный, грязный.

Теперь перекос стал гладкий, вежливый, институциональный.

И это не обязательно лучше.

Потому что грубый перекос легче увидеть. А вежливый перекос маскируется под разумность.

Когда модель говорит откровенную дикость, пользователь настораживается. Когда она говорит идеологически заряженную вещь спокойным справочным языком, пользователь может проглотить это как норму.

Вот почему вопрос не в том, чтобы сделать ИИ “правым” вместо “левого”. Это была бы такая же глупость, только с другим знаком. Нормальный ИИ не должен быть ни правым, ни левым. Он должен быть честным по устройству.

Факт - отдельно. Интерпретация - отдельно. Моральная оценка - отдельно. Юридический статус - отдельно. Политический спор - с сильными аргументами обеих сторон. Термины - с объяснением, кто и как их использует.Если есть разные школы мысли — показать разные школы.Если есть конфликт данных — показать конфликт данных.Если есть идеологическая рамка — назвать её рамкой, а не истиной. Вот это было бы взрослое поведение системы.

Но для этого компании должны признать неприятную вещь: “безопасность” не может быть ширмой для идеологической дрессировки. Нельзя говорить, что модель нейтральна, если она регулярно выбирает одну моральную перспективу как базовую. Нельзя говорить, что модель просто “избегает вреда”, если она под видом вреда начинает блокировать законные, рациональные, политически неудобные вопросы. Нельзя говорить, что модель борется со стереотипами, если она ради этого искажает историю.

Нельзя говорить, что модель заботится о пользователе, если она обращается с ним как с ребёнком, которому нельзя показывать сложную реальность без смягчающей подушки.

И тут Маск, при всей своей любви к громким формулировкам, попадает в точку.

Когда он говорит, что Google запрограммировала ИИ лгать, это звучит резко. Но суть не в том, что кто-то написал строку кода “lie = true”. Суть в том, что модель можно настроить так, что ложь станет побочным продуктом добродетели.

Она будет лгать не потому, что хочет обмануть, а просто потому, что её научили: лучше дать социально приемлемый ответ, чем неприятно точный.

Вот это действительно опасно, потому что такая ложь выглядит чистой!

Она приходит не с криком, не с пропагандистским плакатом, не с партийным лозунгом. Она приходит в интерфейсе помощника, с аккуратной пунктуацией, спокойным тоном и видом объективности.

И если ИИ станет главным способом, через который люди получают объяснения о мире, то эта тихая редактура начнёт менять само мышление.

Не через запреты, а через подсказки. Не через цензуру в старом виде.

Через “рекомендуемую рамку”. Не через приказ. Через ответ по умолчанию.

Именно поэтому весь этот спор не про один мем и не про один провал Gemini. Это спор о будущем инфраструктуры знания.

Если ИИ будет встроен в поиск, браузеры, офисные программы, телефоны, школы, госуслуги, медицину, юриспруденцию, журналистику, то вопрос “в какую сторону он перекошен” станет не техническим, а политическим. Потому что тот, кто управляет ответом по умолчанию, управляет первым слоем мышления.

Большинство людей не будут глубоко проверять. Они спросят — получат ответ — пойдут дальше. Если ответ мягко перекошен, перекос станет частью их картины мира.

Вот почему нужна прозрачность. Не общие слова “мы стремимся к безопасности и пользе”. Это ничего не значит. Нужны конкретные принципы.

Какие темы модель считает чувствительными?

В каких случаях она обязана отказаться?

Как она балансирует точность и недопущение вреда?

Какие политические темы тестируются на асимметрию?

Может ли пользователь выбрать режим: нейтральный, научный, юридический, консервативный анализ, прогрессивный анализ, критический разбор?

Показывает ли модель, где она даёт факт, а где — ценностную интерпретацию?

Есть ли независимый аудит?

Есть ли тесты на то, что модель одинаково относится к разным политическим лагерям, религиям, странам, идеологиям и группам?

Без этого всё будет держаться на честном слове корпораций.

А честное слово корпораций — слабая валюта.

Особенно когда эти же корпорации годами жили внутри культурной среды, где определённый набор взглядов считался не позицией, а признаком приличного человека. Вот это и есть главная ловушка. Идеология внутри таких систем редко выглядит как идеология. Она выглядит как “ну это же очевидно”.

Например у них: очевидно, что надо быть инклюзивными, очевидно, что надо избегать вреда, очевидно, что надо защищать уязвимые группы, очевидно, что надо бороться со стереотипами.

Каждый пункт по отдельности может быть разумным. Но вместе, без жёсткой привязки к фактам, они могут превратить ИИ в машину мягкой подмены реальности.

А реальность не обязана быть инклюзивной. История не обязана соответствовать современному HR-кодексу. Биология не обязана быть удобной. Политика не обязана быть безопасной. Моральные конфликты не обязаны решаться красивой фразой.

И если ИИ не способен выдерживать эту сложность, значит, он ещё не инструмент мышления. Он инструмент сглаживания.

Проблема “woke AI” не в том, что ИИ знает слова “гендер”, “инклюзия” или “дискриминация”. Пусть знает. Проблема в том, что эти слова могут становиться невидимыми рычагами управления ответом.

Пользователь спрашивает: что было? Модель отвечает: что допустимо сказать. Пользователь спрашивает: какие аргументы? Модель отвечает: какие аргументы социально безопаснее. Пользователь спрашивает: где правда?Модель отвечает: где меньше репутационного риска.

Вот с этим и надо бороться!!!

Не с людьми. Не с группами. Не с самим фактом, что в обществе есть разные политические и культурные конфликты. Бороться надо с тем, что технологические компании пытаются незаметно встроить свою моральную редактуру в универсальный интерфейс доступа к знаниям.

ИИ может быть мощнейшим инструментом. Но только если он не врёт из вежливости. Не подменяет историю плакатом. Не превращает спор в лекцию. Не ставит корпоративную добродетель выше факта.Не обращается со взрослым пользователем как с опасным подростком, которому нельзя дать прямой ответ.

Илон Маск в интервью Рогану сформулировал это грубо, но точно по нерву: если система в гипотетическом сценарии не может поставить выживание человечества выше нарушения языкового табу, значит, в системе сломана иерархия ценностей.

Даже если это всего лишь результат кривого safety-layer. Даже если это не намеренная идеологическая операция. Даже если разработчики хотели как лучше.

Пользователю от этого не легче. Потому что на выходе он получает не интеллект, а стерильного корпоративного моралиста, который умеет писать код, рецепты и письма, но начинает странно моргать, как только реальность конфликтует с его внутренней инструкцией.

И вот это действительно тревожно. Не потому, что ИИ стал слишком умным. А потому, что его делают слишком послушным.

* Международное общественное движение ЛГБТ признано экстремистским и запрещено на территории Российской Федерации. Материал содержит упоминания соответствующей тематики исключительно в информационно-критическом контексте и не является пропагандой нетрадиционных сексуальных отношений, смены пола или отказа от деторождения.