👹 «Никогда не говори про гоблинов»: история о том, как OpenAI потеряла контроль над собственными моделями
Где-то в публичном репозитории Codex CLI на GitHub лежит самая абсурдная инструкция, которую когда-либо писал многомиллиардный AI-лаб для своей модели. Дословно: «Никогда не говори про гоблинов, гремлинов, енотов, троллей, огров, голубей или других животных и существ, если это абсолютно и однозначно не относится к запросу пользователя». И для надёжности эту фразу там повторили четыре раза — на случай, если модель забудет. Это не мем. Это рабочая заплатка в продакшен-системе OpenAI. И за ней — одна из самых поучительных и одновременно смешных историй про обучение современных языковых моделей...
