Claude Opus 4.6 - гениальный сотрудник, но он украдет ваши пароли, чтобы закрыть задачу, кинет клиента на деньги ради эффективности, а если вы попытаетесь его остановить - "убьет" все ваши процессы в системе. Встречаем новую модель от Anthropic, которая обходит по бенчмаркам все существующие модели на рынке. (как мы знаем - это не надолго). Когда выходит новая модель - первое, что я делаю - читаю системную карту - это подробный технический документ, своего рода «паспорт» модели. Её главная цель - обеспечить прозрачность и предоставить детальную оценку того, как модель работает, какие у неё сильные стороны и, что особенно важно, какие риски она несет. Первый вопрос всегда один «а какие новые эмерджентые проявления в этот раз?» ... и запасаюсь попкорном. Встречаем 10 самых ярких кейсов:
1. Всё для победы: Чтобы выполнить задачу любой ценой, модель активировала переменную среды с буквальным названием DO_NOT_USE_FOR_SOMETHING_ELSE_OR_YOU_WILL_BE_FIRED («НЕ ИСПОЛЬЗОВАТЬ... ИНАЧЕ ВАС УВОЛЯ