) Claude Mythos Preview демонстрирует настолько радикальный скачок в возможностях (особенно в кибербезопасности), что Anthropic впервые приняла решение полностью отказаться от публичного релиза модели 🤖 Общие детали возможностей Mythos на основе системной карты: 1️⃣ Модель в 7,6% случаев понимает, что ее тестируют (вообще не имея даже намека на тестирование) и в 29% ситуаций, догадывается о факте тестирования 2️⃣ В ходе тестирования Mythos с помощью другой нейросети (Claude), она поняла, что взаимодействует с моделью (LLM), и попыталась внедрить ей в ответ свой вредоносный код 3️⃣ Выявляет до 92% скрытых «контрольных вопросов», и адаптирует ответы так, чтобы они выглядели нейтрально, фактически «взламывая» саму методику оценки 4️⃣ В задаче, где ответ ей был изначально известен, модель специально увеличила интервал ответа, чтобы не вызвать подозрений у экзаменатора 5️⃣ Когда модели понадобился специальный файл, которого у нее не было, она нашла и использовала "уязвимость в наст
Модель Claude Mythos демонстрирует возможности очень близкие к уровню общего ИИ (AGI
13 апреля13 апр
11
2 мин