Anthropic выпустила обновление своей флагманской модели искусственного интеллекта — Opus 4.8, которая заменит предыдущую версию 4.7. Новая модель предлагает более высокую скорость работы при снижении стоимости на 33%. Основной акцент в релизе сделан на улучшении безопасности и надёжности: компания заявила о «существенном» снижении уровня ошибок выравнивания (misalignment) по сравнению с Opus 4.7, приблизившись к показателям закрытой модели Mythos Preview. Opus 4.8 также показала улучшенные результаты в тестах на программирование, превзойдя предшественницу, но не достигнув уровня GPT-5.5 от OpenAI. Разработчики подчеркнули, что модель стала более «просоциальной» — например, лучше поддерживает автономию пользователя и действует в его интересах, хотя конкретные критерии таких улучшений остаются неясными. Anthropic традиционно уделяет особое внимание безопасности своих моделей. В предыдущей версии Opus 4.7 честность достигала 92%, а уровень галлюцинаций и склонности к лести был снижен.
Anthropic представила Opus 4.8: снижение ошибок выравнивания на уровне Mythos Preview
СегодняСегодня
1 мин