Anthropic выпустила Opus 4.8 — обновление, которое не выглядит революционным, но заметно подчищает углы и добавляет несколько полезных функций. Главная перемена — модель стала в четыре раза реже пропускать баги в собственном коде. Раньше Opus мог «не заметить» ошибку и бодро сообщить об успехе, теперь с этим стало строже. Важное направление — алайнмент. Команда отмечает, что Opus 4.8 показывает новые максимумы по просоциальным чертам: поддержка автономии пользователя и действия в его интересах теперь реализованы лучше. Это не просто слова — модель действительно стала аккуратнее в сложных ситуациях. На бенчмарках тоже есть сдвиг. На Online-Mind2Web (тест для браузерных агентов) Opus 4.8 набирает 84% — ощутимый рост по сравнению с предыдущей версией и даже с GPT-5.5. На Legal Agent Benchmark — первая модель, которая преодолела 10% по строгому all-pass стандарту. Остальные показатели тоже немного выросли. Цены остались прежними, fast-режим стоит вдвое дороже обычного. В целом, Opus 4.8 —