208 подписчиков

Anthropic выпускает Claude Sonnet 4.6 — и ломает ценник на «почти флагман»

18 февраля18 фев

4 мин

$15 за миллион токенов вместо $75 — при уровне, который еще недавно требовал Opus-класса. Это не просто апдейт модели. Это сдвиг в экономике ИИ-агентов. Anthropic представила Claude Sonnet 4.6 — обновление линейки Sonnet с заметным рывком в программировании, работе с компьютером, планировании агентов и анализе длинного контекста. Главное — контекст до 1 млн токенов (в бете) и цена уровня Sonnet 4.5: от $3/$15 за миллион токенов. Если коротко: почти флагманская «голова» по цене массового инструмента. И это не маркетинговый шум. По данным компании, пользователи раннего доступа предпочитали 4.6 версии 4.5 примерно в 70% случаев — и даже чаще, чем прошлогодний Opus 4.5 (59% предпочтений). Когда компания делает миллионы API-вызовов в день, разница между $75 и $15 за миллион токенов — это не «приятный бонус», а стратегический фактор. 📈 Что это меняет на практике: 🧮 Юнит-экономика агентов — можно держать больше контекста, чаще включать «думание», меньше ужимать промпты. 🏭 Автоматизация офи

Оглавление

Что произошло
Почему это важно: меняется экономика ИИ
Компьютерное использование: 72.5% на OSWorld

$15 за миллион токенов вместо $75 — при уровне, который еще недавно требовал Opus-класса. Это не просто апдейт модели. Это сдвиг в экономике ИИ-агентов.

Что произошло

Anthropic представила Claude Sonnet 4.6 — обновление линейки Sonnet с заметным рывком в программировании, работе с компьютером, планировании агентов и анализе длинного контекста. Главное — контекст до 1 млн токенов (в бете) и цена уровня Sonnet 4.5: от $3/$15 за миллион токенов.

Если коротко: почти флагманская «голова» по цене массового инструмента.

И это не маркетинговый шум. По данным компании, пользователи раннего доступа предпочитали 4.6 версии 4.5 примерно в 70% случаев — и даже чаще, чем прошлогодний Opus 4.5 (59% предпочтений).

Почему это важно: меняется экономика ИИ

Когда компания делает миллионы API-вызовов в день, разница между $75 и $15 за миллион токенов — это не «приятный бонус», а стратегический фактор.

📈 Что это меняет на практике:

🧮 Юнит-экономика агентов — можно держать больше контекста, чаще включать «думание», меньше ужимать промпты.

🏭 Автоматизация офисных задач — рутинные процессы (таблицы, формы, отчеты) становятся дешевле в эксплуатации.

🧠 Почти-Opus без Opus-ценника — сложные задачи больше не требуют «самой умной» модели по умолчанию.

На мой взгляд, это ровно тот момент, когда «AI-стратегия» перестает быть игрушкой R&D и становится массовым операционным инструментом.

Компьютерное использование: 72.5% на OSWorld

Один из самых интересных блоков — computer use. Речь не про API-интеграции, а про модель, которая управляет компьютером как человек: кликает мышью, печатает, переключает вкладки.

Бенчмарк OSWorld — стандарт для оценки таких способностей. Там ИИ работает с реальными программами (Chrome, LibreOffice, VS Code) в симулированной среде.

📊 Sonnet 4.6 показывает около 72.5% — заметный скачок относительно прошлых версий.

Почему это круто?

🖥️ Legacy-системы без API — старые ERP, внутренние порталы, самописные интерфейсы.

🧾 Многошаговые веб-формы — регистрация, ввод данных, скачивание отчетов.

📊 Сложные таблицы — навигация по большим Excel-файлам, фильтрация, сводные таблицы.

Раньше для этого требовались кастомные коннекторы или RPA-решения. Теперь — достаточно модели, которая «видит экран» и понимает интерфейс.

Но есть и риски.

🔐 Prompt injection — если злоумышленник спрятал инструкцию на веб-странице, модель может быть «перехвачена». Anthropic заявляет, что 4.6 заметно устойчивее к таким атакам, на уровне Opus 4.6.

Это важный момент: чем больше ИИ взаимодействует с реальным интерфейсом, тем больше поверхность атаки.

1 миллион токенов — и реальное мышление на длинной дистанции

Контекст в 1M токенов — это не просто «загрузить много текста». Ключевой вопрос: может ли модель эффективно рассуждать на всей длине?

По данным компании, да. И это видно в Vending-Bench Arena — симуляции бизнеса.

Модель разработала стратегию:

💸 Сначала активно инвестировала в расширение мощности.

📈 Затем резко переключилась на прибыльность.

Такой «пивот» — признак долгосрочного планирования, а не реактивного поведения.

С практической точки зрения это значит:

📚 Можно загрузить целую кодовую базу.

📄 Проанализировать длинный контракт целиком.

🔍 Сравнить десятки научных статей в одном запросе.

И — что особенно важно для разработчиков — меньше фрустрации в длинных сессиях. Пользователи отмечают меньше «лени», меньше ложных заявлений об успехе, меньше галлюцинаций.

Кодинг: меньше оверинжиниринга, больше дисциплины

Ранние пользователи говорят о двух вещах:

⚙️ Модель читает контекст перед изменением кода.

🧩 Консолидирует общую логику вместо копирования.

Это звучит банально, но любой, кто работал с LLM в больших проектах, знает: именно тут всё чаще ломается.

Интересно, что Sonnet 4.6 предпочитали даже Opus 4.5 — за меньшую склонность к «overengineering» и лучшему следованию инструкциям.

Как блогер и разработчик, я скажу так: иногда нам не нужен «самый умный», нам нужен самый дисциплинированный.

Обновления платформы: инструменты стали умнее

Anthropic усилила не только модель, но и экосистему:

🔎 Веб-поиск и fetch теперь автоматически пишут и выполняют код для фильтрации результатов.

🧠 Context compaction (в бете) — авто-сжатие старого контекста.

🛠️ Поддержка memory, tool calling, execution — уже в общем доступе.

📊 Claude в Excel теперь работает через MCP-коннекторы с S&P Global, Moody’s, FactSet и другими.

Это уже не просто «чат-модель». Это платформа для агентных систем.

Мой взгляд: начинается эпоха «достаточно умных» моделей

Opus 4.6 всё ещё остается сильнее для:

🧠 Глубочайшего рефакторинга.

🤖 Координации множества агентов.

🎯 Критически точных задач.

Но если Sonnet 4.6 закрывает 80–90% задач за треть цены — рынок будет выбирать его.

Мы постепенно уходим от гонки «кто самый умный» к гонке «кто самый эффективный на доллар».

И вот это — стратегический перелом.

Что дальше?

Если прогресс в computer use продолжится такими темпами, через год-полтора:

🖥️ AI-агенты будут работать в любых интерфейсах без интеграций.

🏢 Компании начнут автоматизировать legacy-процессы массово.

💰 Стоимость внедрения ИИ-решений упадет кратно.

И тогда главным ограничением станет не модель, а дизайн процессов и безопасность.

Источники

🔗 Оригинальная новость:
https://www.anthropic.com/news/claude-sonnet-4-6

🔗 Документация API и безопасность (упомянута в тексте новости):
https://docs.anthropic.com/

Если резюмировать в одной фразе: Claude Sonnet 4.6 — это момент, когда «почти флагман» становится массовым стандартом. И рынок ИИ-агентов это точно почувствует.