1064 подписчика

Вышел новый DeepSeek V4

ВчераВчера

1 мин

Сегодня китайская лаборатория, которая год назад обрушила акции NVIDIA, представила сразу две модели: DeepSeek-V4-Pro (1.6T параметров, 49B активных) и DeepSeek-V4-Flash (284B параметров, 13B активных). Обе — Mixture-of-Experts, обе с контекстным окном в 1 миллион токенов, обе под лицензией Apache 2.0 с открытыми весами на Hugging Face. Главная инновация — гибридная архитектура внимания, которую они назвали Compressed Sparse Attention + Heavily Compressed Attention. На практике это означает, что при контексте в 1M токенов V4-Pro требует лишь 27% FLOPs и 10% KV-кэша по сравнению с предыдущей V3.2. По бенчмаркам V4-Pro бьёт все существующие open-source модели и вплотную подбирается к закрытым лидерам. ▫️На Codeforces модель набирает 3206 — это выше GPT-5.4. ▫️На SWE-Verified (реальные баги на GitHub) — 80.6, практически наравне с Claude Opus 4.6. ▫️На математических бенчмарках вроде IMOAnswerBench — 89.8, уступая только GPT-5.4. ▫️При этом в задачах на общие знания модель пока отстаёт

Обе — Mixture-of-Experts, обе с контекстным окном в 1 миллион токенов, обе под лицензией Apache 2.0 с открытыми весами на Hugging Face.

Главная инновация — гибридная архитектура внимания, которую они назвали Compressed Sparse Attention + Heavily Compressed Attention.

На практике это означает, что при контексте в 1M токенов V4-Pro требует лишь 27% FLOPs и 10% KV-кэша по сравнению с предыдущей V3.2.

По бенчмаркам V4-Pro бьёт все существующие open-source модели и вплотную подбирается к закрытым лидерам.

▫️На Codeforces модель набирает 3206 — это выше GPT-5.4.

▫️На SWE-Verified (реальные баги на GitHub) — 80.6, практически наравне с Claude Opus 4.6.

▫️На математических бенчмарках вроде IMOAnswerBench — 89.8, уступая только GPT-5.4.

▫️При этом в задачах на общие знания модель пока отстаёт от Gemini-3.1-Pro, и DeepSeek честно это признаёт.

Цены в разы ниже западных:

🔻V4-Flash: $0.14 за миллион входных токенов, $0.28 за выходные.

🔻V4-Pro: $1.74 / $3.48.

Для сравнения Claude Opus 4.6 стоит $5 за 1 млн входных токенов и $25 за 1 млн выходных токенов по стандартному API-тарифу.

Модель поддерживает три режима рассуждений: Non-think, Think High и Think Max.

Уже интегрирована с OpenClaw и OpenCode для агентного кодинга.

Финансовые мошенничества

343 тыс интересуются