Китайская лаборатория DeepSeek наконец-то представила свой первый крупный релиз с начала 2025 года. DeepSeek V4 — это не просто обновление, а две флагманские LLM с открытым исходным кодом и открытыми весами, которые компания называет «почти на передовой, но за небольшую долю цены». Модели уже доступны в веб-версии и по API, а их вес можно скачать на Hugging Face. 🔹 DeepSeek-V4-Pro — флагманский вариант с 1,6 трлн параметров (49 млрд активных на токен). Он превосходит все текущие открытые модели в математике, STEM и кодинге, а по мировым знаниям уступает только Gemini-3.1-Pro. Его производительность в решении кодовых задач на Codeforces достигает рейтинга 3206, что значительно выше среднего показателя в 1500 у человека. «Производительность V4-Pro сопоставима с лучшими в мире закрытыми моделями», — отмечают в компании. 🔹 DeepSeek-V4-Flash — компактная версия с 284 млрд параметров (13 млрд активных). Она сохраняет возможности рассуждения почти на уровне Pro-версии, но отличается меньшим
DeepSeek V4 наконец-то вышла: 1,6 трлн параметров, 1 млн токенов и открытые веса 🐳
24 апреля24 апр
11
2 мин