DeepSeek V4 вот-вот выйдет. Это первая крупная модель компании с января 2025 года, когда представили R1. Релиз запланирован на этой неделе, к парламентским заседаниям в Китае 4 марта. Представьте: вы программист, мучаетесь с огромным кодом репозитория. V4 запоминает миллион токенов, видит связи и предлагает готовое решение. Не фантазия — реальные тесты обещают это. Модель построена на архитектуре Mixture-of-Experts (MoE). Активирует только нужные «эксперты» из сотен миллиардов параметров. Полная версия — около 600B или даже 1 трлн параметров. Легкие варианты: 7B, 33B или V4 Lite на 200B. Запускайте на домашнем ПК с мощной видеокартой, без серверов. Не ждали мультимодальности? V4 генерирует текст, изображения и видео нативно. С первого этапа обучения. Конкурирует с американскими гигантами. DeepSeek обходит санкции. Обучили на чипах Huawei и Cambricon, без Nvidia или AMD. Ранние попытки с Huawei шли туго, но оптимизировали. Теперь модель готова для китайского железа. Слухи расходятся: кт
DeepSeek V4: новая мультимодальная модель на подходе
3 марта3 мар
1
2 мин