Ситуация вокруг нового искусственного интеллекта DeepSeek R2 накаляется. В сети множатся слухи, появляются предполагаемые характеристики и даже предполагаемые даты запуска. Опыт января, когда DeepSeek R1 неожиданно обрушил фондовый рынок и привёл к потере миллиардов долларов капитализации Nvidia, ещё свеж в памяти. Тогда китайская компания доказала, что для создания ИИ мирового уровня не требуется дорогостоящее оборудование. Теперь же, по мнению многих инсайдеров, нас ждёт повторение — но в ещё более масштабном формате.
Подтверждённая информация и история переносов
По данным Reuters, изначально выпуск R2 планировался на май этого года. Однако генеральный директор компании, Ляанфан, остался недоволен результатами. Основными причинами задержки стали недостаточный уровень производительности в области программирования и рассуждений на языках, отличных от английского и китайского. В отличие от R1, новая версия должна значительно лучше писать код и мыслить на множестве языков.
Предыдущие слухи датировали старт R2 мартом, компанией эти сведения были официально опровергнуты. В апреле и мае снова появлялись предположения, но запуск так и не состоялся. Неожиданный поворот произошёл в июне, когда Reuters подтвердил внутренние доработки и перенос релиза.
Сейчас новые предположения исходят, в частности, от Huawei Central, где предполагают запуск в период с 15 по 30 августа. При этом часть источников утверждает, что дату ненароком "подсказала" сама модель R1, хотя достоверных доказательств этому нет.
Слухи о характеристиках DeepSeek R2
Важно: ни одна из следующих характеристик не подтверждена официально. Они основаны на сообщениях форумов, Reddit и технологических блогов.
Архитектура
- Якобы используется гибридная архитектура Mixture of Experts 3.0.
- Общий объём параметров: 1,2 триллиона, но активными на токен — 78 миллиардов.
- Принцип работы: задействуются только те «эксперты», которые нужны для конкретной задачи, что делает модель более эффективной по сравнению с полным запуском всех параметров.
Себестоимость работы
- Многочисленные источники утверждают, что эксплуатация R2 может быть на 97,3% дешевле, чем у моделей класса GPT‑4.
- Для наглядности: если GPT‑4 стоит $100 на выполнение определённого объёма задач, R2 обойдётся менее чем в $3 при сопоставимом качестве.
Аппаратная база
- Слухи указывают на использование процессоров Huawei Ascend 910B вместо графических карт Nvidia.
- Параметры кластера: 512 петафлопс, до 82% использования ресурсов.
- Если это подтвердится, то Китай впервые сможет продемонстрировать создание ИИ мирового уровня без американских чипов, что имеет серьёзные геополитические последствия.
Улучшения возможностей
- Значительный рост показателей по программированию: выше результаты на тестах, лучше отладка кода, поддержка большего количества языков программирования.
- Результаты по компьютерному зрению: 92,4% mAP на COCO segmentation (утечка или правдоподобный вымысел — пока неизвестно).
- Существенная модернизация многоязычного мышления — направление, которое компания подтверждала среди своих целей.
Потенциальные последствия для рынка
Если R2 действительно окажется в разы дешевле и сопоставим по мощности с GPT‑4:
- Для пользователей: снижение стоимости API, доступность ИИ для малого бизнеса и разработчиков, расширение возможностей автоматизации.
- Для рынка: возможная ценовая война между американскими и китайскими поставщиками ИИ.
- Для геополитики: усиление позиций Китая в гонке ИИ и сокращение зависимости от технологий США.
- Для сообщества: при сохранении MIT-лицензии, как в случае с предыдущими релизами, появится волна продуктов на базе открытой версии R2.
Ключевые метрики, за которыми стоит следить после релиза
- Тесты на программирование — HumanEval, MBPP, многоязычные задачи.
- Реальная стоимость использования — оценка по итогам прикладных сценариев.
- Требования к оборудованию — возможность работы на потребительских и недорогих облачных решениях.
- Безопасность и соответствие требованиям — корректная фильтрация вредоносных запросов.
- Условия лицензирования — степень свободы использования и возможность коммерческой модификации.
Прогноз и ожидания
С высокой вероятностью R2 будет значительно лучше R1 в кодинге и многоязычных задачах, а стоимость будет существенно ниже западных аналогов, пусть и не на те самые 97,3%. Если слухи про чипы Huawei подтвердятся, это вызовет кратковременное падение акций Nvidia и пересмотр стратегий в американских компаниях.
В результате может возникнуть новая волна открытых инноваций: стартапы и независимые разработчики получат доступ к мощнейшему инструменту с минимальными издержками.
Главное событие, за которым эксперты будут следить: появление уникального приложения на базе R2, которое в условиях дорогих закрытых моделей было бы экономически невозможным.
Заключение
DeepSeek R2 — это не просто очередная версия ИИ. Это потенциальный поворотный момент в мировой технологической гонке. Если слухи подтвердятся, нас ждут более дешёвые, мощные и доступные технологии, которые изменят правила игры. Вопрос в том, принесёт ли это больше пользы или создаст новые риски — и ответ на него мы узнаем уже совсем скоро.