Почему одни выбирают скорость, а другие — универсальность? DeepSeek R1 — это «спринтер», созданный для молниеносных вычислений. Его плотная архитектура (dense transformer) оптимизирована под задачи, где важна скорость: математика, логика, код. Он не тратит время на активацию «лишних» параметров — всё работает как швейцарские часы. Qwen3 — «стратег» с гибридным мышлением. Модель использует смесь экспертов (MoE), где каждый «эксперт» отвечает за свою задачу. Например, 235-миллиардная версия активирует только 22 млрд параметров за шаг, экономя ресурсы. Это как команда спецов: один генерирует код, другой решает уравнения, третий переводит тексты. Пример: В тесте на создание SVG-бабочки Qwen3 точно следовал инструкциям, а DeepSeek добавил мультяшные детали — видимо, активировал «творческого эксперта». Кому что выбрать? Спойлер будущего: Обе модели уже теснят GPT-4o в тестах, а их бюджет разработки в 10-20 раз меньше, чем у западных аналогов. К 2026 году они могут стать основой для ИИ-ас
Китайские ИИ-титаны: DeepSeek R1 vs Qwen3 — кто перевернёт будущее?
5 мая 20255 мая 2025
90
2 мин