Представьте себе мир, где лидерство в искусственном интеллекте переходит от американских гигантов к китайским инноваторам. Именно это и произошло, когда Джим Фан, старший инженер по исследованиям NVIDIA, публично признал превосходство китайской модели DeepSeek R1. Его слова не просто комплимент — это сигнал о смене парадигмы в мире ИИ. DeepSeek R1 использует метод «холодного старта», основанный на чистом обучении с подкреплением. Это напоминает прорыв AlphaZero, которая с нуля освоила Go, сёги и шахмат. Но DeepSeek идет дальше, демонстрируя, что даже без начальных данных можно достичь невероятных результатов. В феврале 2024 года DeepSeek представил алгоритм GRPO, который убирает критическую сеть из PPO и использует среднее вознаграждение от множества образцов. Это не только снижает использование памяти, но и открывает новые горизонты для масштабирования моделей. Одним из самых удивительных открытий стало эмергентное свойство модели: время «размышления» DeepSeek R1 стабильно увеличивает
Китайский ИИ DeepSeek R1 шокировал мир: NVIDIA признала его превосходство в открытых технологиях
16 февраля 202516 фев 2025
3
2 мин