Успех мощной модели искусственного интеллекта R1 от DeepSeek, выход которой в январе обвалил фондовый рынок США, не был обусловлен обучением на результатах работы моделей-конкурентов, заявила компания в журнале Nature. R1 разработана для решения задач, требующих рассуждений, таких как математика и программирование, и позиционируется как более дешевый аналог американских ИИ-инструментов. Модель с открытыми весами, R1 доступна для скачивания любым желающим, и в этом качестве заняла заслуженное первое место по популярности на платформе Hugging Face с 10,9 миллионами загрузок. В статье описаны усовершенствования стандартной большой языковой модели для решения задач, требующих рассуждений. В дополнительных материалах впервые раскрыта стоимость обучения R1 — всего 294 000 долларов США. Это дополнительные расходы к шести миллионам, потраченным на разработку базовой LLM, но они не идут ни в какое сравнение с астрономическими суммами, которые вкладывают конкуренты. DeepSeek сообщила также, что