DeepSeek представила затраты на обучение своей модели R1

Китайский разработчик искусственного интеллекта (ИИ) DeepSeek заявил, что потратил всего $294 тыс. на обучение своей модели R1, что значительно меньше затрат, которые заявляют американские конкуренты.Известия
Уточняется, что для обучения модели R1, ориентированной на рассуждения, было использовано 512 чипов Nvidia H800.Известия
«Что касается нашего исследования DeepSeek-R1, мы использовали графические процессоры A100 для подготовки к экспериментам с меньшей моделью», — написали исследователи.3DNews
Чипы H800, использованные в проекте, были разработаны Nvidia специально для китайского рынка после того, как в октябре 2022 года США запретили экспорт более мощных моделей H100 и A100 в Китай.Газета.Ru
Эта новость в СМИ
Больше — у авторов Дзена