Найти в Дзене
Герман Геншин

У ChatGPT появился новый соперник: знакомьтесь с DeepSeek

Китайский стартап DeepSeek впечатлил крупнейших игроков Силиконовой долины своим новым AI-чатботом, который соперничает по производительности с ChatGPT от OpenAI, при этом его разработка обошлась значительно дешевле. На момент написания статьи DeepSeek обошел ChatGPT в App Store Apple, став самым скачиваемым бесплатным приложением в США, Великобритании, Китае и ряде других стран. Приложение работает как обычный чатбот: вы вводите запрос, и его модель с открытым исходным кодом генерирует ответ. Основная модель DeepSeek-V3 имеет 671 миллиард параметров, что позволяет приложению "думать", прежде чем приступить к решению задачи. В отличие от модели OpenAI, работающей исключительно на собственных серверах, DeepSeek может функционировать локально на мощных компьютерах и многих серверах с растущими возможностями GPU. Компания утверждает, что ее модель соответствует модели OpenAI по определенным критериям. В отличие от многих других AI-чатботов, DeepSeek также открыто демонстрирует свою логик

Китайский стартап DeepSeek впечатлил крупнейших игроков Силиконовой долины своим новым AI-чатботом, который соперничает по производительности с ChatGPT от OpenAI, при этом его разработка обошлась значительно дешевле.

На момент написания статьи DeepSeek обошел ChatGPT в App Store Apple, став самым скачиваемым бесплатным приложением в США, Великобритании, Китае и ряде других стран. Приложение работает как обычный чатбот: вы вводите запрос, и его модель с открытым исходным кодом генерирует ответ. Основная модель DeepSeek-V3 имеет 671 миллиард параметров, что позволяет приложению "думать", прежде чем приступить к решению задачи.

В отличие от модели OpenAI, работающей исключительно на собственных серверах, DeepSeek может функционировать локально на мощных компьютерах и многих серверах с растущими возможностями GPU. Компания утверждает, что ее модель соответствует модели OpenAI по определенным критериям. В отличие от многих других AI-чатботов, DeepSeek также открыто демонстрирует свою логику и объясняет, как пришел к данному ответу. Однако, как китайское приложение, DeepSeek цензурирует некоторые темы, такие как события на площади Тяньаньмэнь.

Приложение, выпущенное 20 января, также доступно в Google Play Store. Внезапная популярность DeepSeek связана с его способностью соперничать либо превосходить уже существующие AI-модели. Его исследовательская работа, опубликованная в понедельник, раскрывает, насколько экономически эффективным является обучение DeepSeek-V3.

-2

Хотя их утверждения еще не проверены, DeepSeek, по всей видимости, использовал всего 2048 специализированных чипов Nvidia H800 для обучения R1, в то время как для подготовки ведущих моделей OpenAI потребовалось более 16 000 чипов Nvidia. DeepSeek заявляет, что резкое сокращение числа современных GPU, необходимых для обучения AI, позволило потратить всего 5,6 миллиона долларов на обучение R1. В противоположность этому, OpenAI потратил больше 100 миллионов долларов на обучение своей модели GPT-4 сопоставимого размера. Однако компания не обнародовала данные о потреблении энергии DeepSeek по сравнению с конкурентами.

R1 сама по себе основана на большой языковой модели (LLM) DeepSeek V3, которая, по словам компании, соответствует GPT-4 и Claude 3.5 Sonnet от Anthropic. Достижение DeepSeek особенно впечатляет на фоне введенных правительством США торговых санкций против современных чипов Nvidia, используемых для AI-обучения. Противостояние крупнейших игроков AI, таких как Nvidia, OpenAI, Meta и Microsoft, которые тратят миллиарды на свои центры обработки данных для AI, вероятно, вызовет много заголовков на этой неделе, ставящих под сомнение лидерство Америки в области AI.

Будет интересно увидеть, как прорыв DeepSeek повлияет на миллиардный проект Stargate администрации Трампа — поддерживаемый OpenAI, Softbank и Oracle — цель которого состоит в том, чтобы вложить 500 миллиардов долларов в создание новой инфраструктуры AI и центров обработки данных для OpenAI в течение следующих четырех лет. Особенно интересно будет наблюдать за переходом OpenAI от некоммерческой к коммерческой организации, ведь DeepSeek сделал свои AI-модели с открытым исходным кодом.

Meta также открыла некоторые аспекты своей AI-технологии, например, модель Lama LLM. Тем не менее, DeepSeek — это новинка, о которой говорят все, и тот факт, что разработчики могут свободно использовать технологию DeepSeek, может составить конкуренцию OpenAI.

Если вам понравилась эта статья, подпишитесь, чтобы не пропустить еще много полезных статей!

Любите активный отдых на природе? Подписывайтесь на канал Поход лайфхак в Яндекс Дзен — кладезь полезных советов для любителей активного отдыха!

Вы также можете читать наши материалы в: