Добавить в корзинуПозвонить
Найти в Дзене

Что такое китайский DeepSeek и почему он сводит с ума мир ИИ?

DeepSeek, китайский стартап в области искусственного интеллекта, которому чуть больше года, вызвал восхищение и ужас в Кремниевой долине, продемонстрировав модели ИИ, которые предлагают производительность, сопоставимую с лучшими в мире чат-ботами, при намного меньших затратах. Появление DeepSeek может стать противовесом широко распространенному мнению о том, что будущее ИИ потребует постоянно растущих объемов вычислительной мощности и энергии. 27 января мировые акции технологических компаний рухнули на фоне стремительного роста ажиотажа вокруг инноваций DeepSeek, а инвесторы начали осознавать последствия для ее американских конкурентов и поставщиков оборудования для искусственного интеллекта, таких как Nvidia Corp. DeepSeek была основана в 2023 году Ляном Вэньфэном , руководителем ИИ-ориентированного квантового хедж-фонда High-Flyer. Компания разрабатывает модели ИИ с открытым исходным кодом, что означает, что сообщество разработчиков в целом может проверять и улучшать программное обес
Оглавление

DeepSeek, китайский стартап в области искусственного интеллекта, которому чуть больше года, вызвал восхищение и ужас в Кремниевой долине, продемонстрировав модели ИИ, которые предлагают производительность, сопоставимую с лучшими в мире чат-ботами, при намного меньших затратах.

Появление DeepSeek может стать противовесом широко распространенному мнению о том, что будущее ИИ потребует постоянно растущих объемов вычислительной мощности и энергии.

27 января мировые акции технологических компаний рухнули на фоне стремительного роста ажиотажа вокруг инноваций DeepSeek, а инвесторы начали осознавать последствия для ее американских конкурентов и поставщиков оборудования для искусственного интеллекта, таких как Nvidia Corp.

Что такое DeepSeek?

DeepSeek была основана в 2023 году Ляном Вэньфэном , руководителем ИИ-ориентированного квантового хедж-фонда High-Flyer. Компания разрабатывает модели ИИ с открытым исходным кодом, что означает, что сообщество разработчиков в целом может проверять и улучшать программное обеспечение. Ее мобильное приложение взлетело на вершину чартов загрузок iPhone в США после его выпуска в начале января.

Приложение отличается от других чат-ботов, таких как ChatGPT от OpenAI, тем, что формулирует свои рассуждения перед тем, как дать ответ на подсказку. Компания утверждает, что ее релиз R1 обеспечивает производительность на уровне последней итерации ChatGPT. Она предлагает лицензии для лиц, заинтересованных в разработке чат-ботов с использованием технологии для ее создания, по цене, значительно ниже той, которую OpenAI взимает за аналогичный доступ.

Чем DeepSeek R1 отличается от OpenAI или Meta AI?

DeepSeek утверждает, что производительность R1 приближается или превосходит производительность конкурирующих моделей в нескольких ведущих бенчмарках, таких как AIME 2024 для математических задач, MMLU для общих знаний и AlpacaEval 2.0 для производительности вопросов и ответов. Он также входит в число лучших исполнителей в аффилированной с Калифорнийским университетом в Беркли таблице лидеров под названием Chatbo Arena .

Хотя компания не раскрывает все подробности, стоимость обучения и разработки моделей DeepSeek, по-видимому, составляет лишь часть того, что требуется для лучших продуктов OpenAI или Meta Platforms Inc. Более высокая эффективность модели ставит под вопрос необходимость огромных капиталовложений для приобретения новейших и самых мощных ускорителей ИИ от таких компаний, как Nvidia. Это также привлекает внимание к ограничениям экспорта США таких передовых полупроводников в Китай — которые были призваны предотвратить прорыв того рода, который, по-видимому, представляет собой DeepSeek.

Когда DeepSeek вызвал всемирный интерес?

Разработчик ИИ находится под пристальным вниманием с момента выпуска его самой ранней модели в 2023 году. Затем в ноябре он дал миру возможность взглянуть на свою модель рассуждений DeepSeek R1, разработанную для имитации человеческого мышления. Эта модель лежит в основе его приложения чат-бота, которое стало очень популярным как гораздо более дешевая альтернатива OpenAI, а инвестор Марк Андрессен назвал его «моментом Спутника ИИ ».

По данным рыночного трекера App Figures, к 25 января мобильное приложение DeepSeek было загружено 1,6 миллиона раз и заняло первое место в магазинах приложений для iPhone в Австралии, Канаде, Китае, Сингапуре, США и Великобритании.

Чему мы научились из реакции гигантского фондового рынка?

На протяжении большей части последних двух лет с тех пор, как ChatGPT положил начало глобальному ажиотажу вокруг искусственного интеллекта, инвесторы делали ставку на то, что для усовершенствования искусственного интеллекта потребуются все более совершенные чипы от таких компаний, как Nvidia.

Прорыв DeepSeek свидетельствует о появлении моделей ИИ, способных достичь сопоставимой производительности, используя менее сложные чипы и при меньших затратах.

Инвесторы в ответ избавились от акций Nvidia, что привело к падению акций на 17% 27 января и потере 589 миллиардов долларов стоимости крупнейшей в мире компании — рекорд фондового рынка . Производитель полупроводниковых машин ASML Holding NV и другие компании, которые также выиграли от растущего спроса на передовое оборудование ИИ, также упали.

Успех DeepSeek ставит под сомнение огромные расходы таких компаний, как Meta и Microsoft Corp. , каждая из которых в этом году взяла на себя обязательства по капиталовложениям в размере 65 миллиардов долларов и более, в основном на инфраструктуру ИИ.

Акции Meta и Microsoft также открылись снижением, хотя и с меньшей маржой, чем Nvidia, поскольку инвесторы взвешивали потенциал существенной экономии на инвестициях технологических гигантов в ИИ. Meta даже восстановилась позже в ходе сессии, закрывшись выше. Китайские компании, связанные с DeepSeek, такие как Iflytek Co. , также выросли.

Некоторые отраслевые обозреватели предположили, что отрасль в целом может выиграть от прорыва DeepSeek, если он подтолкнет OpenAI и других поставщиков в США к снижению цен, что будет способствовать более быстрому внедрению ИИ.

Как DeepSeek может повлиять на глобальную стратегическую конкуренцию в сфере ИИ?

ИИ — ключевой рубеж в борьбе США и Китая за технологическое превосходство. Вашингтон запретил экспорт в Китай такого оборудования, как высокопроизводительные графические процессоры, в попытке остановить прогресс страны.

Прогресс DeepSeek предполагает, что китайские инженеры ИИ нашли способ обойти эти ограничения, сосредоточившись на большей эффективности при ограниченных ресурсах. Тем не менее, остается неясным, к какому объему передового оборудования для обучения ИИ имел доступ DeepSeek.

Разработчики по всему миру уже экспериментируют с программным обеспечением DeepSeek и ищут способы создания инструментов с его помощью. Это может помочь американским компаниям повысить эффективность своих моделей ИИ и ускорить принятие передовых ИИ-рассуждений.

Это, в свою очередь, может заставить регулирующие органы установить правила использования этих моделей и с какой целью.

Успехи DeepSeek поднимают еще один вопрос, который часто возникает, когда китайская компания делает успехи на зарубежных рынках: могут ли огромные массивы данных, которые мобильное приложение собирает и хранит на китайских серверах, представлять угрозу конфиденциальности или безопасности граждан США?

Тот факт, что модели DeepSeek имеют открытый исходный код, открывает возможность для пользователей в США взять код и запустить модели таким образом, чтобы не затрагивать серверы в Китае.

Кто является основателем DeepSeek?

Родившийся в Гуандуне в 1985 году, выпускник инженерного факультета Лян никогда не учился и не работал за пределами материкового Китая. Он получил степени бакалавра и магистра в области электронной и информационной инженерии в Чжэцзянском университете. Он основал DeepSeek с уставным капиталом в 10 миллионов юаней (1,4 миллиона долларов США), согласно базе данных компаний Tianyancha.

Слабым местом для дальнейшего прогресса является не малое финансирование, сказал Лян в интервью китайскому изданию 36kr, а ограничения США на доступ к лучшим чипам. Большинство его ведущих исследователей были свежими выпускниками ведущих китайских университетов, сказал он, подчеркнув необходимость для Китая развивать свою собственную внутреннюю экосистему, похожую на ту, что построена вокруг Nvidia и ее чипов ИИ.

«Больше инвестиций не обязательно приводит к большему количеству инноваций. В противном случае крупные компании забрали бы все инновации», - сказал Лян.

Ляна сравнивают с основателем OpenAI Сэмом Альтманом, но гражданин Китая ведет себя гораздо сдержаннее и редко выступает публично.

Какое место занимает DeepSeek на рынке искусственного интеллекта в Китае?

Лидеры технологий Китая, от Alibaba Group Holding Ltd. и Baidu Inc. до Tencent Holdings Ltd. , вложили значительные деньги и ресурсы в гонку за приобретение оборудования и клиентов для своих предприятий в сфере ИИ. Наряду со стартапом Кай-Фу Ли 01.AI, DeepSeek выделяется своим подходом с открытым исходным кодом — разработанным для быстрого набора наибольшего числа пользователей перед разработкой стратегий монетизации на основе этой большой аудитории.

Поскольку модели DeepSeek более доступны по цене, они уже сыграли свою роль в снижении затрат разработчиков искусственного интеллекта в Китае, где крупные игроки вступили в ценовую войну , которая за последние полтора года привела к последовательным волнам снижения цен.

Каковы недостатки DeepSeek?

Как и все другие китайские модели искусственного интеллекта, DeepSeek самоцензурирует темы, которые в Китае считаются деликатными. Он отклоняет запросы о протестах на площади Тяньаньмэнь 1989 года или геополитически сложные вопросы, такие как возможность вторжения Китая на Тайвань. В ходе испытаний бот DeepSeek способен давать подробные ответы о политических деятелях, таких как премьер-министр Индии Нарендра Моди, но отказывается делать это о президенте Китая Си Цзиньпине .

Облачная инфраструктура DeepSeek, вероятно, подвергнется испытанию из-за ее внезапной популярности. Компания ненадолго столкнулась с серьезным сбоем 27 января и должна будет управлять еще большим трафиком, поскольку новые и вернувшиеся пользователи будут загружать все больше запросов в ее чат-бот.