Найти в Дзене

Нейросеть R1-Lite-Preview, первая рассуждающая модель от DeepSeek, бросает вызов ChatGPT o1 от OpenAI

Оглавление
Картинка сгенерирована нейросетью Recraft
Картинка сгенерирована нейросетью Recraft

В мир ИИ ворвались сразу несколько «рассуждающих» моделей от разных компаний, успешно сдающих самые сложные математические тесты и бросивших вызов OpenAI с ее ChatGPT o1. Нейросеть R1-Lite-Preview — одна из них.

DeepSeek, подразделение китайского квантового хедж-фонда High-Flyer Capital Management, специализирующееся на выпуске высокопроизводительных технологий с открытым исходным кодом, представило R1-Lite-Preview - свою новейшую большую языковую модель (LLM), ориентированную на рассуждения, доступную пока исключительно через DeepSeek Chat, их веб-чатбот с искусственным интеллектом.

Известный своим инновационным вкладом в экосистему ИИ с открытым исходным кодом, новый релиз DeepSeek направлен на предоставление публике возможностей рассуждения высокого уровня, сохраняя при этом приверженность доступному и прозрачному ИИ.

Создание инфраструктуры для агентного ИИ

R1-Lite-Preview, несмотря на то, что пока доступна только через чат-приложение, уже привлекает внимание, предлагая производительность, приближающуюся, а в некоторых случаях и превосходящую, хваленую модель o1-preview от OpenAI.

Подобно модели, выпущенной в сентябре 2024 года, DeepSeek-R1-Lite-Preview демонстрирует рассуждения по принципу "цепочки мыслей", показывая пользователю различные цепочки или ходы "мыслей", которые она проходит для ответа на их запросы и вводы, документируя процесс путем объяснения того, что она делает и почему.

Хотя некоторые из цепочек/ходов мыслей могут показаться людям бессмысленными или даже ошибочными, DeepSeek-R1-Lite-Preview в целом демонстрирует поразительную точность, даже отвечая на "каверзные" вопросы, которые сбивали с толку другие, более старые, но мощные модели ИИ, такие как GPT-4o и семейство Claude от Anthropic, включая:

  • Cколько букв R в слове strawberry?
  • Что больше, 9.11 или 9.9?

Не думайте, что это — простые задачи для нейросетей. Большинство из них не проходят такие тесты.

Новый подход к рассуждениям ИИ

DeepSeek-R1-Lite-Preview разработана для превосходных результатов в задачах, требующих логического вывода, математических рассуждений и решения проблем в реальном времени.

По данным DeepSeek, модель превосходит уровень производительности OpenAI o1-preview по установленным критериям, таким как AIME и MATH (сложнейшие американские математические тесты для старшеклассников и поступающих в вузы).

Для модели характерны:

Прозрачный мыслительный процесс
Пользователи могут видеть, как модель шаг за шагом решает сложные задачи. Этого не хватает многим проприетарным системам ИИ.

Масштабирование производительности
Нейросеть получает более высокие оценки и выисляет точнее, если ей для решения задачи предоставляется больше времени. А большинство современных нейросетей пока упираются в потолок и не дают прироста в производительности.

Бенчмарки и применение в реальном мире

DeepSeek-R1-Lite-Preview показала конкурентоспособные результаты по ключевым бенчмаркам. Система способна справляться с широким спектром задач, от сложной математики до логических сценариев, получая оценки производительности, соперничающие с моделями высшего уровня в бенчмарках рассуждений, таких как GPQA и Codeforces.

Однако DeepSeek пока не выпустила полный код для независимого анализа или бенчмаркинга третьими сторонами, а также еще не сделала DeepSeek-R1-Lite-Preview доступной через API, что позволило бы провести такие же независимые тесты.

Кроме того, компания еще не опубликовала блог-пост или техническую статью, объясняющую, как DeepSeek-R1-Lite-Preview была обучена или архитектурно построена, оставляя много вопросов о ее базовых истоках.

Доступность и планы по открытому исходному коду

R1-Lite-Preview теперь доступна через DeepSeek Chat. Хотя модель бесплатна для публичного использования, ее продвинутый режим "Deep Think" имеет дневной лимит в 50 сообщений, предоставляя достаточно возможностей для пользователей испытать ее возможности.

В перспективе DeepSeek планирует выпустить версии с открытым исходным кодом своих моделей серии R1 и соответствующие API, согласно сообщениям компании в X.

Этот шаг соответствует истории компании по поддержке сообщества ИИ с открытым исходным кодом.

Ее предыдущий релиз, DeepSeek-V2.5, заслужил похвалу за сочетание общей обработки языка и продвинутых возможностей кодирования, сделав его одной из самых мощных моделей ИИ с открытым исходным кодом на тот момент.

Опираясь на наследие

Поскольку предприятия и исследователи изучают применения ИИ, интенсивно использующего рассуждения, приверженность DeepSeek открытости гарантирует, что ее модели остаются жизненно важным ресурсом для разработки и инноваций.

Сочетая высокую производительность, прозрачность операций и доступность открытого исходного кода, DeepSeek не только продвигает ИИ, но и меняет то, как он распространяется и используется.

R1-Lite-Preview уже доступна для публичного тестирования. Ожидается, что за ней последуют модели с открытым исходным кодом и API, что еще больше укрепит позицию DeepSeek как лидера в области доступных, передовых технологий ИИ.

PS.

Если кликнуть по названию канала, то увидите другие статьи. Можно выбрать ещё что-то интересное для себя. А для просмотра будущих статей и поддержки автора — лучше вообще подписаться. Имеется также постоянно обновляемый гид-путеводитель по статьям канала.

#нейросеть #нейронныесети #ИИ #AI #LLM #LRM #ChatGPT #DeepSeek