В мир ИИ ворвались сразу несколько «рассуждающих» моделей от разных компаний, успешно сдающих самые сложные математические тесты и бросивших вызов OpenAI с ее ChatGPT o1. Нейросеть R1-Lite-Preview — одна из них.
DeepSeek, подразделение китайского квантового хедж-фонда High-Flyer Capital Management, специализирующееся на выпуске высокопроизводительных технологий с открытым исходным кодом, представило R1-Lite-Preview - свою новейшую большую языковую модель (LLM), ориентированную на рассуждения, доступную пока исключительно через DeepSeek Chat, их веб-чатбот с искусственным интеллектом.
Известный своим инновационным вкладом в экосистему ИИ с открытым исходным кодом, новый релиз DeepSeek направлен на предоставление публике возможностей рассуждения высокого уровня, сохраняя при этом приверженность доступному и прозрачному ИИ.
Создание инфраструктуры для агентного ИИ
R1-Lite-Preview, несмотря на то, что пока доступна только через чат-приложение, уже привлекает внимание, предлагая производительность, приближающуюся, а в некоторых случаях и превосходящую, хваленую модель o1-preview от OpenAI.
Подобно модели, выпущенной в сентябре 2024 года, DeepSeek-R1-Lite-Preview демонстрирует рассуждения по принципу "цепочки мыслей", показывая пользователю различные цепочки или ходы "мыслей", которые она проходит для ответа на их запросы и вводы, документируя процесс путем объяснения того, что она делает и почему.
Хотя некоторые из цепочек/ходов мыслей могут показаться людям бессмысленными или даже ошибочными, DeepSeek-R1-Lite-Preview в целом демонстрирует поразительную точность, даже отвечая на "каверзные" вопросы, которые сбивали с толку другие, более старые, но мощные модели ИИ, такие как GPT-4o и семейство Claude от Anthropic, включая:
- Cколько букв R в слове strawberry?
- Что больше, 9.11 или 9.9?
Не думайте, что это — простые задачи для нейросетей. Большинство из них не проходят такие тесты.
Новый подход к рассуждениям ИИ
DeepSeek-R1-Lite-Preview разработана для превосходных результатов в задачах, требующих логического вывода, математических рассуждений и решения проблем в реальном времени.
По данным DeepSeek, модель превосходит уровень производительности OpenAI o1-preview по установленным критериям, таким как AIME и MATH (сложнейшие американские математические тесты для старшеклассников и поступающих в вузы).
Для модели характерны:
— Прозрачный мыслительный процесс
Пользователи могут видеть, как модель шаг за шагом решает сложные задачи. Этого не хватает многим проприетарным системам ИИ.
— Масштабирование производительности
Нейросеть получает более высокие оценки и выисляет точнее, если ей для решения задачи предоставляется больше времени. А большинство современных нейросетей пока упираются в потолок и не дают прироста в производительности.
Бенчмарки и применение в реальном мире
DeepSeek-R1-Lite-Preview показала конкурентоспособные результаты по ключевым бенчмаркам. Система способна справляться с широким спектром задач, от сложной математики до логических сценариев, получая оценки производительности, соперничающие с моделями высшего уровня в бенчмарках рассуждений, таких как GPQA и Codeforces.
Однако DeepSeek пока не выпустила полный код для независимого анализа или бенчмаркинга третьими сторонами, а также еще не сделала DeepSeek-R1-Lite-Preview доступной через API, что позволило бы провести такие же независимые тесты.
Кроме того, компания еще не опубликовала блог-пост или техническую статью, объясняющую, как DeepSeek-R1-Lite-Preview была обучена или архитектурно построена, оставляя много вопросов о ее базовых истоках.
Доступность и планы по открытому исходному коду
R1-Lite-Preview теперь доступна через DeepSeek Chat. Хотя модель бесплатна для публичного использования, ее продвинутый режим "Deep Think" имеет дневной лимит в 50 сообщений, предоставляя достаточно возможностей для пользователей испытать ее возможности.
В перспективе DeepSeek планирует выпустить версии с открытым исходным кодом своих моделей серии R1 и соответствующие API, согласно сообщениям компании в X.
Этот шаг соответствует истории компании по поддержке сообщества ИИ с открытым исходным кодом.
Ее предыдущий релиз, DeepSeek-V2.5, заслужил похвалу за сочетание общей обработки языка и продвинутых возможностей кодирования, сделав его одной из самых мощных моделей ИИ с открытым исходным кодом на тот момент.
Опираясь на наследие
Поскольку предприятия и исследователи изучают применения ИИ, интенсивно использующего рассуждения, приверженность DeepSeek открытости гарантирует, что ее модели остаются жизненно важным ресурсом для разработки и инноваций.
Сочетая высокую производительность, прозрачность операций и доступность открытого исходного кода, DeepSeek не только продвигает ИИ, но и меняет то, как он распространяется и используется.
R1-Lite-Preview уже доступна для публичного тестирования. Ожидается, что за ней последуют модели с открытым исходным кодом и API, что еще больше укрепит позицию DeepSeek как лидера в области доступных, передовых технологий ИИ.
PS.
Если кликнуть по названию канала, то увидите другие статьи. Можно выбрать ещё что-то интересное для себя. А для просмотра будущих статей и поддержки автора — лучше вообще подписаться. Имеется также постоянно обновляемый гид-путеводитель по статьям канала.
#нейросеть #нейронныесети #ИИ #AI #LLM #LRM #ChatGPT #DeepSeek