31 подписчик

DeepSeek взорвал рынок: "маленькое" обновление R1 затмило всех!

29 мая 202529 мая 2025

2 мин

В мире больших языковых моделей (LLM) произошло событие, которое заставило всех затаить дыхание: китайская компания DeepSeek выпустила обновлённую версию своей модели R1. И хотя сами разработчики назвали это «небольшим» апгрейдом, пользователи и эксперты в один голос утверждают: это настоящий прорыв, который меняет правила игры. DeepSeek R1-0528: скромность украшает гениев В преддверии праздников DeepSeek преподнесла сообществу неожиданный подарок: ночью 29 мая в открытый доступ была выложена новая версия R1 (0528). Модель с 685 миллиардами параметров, выпущенная под MIT-лицензией (разрешено коммерческое использование), сразу же привлекла внимание. Несмотря на огромный размер, который не позволяет запускать ее на потребительском железе без дистилляции, DeepSeek R1-0528 вызвала восторг. Пользователи оценили не только щедрость компании, но и впечатляющий прирост производительности. Что нового: глубокая мысль и код-мастерство По словам очевидцев, DeepSeek R1-0528 демонстрирует более глубо

DeepSeek R1-0528: скромность украшает гениев

В преддверии праздников DeepSeek преподнесла сообществу неожиданный подарок: ночью 29 мая в открытый доступ была выложена новая версия R1 (0528). Модель с 685 миллиардами параметров, выпущенная под MIT-лицензией (разрешено коммерческое использование), сразу же привлекла внимание.

Несмотря на огромный размер, который не позволяет запускать ее на потребительском железе без дистилляции, DeepSeek R1-0528 вызвала восторг. Пользователи оценили не только щедрость компании, но и впечатляющий прирост производительности.

Что нового: глубокая мысль и код-мастерство

По словам очевидцев, DeepSeek R1-0528 демонстрирует более глубокий уровень рассуждений, выдает более естественный и структурированный текст. Модель способна «думать» над задачей 30-60 минут, что сравнимо с возможностями Claude 4.

Главный сюрприз — значительное улучшение навыков программирования. В бенчмарке LiveCodeBench R1-0528 почти догнала O3 (High), обогнав O3-Mini. Это впечатляющий результат, учитывая, что DeepSeek — полностью открытая и бесплатная модель.

В тесте Extended NYT Connections R1-0528 также показала заметный прогресс, поднявшись с 38.6 до 49.8, что приближает ее к Claude Opus 4 Thinking 16k.

Тесты пользователей: DeepSeek возвращается в строй

Разработчик Haider проверил R1-0528 в соревновании по созданию системы оценки слов и обнаружил, что только o3 и новая DeepSeek справились с задачей.

Другой пользователь сравнил DeepSeek R1-0528 с Claude-4-Sonnet в задаче моделирования столкновения шарика со стеной. Выяснилось, что код, сгенерированный DeepSeek, лучше имитирует физику процесса.

CTO Hyperbolic Labs Yuchen Jin обнаружил, что R1-0528 — единственная модель, которая всегда правильно отвечает на вопрос «what is 9.9 - 9.11?».

Ложка дегтя: задумчивость и UI

Журналисты «机器之心» попросили DeepSeek R1-0528 написать программу для извлечения изображений из Word-документа. Модель справилась за минуту, но код содержал синтаксическую ошибку.

Интересно, что на исправление этой ошибки R1 потратила 212 секунд, что намного больше, чем на написание всей программы. Это подтверждает проблему «чрезмерного обдумывания», когда модель тратит слишком много времени на простые задачи.

В целом, новая версия DeepSeek R1 произвела хорошее впечатление, хотя и не лишена недостатков.

Что дальше: ждем DeepSeek R2

Несмотря на впечатляющий апгрейд R1, пользователи уже мечтают о DeepSeek R2. Каким будет следующее поколение модели? Придется ли ждать до октября?

DeepSeek R1-0528 — это не просто обновление, а заявка на лидерство в мире открытых LLM. Конкурентам стоит напрячься: DeepSeek возвращается, и она настроена серьезно.

Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.

ИИ сегодня — ваше конкурентное преимущество завтра!

Тел. +7 (985) 982-70-55

E-mail sms_systems@inbox.ru

Сайт https://www.smssystems.ru/razrabotka-ai/