142,7 тыс подписчиков

Китайская модель DeepSeek-R1 побеждает OpenAI o1 в ключевых тестах ИИ

22 января 202522 янв 2025

1 мин

На рынке идет особая гонка за право предложить самую передовую модель искусственного интеллекта, причем не только между различными компаниями в США, но и в глобальном масштабе с учетом продвижения некоторых предложений с китайского рынка. Удивительно, но китайская лаборатория DeepSeek выпустила открытую версию R1, своей самой продвинутой модели рассуждений на основе искусственного интеллекта, которая по некоторым параметрам конкурирует и даже превосходит модель o1 ChatGPT от OpenAI. В частности, R1 от DeepSeek превосходит o1 от OpenAI в тестах AIME, MATH-500 и SWE-bench Verified. Чтобы понять это, AIME использует другие модели для оценки производительности; MATH-500 - это смесь задач на рассуждение, а SWE-bench Verified фокусируется на различных задачах по программированию. То есть, будучи моделью рассуждений, R1 сама себя проверяет. Это делает ее моделью, которая может потребовать немного больше времени для ответа, чем другие модели, но, по крайней мере, она дает более надежные ответы

Удивительно, но китайская лаборатория DeepSeek выпустила открытую версию R1, своей самой продвинутой модели рассуждений на основе искусственного интеллекта, которая по некоторым параметрам конкурирует и даже превосходит модель o1 ChatGPT от OpenAI.

В частности, R1 от DeepSeek превосходит o1 от OpenAI в тестах AIME, MATH-500 и SWE-bench Verified.

Чтобы понять это, AIME использует другие модели для оценки производительности; MATH-500 - это смесь задач на рассуждение, а SWE-bench Verified фокусируется на различных задачах по программированию.

То есть, будучи моделью рассуждений, R1 сама себя проверяет.

Это делает ее моделью, которая может потребовать немного больше времени для ответа, чем другие модели, но, по крайней мере, она дает более надежные ответы в некоторых средах, таких как наука, математика и физика.

Удивительно то, что эта модель DeepSeek R1 содержит 671 миллиард параметров, которые соответствуют навыкам решения задач.

В любом случае, они опубликовали и другие, более упрощенные версии этой модели, даже достаточно маленькие, чтобы работать на любом ноутбуке.

Что касается полноценной модели R1, то она не будет работать на обычном ноутбуке, поскольку требует гораздо более мощного оборудования, но, по крайней мере, API имеет вполне конкурентоспособную цену, по крайней мере, если сравнивать с моделями OpenAI.

Посмотрим, как будет развиваться эта технологическая гонка между США и Китаем за право предложить самую передовую модель искусственного интеллекта на рынке.

📃 Читайте далее на сайте

Электроника

81,9 тыс интересуются