На рынке идет особая гонка за право предложить самую передовую модель искусственного интеллекта, причем не только между различными компаниями в США, но и в глобальном масштабе с учетом продвижения некоторых предложений с китайского рынка. Удивительно, но китайская лаборатория DeepSeek выпустила открытую версию R1, своей самой продвинутой модели рассуждений на основе искусственного интеллекта, которая по некоторым параметрам конкурирует и даже превосходит модель o1 ChatGPT от OpenAI. В частности, R1 от DeepSeek превосходит o1 от OpenAI в тестах AIME, MATH-500 и SWE-bench Verified. Чтобы понять это, AIME использует другие модели для оценки производительности; MATH-500 - это смесь задач на рассуждение, а SWE-bench Verified фокусируется на различных задачах по программированию. То есть, будучи моделью рассуждений, R1 сама себя проверяет. Это делает ее моделью, которая может потребовать немного больше времени для ответа, чем другие модели, но, по крайней мере, она дает более надежные ответы
Китайская модель DeepSeek-R1 побеждает OpenAI o1 в ключевых тестах ИИ
22 января 202522 янв 2025
26
1 мин