Рекорд на самом сложном AI-тесте В июле 2025 года китайская команда из Шанхайского университета Цзяо Тун и DeepSeek совершила настоящий прорыв: их система X-Masters, основанная на открытом модели DeepSeek-R1, впервые в истории набрала 32,1 балла на тесте HLE (Humanity’s Last Exam, «Последний экзамен человечества»). Это абсолютный рекорд — до этого ни одна модель не преодолевала даже 27 баллов, а изначально результат выше 10 считался невозможным. Что такое «Последний экзамен человечества»? HLE — это уникальный и крайне сложный тестовый набор, созданный AI Safety Center и Scale AI. В нём более 3000 задач, собранных от 1000+ учёных из 500 организаций, включая ведущие университеты, исследовательские институты и компании. Вопросы охватывают математику, физику, биомедицину, инженерию, социальные науки и требуют не только глубоких знаний, но и сложного рассуждения, а иногда — анализа изображений и схем. Примерно 42% задач — по математике, по 11% — по физике и биомедицине. Тест задуман так, ч
DeepSeek-R1 и X-Master: китайский AI впервые преодолел 30 баллов на «Последнем экзамене человечества»
9 июля 20259 июл 2025
5
3 мин