Добавить в корзинуПозвонить
Найти в Дзене
Нейрозона сегодня

Claude Opus 4.6 лидирует в бенчмарке Design Arena

Claude Opus 4.6 одержал победу в бенчмарке Design Arena, где пользователи сравнивают фронтенд, сгенерированный разными ИИ-моделями. Модель без режима рассуждений набрала 1385 баллов Elo, опередив версию с рассуждениями (1377 баллов). Это демонстрирует, что в случае с Claude более продвинутые функции не всегда приводят к лучшим результатам. Design Arena работает по принципу голосования: пользователям предлагаются два анонимных варианта дизайна, созданных по одному и тому же запросу, и они выбирают лучший. На момент публикации результатов было собрано более 806 тысяч голосов. Бенчмарк разработан стартапом Arcada Labs, основанным выпускниками Гарварда. Claude Opus 4.6 стабильно демонстрирует высокие результаты, занимая первое место в 72 из 145 турниров. GPT-5.2 от OpenAI находится на 11-м месте (1277 баллов), а GPT-5 – на 19-м (1263 балла). Год назад слабый дизайн считался проблемой языковых моделей, но сейчас Claude успешно преодолел этот барьер, избежав "зловещей долины" дизайна с её ти

Claude Opus 4.6 одержал победу в бенчмарке Design Arena, где пользователи сравнивают фронтенд, сгенерированный разными ИИ-моделями. Модель без режима рассуждений набрала 1385 баллов Elo, опередив версию с рассуждениями (1377 баллов). Это демонстрирует, что в случае с Claude более продвинутые функции не всегда приводят к лучшим результатам.

Design Arena работает по принципу голосования: пользователям предлагаются два анонимных варианта дизайна, созданных по одному и тому же запросу, и они выбирают лучший. На момент публикации результатов было собрано более 806 тысяч голосов. Бенчмарк разработан стартапом Arcada Labs, основанным выпускниками Гарварда.

Claude Opus 4.6 стабильно демонстрирует высокие результаты, занимая первое место в 72 из 145 турниров. GPT-5.2 от OpenAI находится на 11-м месте (1277 баллов), а GPT-5 – на 19-м (1263 балла).

Год назад слабый дизайн считался проблемой языковых моделей, но сейчас Claude успешно преодолел этот барьер, избежав "зловещей долины" дизайна с её типичными градиентами и скругленными углами.