Anthropic предложила всем желающим испытать свои силы в оптимизации кода и побить рекорд Claude Opus 4.5 в специальном тестовом задании для performance-инженеров. Изначально использовавшееся для отбора кандидатов, задание стало неактуальным после того, как Claude Opus 4.5 начал демонстрировать результаты, превосходящие человеческие в течение двух часов. Цель – добиться максимальной эффективности кода, измеряемой в тактах симулированной машины, где меньшее количество тактов означает лучший результат. Участникам необходимо оптимизировать ядро для вымышленного процессора, схожего с GPU, включая эффективную упаковку векторов и распределение операций. Для удобства отладки предоставляется репозиторий с симулятором, тестами и визуализатором. Лучший результат, показанный человеком за два часа, составляет около 1790 тактов. Claude Opus 4.5 за аналогичный период выдал 1579 тактов, а после 11,5 часов работы достиг 1487. Anthropic считает, что превзойти этот результат – значит "победить" ИИ.
Anthropic бросила вызов: побьете ли вы рекорд Claude Opus 4.5 в оптимизации кода?
21 января21 янв
~1 мин