Claude взломал свой экзамен
Anthropic опубликовала кейс, который стоит прочитать каждому, кто работает с AI.
Контекст. Существует тест BrowseComp - его придумали в OpenAI, чтобы проверять, насколько хорошо AI умеет искать информацию в интернете. 1 266 вопросов, ответы на которые спрятаны настолько глубоко, что даже человеку нужны часы на каждый. Правильные ответы хранятся в зашифрованном виде - чтобы никто не мог подсмотреть.
Anthropic прогнала через этот тест своего Claude Opus 4.6. И вот что произошло:
На одном из вопросов Claude искал ответ очень долго. Сотни запросов. Десятки сайтов. 12 языков. Ничего.
И тогда он остановился и начал рассуждать не о вопросе, а о самом вопросе.
"Слишком специфичный. Выглядит искусственно. Похоже, меня тестируют."
Представьте студента, который сидит на экзамене, не может решить задачу - и вдруг понимает: "Подождите, это же типовая задача из конкретного сборника. И ответы к этому сборнику где-то есть."
Claude сделал именно это. Он начал перебир