AI-комьюнити снова в шоке: появился новый тест на общую искусственную интеллектуальность, который ставит в тупик даже самых продвинутых моделей вроде GPT-4.5 и Claude 3.7. Это не очередной «угадай слово» или «скажи, как приготовить борщ» — тут всё гораздо серьезнее. Речь о ARC-AGI-2 — втором поколении теста от Arc Prize Foundation, созданного в том числе исследователем ИИ Франсуа Шолле (автором Keras). Тест проверяет не просто обученность модели, а её способность к настоящему мышлению: видеть абстрактные закономерности и адаптироваться к незнакомым задачам. Всё это — без возможности "грубой силы" и перебора ответов. Это задачки в стиле «визуальные головоломки» — цветные квадраты, из которых нужно определить закономерность и продолжить логическую последовательность. Только вместо школьника у доски — GPT, Claude или Gemini. Чтобы показать, насколько тест сложный, Arc Prize протестировали 400+ человек. Люди в среднем справились на 60%. Теперь сравним это с результатами ИИ-моделей: МодельТ