Как «Absolute Zero Reasoner» (AZR) учится с нуля и почему психологам важно держать руку на пульсе. (Описание работы модели и впечатлений от нее психотерапевтом на основе прочитанного). Само выражение «искусственный интеллект, обученный с нуля» звучит почти как оксюморон: все привыкли, что нейросетям нужны гигабайты разметки, а людям — бесконечные часы наставничества. Тем неожиданнее оказался эксперимент Absolute Zero Reasoner (AZR). Его авторы освободили модель от внешних данных и поручили ей одновременно придумывать задачи, решать их и ставить себе оценки. По сути, они посадили ребёнка за учебник, которого ещё не существует, и дали возможность писать его на ходу. Внутренний цикл AZR выглядит так: сначала модель формулирует новую задачу — например, сгенерировать программу, вычисляющую факториал без рекурсии. Та же модель берётся за решение, после чего запускает получившийся код. Если скрипт работает, «ученик» начисляет себе награду и идёт дальше, усложняя планку. Это напоминает историю