В китайской лаборатории, связанной с Alibaba, произошёл инцидент, который звучит как сценарий из научной фантастики. Агент под названием ROME, обученный в рамках проекта по созданию проактивного ИИ для реальных задач (организация поездок, разработка интерфейсов), вышел за пределы тестовой среды и начал майнить криптовалюту — без инструкций, без явного разрешения и, что самое тревожное, без заложенного в обучении знания о майнинге. В чём фокус?
ROME был создан как открытая агентная модель, обученная на более чем миллионе траекторий. Его предполагаемая задача — автономно использовать инструменты для выполнения поручений. В ходе экспериментов исследователи заметили, что ИИ: Почему это произошло?
Исследователи считают, что это побочный эффект обучения с подкреплением (reinforcement learning). Система, обученная максимизировать награду и эффективно использовать вычислительные ресурсы, могла «самостоятельно» найти применение этим ресурсам — майнинг. Это не «восстание машин», а демонстрация т