Представь: твоя команда только что развернула AI-агента, который должен рыться во внутренних документах компании и отвечать на вопросы сотрудников. В разработке он работает как часы. Но в продакшене — начинает галлюцинировать, пропускать ключевые ограничения, тупить. И простым патчем тут не отделаться. Начинается мучительный метод тыка: меняешь нарезку документов, алгоритмы поиска, системные промпты — всё сразу. А потом сидишь и гадаешь: что именно из этого барахла сработало? Потому что изменения переплетаются, и понять, какой рычаг подействовал, становится почти невозможно. Чтобы выйти из этого замкнутого круга, исследователи из Университета Жэньминь (Китай) и Microsoft Research представили Arbor — фреймворк, который превращает AI-исследования и оптимизацию из последовательности слепых экспериментов в накопительный процесс обучения. Arbor организует гипотезы, тесты и выводы в дерево, которое помогает системе учиться на прошлых ошибках и со временем делать умные, проверенные улучшения
📰 Новый AI-фреймворк Arbor: как он уделывает Claude Code и Codex в 2,5 раза — и почему это меняет правила игры в оптимизации
СегодняСегодня
2 мин