Forward-deployed-инженеры OpenAI вместе с Thrive Holdings полгода строили Tax AI — агента для подготовки сложных налоговых деклараций — для сети Crete из 30+ бухгалтерских фирм. Главная фишка не в самом агенте, а в том, что инженеры превратили продакшн-сбои в топливо для автономной доработки через Codex. Обычная история: система прошла лабораторные тесты, ушла в прод, поломалась на edge-кейсах. Команда неделями копается в трассах, правит промпты, переписывает eval'ы. Цикл обратной связи ручной и медленный — пока инженер сам его не двинет, ничего не происходит. OpenAI описывает, как они закрыли этот цикл: Codex получает структурированный сигнал из продакшна и сам пишет фиксы. Архитектура такая: bounded-окружение для Codex разделено на writable worktree и read-only production context. В worktree — продуктовая поверхность, которую агент может править, целевые и регрессионные eval'ы, описывающие успех, плюс переиспользуемые skills/docs. В read-only — продакшн-трасса, исходные документы,
OpenAI и Crete запустили Tax AI на Codex: налоговый агент сам исправляет ошибки из продакшна, 30+ бухгалтерских фирм в пилоте
3 дня назад3 дня назад
1 мин