Добавить в корзинуПозвонить
Найти в Дзене
Kineiro

Codex от OpenAI: агент видит экран, управляет интерфейсом и работает по расписанию

👀 OpenAI обновила Codex: теперь агент видит экран, управляет курсором и самостоятельно работает в программах через графический интерфейс. Разбираем все новые возможности, практические сценарии применения и текущие ограничения обновления. Codex воспринимался как инструмент для работы с кодом. Обновление, которое выпустила OpenAI, меняет эту рамку. Агент получил возможность видеть экран и управлять компьютером через графический интерфейс — так, как это делает человек. Это не косметическое улучшение: речь идёт о смене класса задач, которые агент способен решать самостоятельно. Computer use — это режим, в котором агент видит содержимое экрана, перемещает курсор и взаимодействует с программами через GUI. Агент получает возможность работать в любом приложении, доступном пользователю визуально, — без необходимости программного интерфейса или специальной интеграции. Несколько агентов могут работать параллельно, не перехватывая управление у пользователя. Агенты действуют в фоне, пока человек з
Оглавление

👀 OpenAI обновила Codex: теперь агент видит экран, управляет курсором и самостоятельно работает в программах через графический интерфейс. Разбираем все новые возможности, практические сценарии применения и текущие ограничения обновления.

Codex воспринимался как инструмент для работы с кодом. Обновление, которое выпустила OpenAI, меняет эту рамку. Агент получил возможность видеть экран и управлять компьютером через графический интерфейс — так, как это делает человек. Это не косметическое улучшение: речь идёт о смене класса задач, которые агент способен решать самостоятельно.

Computer use: агент за экраном

Computer use — это режим, в котором агент видит содержимое экрана, перемещает курсор и взаимодействует с программами через GUI. Агент получает возможность работать в любом приложении, доступном пользователю визуально, — без необходимости программного интерфейса или специальной интеграции.

Несколько агентов могут работать параллельно, не перехватывая управление у пользователя. Агенты действуют в фоне, пока человек занимается другими задачами.

На текущем этапе computer use доступен только на macOS.

Новые возможности обновления

Встроенный браузер

Codex получил встроенный браузер с возможностью оставлять комментарии прямо на элементах страницы и давать агенту точечные инструкции в контексте конкретного интерфейса. На данный момент браузер работает для localhost; поддержка полноценного веба анонсирована в следующих обновлениях.

Генерация изображений внутри воркфлоу

Через gpt-image-1.5 агент генерирует изображения прямо в рамках рабочего процесса — без переключения между инструментами и дополнительных ручных шагов.

Плагины и интеграции

В обновлении появилось более 90 плагинов: Jira, GitLab, Microsoft 365, Notion, Slack и другие. Диапазон инструментов, с которыми агент работает напрямую, существенно расширился.

Память и контекст между сессиями

Агент запоминает предпочтения пользователя и накапливает контекст между сессиями. Вместо повторного объяснения условий при каждом запуске агент уже знает, как пользователь работает и что ему важно. Для пользователей из EU и UK функция появится позже.

Автоматизации по расписанию

Агент запускается по таймеру: самостоятельно включается, подтягивает актуальный контекст и формирует список задач на день. Codex переходит в режим постоянного фонового ассистента, который начинает работу до того, как пользователь открыл компьютер.

Что это означает для команд

Обновление формирует новый тип отношений с агентом. Раньше пользователь запускал задачу и получал результат в тексте или коде. Теперь агент действует в интерфейсах самостоятельно: открывает программы, заполняет формы, переключается между вкладками. Это снимает с команды значительную часть рутинных операций, которые раньше требовали ручного участия.

Для команд, работающих с регулярными публикациями, Kineiro.ru реализует аналогичную логику на уровне контент-процессов: задаёшь параметры, и сервис управляет выходом материалов через API площадок (Telegram, ВКонтакте, Одноклассники, Яндекс Дзен и др.) без постоянного участия команды в каждой операции.

Агент в роли оператора

Computer use в Codex фиксирует устойчивую тенденцию: ИИ-агенты перестают быть надстройкой над интерфейсом и становятся его полноценными операторами. Вопрос уже не в том, умеет ли агент выполнять задачу — а в том, насколько точно команда умеет её формулировать.