Найти в Дзене
Владислав Сарамуд

📱 OpenAI выпустила своего Агента

📱 OpenAI выпустила своего Агента! Вчера OpenAI запустила ChatGPT Agent — облачный компьютер, сочетающий Operator (управление браузером) и Deep Research (многошаговый поиск и аналитика). Агент работает на виртуальном ПК OpenAI — не на вашем локальном компьютере. Он умеет кликать, скроллить, заполнять формы и работать с API — вместо вас. 🪼 НО! Перед любым действием, которое «нельзя откатить» (отправка писем, переводы, git push и т. д.), агент обязательно запросит подтверждение. Работа с деньгами и банковскими сайтами под особым контролем — при нарушении условий агент останавливается. 🪼 В официальной презентации (демо прикреплю в комменты) показали, как агент бронирует ресторан, готовит презентацию, собирает корзину. Пока что прямые оплаты и переводы заблокированы — агент только формирует заказ, но не оплачивает его. ⸻ 🪼 Что уже умеет (нажмите, чтобы раскрыть): • Кликает, скроллит, заполняет формы — как Operator. • Deep Research: параллельный многошаговый поиск, сбор и сводка

📱 OpenAI выпустила своего Агента!

Вчера OpenAI запустила ChatGPT Agent — облачный компьютер, сочетающий Operator (управление браузером) и Deep Research (многошаговый поиск и аналитика).

Агент работает на виртуальном ПК OpenAI — не на вашем локальном компьютере.

Он умеет кликать, скроллить, заполнять формы и работать с API — вместо вас.

🪼 НО! Перед любым действием, которое «нельзя откатить» (отправка писем, переводы, git push и т. д.), агент обязательно запросит подтверждение.

Работа с деньгами и банковскими сайтами под особым контролем — при нарушении условий агент останавливается.

🪼 В официальной презентации (демо прикреплю в комменты) показали, как агент бронирует ресторан, готовит презентацию, собирает корзину.

Пока что прямые оплаты и переводы заблокированы — агент только формирует заказ, но не оплачивает его.

🪼 Что уже умеет (нажмите, чтобы раскрыть):

• Кликает, скроллит, заполняет формы — как Operator.

• Deep Research: параллельный многошаговый поиск, сбор и сводка информации из источников.

• Генерирует файлы: PPTX, XLSX — и передаёт их пользователю.

• Терминал и API-вызовы: может компилировать код, делать git commit, вызывать REST API — всё внутри защищённой виртуальной машины.

• Подключает Gmail, GitHub, SharePoint/OneDrive (в рамках Deep Research) через OAuth.

• Защита от prompt-injection и «биологических фильтров».

🪼 Дополнительно:

• Фоновый режим: агент продолжает работу, даже если вы закрыли вкладку или переключились.

• В ChatGPT уже встроен Agent, но пока нельзя загружать файлы и запускать терминал.

• Доступ открыт подписчикам Pro → Plus / Team (в течение недель), Enterprise / Education — летом.

• Запускается через выпадающее меню (agent mode) или командой /agent.

📊 Скорость, лимиты, подписка:

• Цены прежние.

• Средняя задача — 10–15 мин, сложные кейсы — до часа. В OpenAI подчёркивают, что оптимизируют не скорость ответа, а успешность длинных цепочек действий.

• Лимиты: Pro — 400 запусков/мес, Plus / Team — 40.

📌 Ограничения на старте:

• Скорость выполнения

• Необходимость ручного подтверждения

• Блокировка финансовых операций

• Нет запуска локальных десктоп-приложений

💡 ChatGPT Agent — крупный шаг вперёд по сравнению с Operator и Deep Research: единая среда, больше инструментов, обучение с подкреплением (RL) специально под длинные цепочки действий.

А что делают конкуренты?

Anthropic тестирует Computer Use, Google Gemini 2.0 добавил собственного браузерного агента, а Perplexity готовит автономный Research Copilot 🥳

🤖Saramudvlad