Добавить в корзинуПозвонить
Найти в Дзене
Social Mebia Systems

Как создавался ChatGPT Agent: эксклюзивные детали от команды OpenAI

В июле 2025 года команда OpenAI впервые подробно рассказала о внутренней кухне разработки ChatGPT Agent — универсального искусственного интеллекта, способного выполнять сложные, многошаговые задачи на компьютере, интегрируя текст, визуальные элементы, терминал и API. В интервью с партнёрами Sequoia Capital (Соня Хуан и Лорен Ридер) ключевые разработчики OpenAI — Иса Фулфорд, Кейси Чу и Сунь Чжицин — раскрыли, как им удалось объединить разные подходы и создать по-настоящему самостоятельного цифрового помощника. Как всё начиналось: слияние Deep Research и Operator Проект ChatGPT Agent вырос из двух независимых продуктов: Deep Research (для поиска и анализа информации в интернете) и Operator (для выполнения интерактивных задач, например, онлайн-покупок). Deep Research хорошо справлялся с текстом, Operator — с визуальными элементами и действиями на сайтах. Пользователи хотели, чтобы оба инструмента работали вместе, и команда решила объединить их в единую архитектуру. В результате появился

В июле 2025 года команда OpenAI впервые подробно рассказала о внутренней кухне разработки ChatGPT Agent — универсального искусственного интеллекта, способного выполнять сложные, многошаговые задачи на компьютере, интегрируя текст, визуальные элементы, терминал и API.

В интервью с партнёрами Sequoia Capital (Соня Хуан и Лорен Ридер) ключевые разработчики OpenAI — Иса Фулфорд, Кейси Чу и Сунь Чжицин — раскрыли, как им удалось объединить разные подходы и создать по-настоящему самостоятельного цифрового помощника.

Как всё начиналось: слияние Deep Research и Operator

Проект ChatGPT Agent вырос из двух независимых продуктов: Deep Research (для поиска и анализа информации в интернете) и Operator (для выполнения интерактивных задач, например, онлайн-покупок).

Deep Research хорошо справлялся с текстом, Operator — с визуальными элементами и действиями на сайтах. Пользователи хотели, чтобы оба инструмента работали вместе, и команда решила объединить их в единую архитектуру.

В результате появился виртуальный компьютер, где Agent может одновременно использовать текстовый браузер, визуальный браузер (для кликов, заполнения форм, скроллинга), терминал (для запуска кода, анализа файлов, создания таблиц и презентаций) и API-интеграции (GitHub, Google Drive, SharePoint и др.). Все инструменты работают в едином пространстве и могут обмениваться данными, как приложения на обычном компьютере.

Технологический прорыв: обучение через виртуальные машины и RL

Вместо жёстко заданных сценариев команда OpenAI использовала подход с виртуальными машинами и обучением с подкреплением (RL). Модель сама училась выбирать нужные инструменты и строить оптимальные стратегии для решения задач — от поиска информации до генерации презентаций и автоматизации сложных рабочих процессов. Для этого запускались тысячи виртуальных машин, где Agent экспериментировал с разными задачами, а команда вручную отбирала качественные обучающие примеры.

Такой подход позволил Agent-у не только выполнять длинные задачи (до часа и более), но и гибко переключаться между инструментами, запоминать контекст, принимать уточнения и корректировки от пользователя в процессе работы.

Применение: от исследований до автоматизации бизнеса

ChatGPT Agent задуман как универсальный инструмент для самых разных сценариев:
— Генерация подробных отчётов и исследований с цитатами
— Автоматизация онлайн-покупок, бронирования, работы с документами
— Создание и анализ электронных таблиц, презентаций, визуализаций
— Интерактивная работа с данными, кодом, файлами
— Персональные ассистенты для планирования, поиска, анализа

Пользователь может поставить задачу и уйти — Agent сам выполнит все шаги, а по возвращении предоставит готовый результат. В процессе работы можно вносить коррективы, уточнять детали, а Agent будет подстраиваться под новые требования.

Безопасность: многоуровневая защита и контроль

Поскольку Agent может взаимодействовать с внешними сервисами, совершать действия от имени пользователя, вопрос безопасности стал ключевым. В OpenAI внедрили многоуровневую защиту:
— Внутренние и внешние "красные команды" (red teaming)
— Системы мониторинга в реальном времени, которые останавливают подозрительные действия
— Запросы на подтверждение при чувствительных операциях (например, вход в аккаунты, оплата)
— Быстрая реакция на новые угрозы, обновления "антивируса"
— Специальные меры против биорисков и других опасных сценариев

Команда и культура: маленькие группы, кросс-функциональное взаимодействие

Над Agent работала небольшая команда (около 10 человек), где исследователи и инженеры тесно сотрудничали, вместе определяли продуктовые функции и обучали модель. Такой формат позволил быстро тестировать гипотезы, оперативно реагировать на проблемы и внедрять новые возможности.

Главные вызовы и будущее

Среди главных технических сложностей — обеспечение стабильности работы в условиях реального интернета (сбои сайтов, ограничения API, нестабильные соединения), а также поддержка долгих и сложных задач с сохранением контекста.

В будущем команда планирует:
— Развивать память и персонализацию Agent-а, чтобы он мог сам предлагать решения и действовать проактивно
— Улучшать интерфейсы (в том числе голосовые и мультимодальные)
— Довести Agent до уровня универсального цифрового помощника, способного выполнять почти любые задачи на компьютере
— Постепенно снижать зависимость от ручного контроля и увеличивать автономность

Универсальный или специализированный агент?

OpenAI делает ставку на одного универсального Agent-а, который сможет решать задачи из разных областей, а не на множество узкоспециализированных ботов. Такой подход позволяет использовать навыки, полученные в одной сфере, для решения задач в другой, и быстрее масштабировать возможности.

Заключение

ChatGPT Agent — это шаг к настоящему цифровому ассистенту, который сможет взять на себя рутину, автоматизировать сложные процессы и стать незаменимым помощником для каждого пользователя.

В ближайшие годы OpenAI планирует сделать Agent всё более самостоятельным, умным и безопасным, чтобы он мог выполнять почти любые задачи, которые сегодня человек делает за компьютером.

Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.

ИИ сегодня — ваше конкурентное преимущество завтра!

Тел. +7 (985) 982-70-55

E-mail sms_systems@inbox.ru

Сайт https://www.smssystems.ru/razrabotka-ai/