20 подписчиков

ИИ дали рабочее место. Теперь он не просто советует — он делает

16 марта16 мар

3 мин

Ты наверняка пробовал это: просишь ИИ сделать что-то серьёзное — обработать таблицу, собрать отчёт, разобрать данные. Он кивает, рассуждает, предлагает шаги. А потом выясняется, что файл некуда сохранить, данные не влезают в чат, и после пятого уточнения он «забыл», с чего вы вообще начали. Умный — но без рук. Советует — но не делает. OpenAI решила это починить. И подход интереснее, чем кажется. Представь сотрудника, которому дали задачу — но не дали компьютера. Он может рассуждать вслух, диктовать инструкции, объяснять что надо сделать. Но сам ничего не откроет, не сохранит, не запустит. Именно так работал ИИ до недавнего времени. Умный мозг — без рабочего места. Теперь к модели добавили полноценную рабочую среду: отдельный изолированный «компьютер», где есть файловая система, командная строка и ограниченный доступ в интернет. Модель может скачать данные, обработать их, сохранить результат в файл — и передать тебе готовый артефакт, а не инструкцию как это сделать самому. Раньше сценар

Оглавление

Проблема была не в уме, а в условиях
Что это меняет на практике
Почему агент не теряет нить на длинных задачах

Умный — но без рук. Советует — но не делает.

OpenAI решила это починить. И подход интереснее, чем кажется.

Проблема была не в уме, а в условиях

Представь сотрудника, которому дали задачу — но не дали компьютера. Он может рассуждать вслух, диктовать инструкции, объяснять что надо сделать. Но сам ничего не откроет, не сохранит, не запустит.

Именно так работал ИИ до недавнего времени. Умный мозг — без рабочего места.

Теперь к модели добавили полноценную рабочую среду: отдельный изолированный «компьютер», где есть файловая система, командная строка и ограниченный доступ в интернет. Модель может скачать данные, обработать их, сохранить результат в файл — и передать тебе готовый артефакт, а не инструкцию как это сделать самому.

Что это меняет на практике

Раньше сценарий «сделай мне отчёт по продажам» выглядел так: ты копируешь таблицу в чат, ИИ объясняет что делать, ты делаешь сам, возвращаешься с вопросами, повторяешь.

Теперь данные можно положить в файловую систему — и модель сама откроет нужное, запросит только то, что нужно, обработает и выдаст результат. Примерно как ты сам: не печатаешь бухгалтерию в мессенджере, а работаешь с файлами.

Если данных много — модель может работать с ними как с базой: «покажи товары с падающими продажами за квартал», а не читать всё подряд.

Почему агент не теряет нить на длинных задачах

Была ещё одна классическая проблема: чем дольше работает агент, тем больше он «забывает» начало. Накапливаются промежуточные шаги, логи, результаты — и в какой-то момент он уже не помнит, что было двадцать шагов назад.

Решили это через механизм автоматического сжатия истории: когда разговор становится слишком длинным, модель сама делает краткое резюме — что уже сделано, что важно помнить — и продолжает с этим конспектом. Мусор выбрасывается, суть остаётся.

Звучит как очевидная вещь. Но без неё длинные задачи просто разваливались на полпути.

Интернет — но по пропуску

Агентам часто нужен интернет: подтянуть данные, обратиться к внешнему сервису, установить что-то нужное. Но «полный интернет» для автономного агента — это риск: он может случайно отправить что-то не туда или обратиться к подозрительному адресу.

Поэтому доступ устроен через прослойку с правилами: только разрешённые адреса, весь трафик под контролем. Секретные ключи модель вообще не видит — они подставляются автоматически только для нужных запросов.

Как сотрудник, которому выдали корпоративный ноутбук с настроенным файрволом. Интернет есть, но строго по пропуску.

Повторяемость: чтобы агент не изобретал велосипед каждый раз

Если запускать одного и того же агента дважды — он может сделать то же самое по-разному. Иногда лучше. Иногда хуже. Иногда решит, что в этот раз попробует совсем другой подход.

Для повторяемых задач добавили возможность упаковывать готовые сценарии: инструкции, скрипты, описания — всё в одном месте. Агент находит их, подхватывает и действует предсказуемо. Не потому что он стал менее творческим, а потому что у него теперь есть проверенный способ делать знакомое.

Это превращает агента из «умного, но непредсказуемого» в инструмент, на который можно положиться.

Что в итоге

Модель перестаёт быть умным собеседником и становится чем-то большим: исполнителем, у которого есть рабочий стол, файлы, доступ к данным и память на длинные задачи.

Пока это звучит как история для разработчиков. Но логика та же, что была с электронной почтой или таблицами: сначала инструмент выглядит сложным и техническим, потом становится привычным. А потом уже странно, что раньше делали как-то иначе.