Интеллектуальные инновации искусственного интеллекта

20 подписчиков

Codex перестал быть просто ИИ для кода: мой реальный тест Computer Use на Mac

30 апреля30 апр

10 мин

Я долго воспринимал Codex как обычный инструмент для работы с кодом. Но всё изменилось в тот момент, когда я дал ему одну задачу на Mac Mini — и он сам открыл программу, настроил её, дошёл до сетевого окружения и фактически довёл работу до конца. Честно говоря, после этого теста я иначе посмотрел и на OpenAI, и на будущее ИИ‑агентов.

Я думал, Codex — просто редактор. А он взял и настроил программу на моём Mac сам Честно говоря, я не ожидал, что в ближайшие месяцы OpenAI сможет меня чем‑то по‑настоящему удивить. У меня давно было ощущение, что компания немного притормозила: рынок ИИ развивается стремительно, конкуренты шумят, выпускают новые режимы работы, агентские сценарии, интеграции, а OpenAI как будто держит паузу. Но после одного практического теста я своё мнение пересмотрел. Я протестировал Computer Use в приложении Codex на Mac Mini, и этот опыт оказался для меня одним из самых сильных впечатлений за последнее время в теме ИИ‑инструментов. Причём важно: у меня был не платный, а

Оглавление

До этого я воспринимал Codex очень скромно
Я дал ему задачу, с которой сам не справился
Самое интересное началось, когда дело дошло до сетевого окружения

Честно говоря, я не ожидал, что в ближайшие месяцы OpenAI сможет меня чем‑то по‑настоящему удивить.

У меня давно было ощущение, что компания немного притормозила: рынок ИИ развивается стремительно, конкуренты шумят, выпускают новые режимы работы, агентские сценарии, интеграции, а OpenAI как будто держит паузу. Но после одного практического теста я своё мнение пересмотрел.

Я протестировал Computer Use в приложении Codex на Mac Mini, и этот опыт оказался для меня одним из самых сильных впечатлений за последнее время в теме ИИ‑инструментов.

Причём важно: у меня был не платный, а бесплатный доступ, и на момент запуска у меня оставалось всего 23% недельного лимита. Я был почти уверен, что этого не хватит даже на десятую часть реальной задачи. Но всё получилось совсем иначе.

До этого я воспринимал Codex очень скромно

Если говорить честно, раньше я смотрел на Codex как на некий рабочий ИИ‑редактор.

То есть как на инструмент, которому можно показать папку, дать контекст, попросить поправить код, что‑то подсказать, где‑то помочь. Полезно — да. Но не более. У меня вообще не было ожидания, что такой продукт сможет выполнять на компьютере действительно прикладные и «живые» задачи.

Именно поэтому мой тест начался почти из любопытства.

Я установил в приложении Codex функцию Computer Use. Если говорить совсем просто, это режим, в котором агент может работать с графическим интерфейсом: видеть экран, открывать приложения, нажимать кнопки, вводить текст и проходить шаги примерно так, как это делает человек.

Когда я спросил у Codex, что именно умеет эта функция, он ответил, что может видеть то, что происходит на компьютере, и взаимодействовать с приложениями. Для меня это уже звучало амбициозно, но всё ещё немного абстрактно. Поэтому я решил не обсуждать, а сразу проверять в реальном сценарии.

Я дал ему задачу, с которой сам не справился

У меня была конкретная проблема: одна программа, которую я сам не смог нормально настроить.

Я описал задачу. Без длинной многоходовки. По сути — одним промптом.

И дальше началось то, чего я, честно, не ожидал.

Codex действительно открыл нужную программу и начал выполнять настройку. Не в формате «вот вам инструкция, сделайте сами», а именно как агент: последовательно, по шагам, через интерфейс, через окна, через реальные действия в системе.

Это был очень важный для меня момент. Потому что раньше многие ИИ‑инструменты казались «умными советчиками», но не полноценными исполнителями. Здесь же у меня впервые возникло ощущение, что передо мной не просто модель, а цифровой помощник, который реально делает работу.

Самое интересное началось, когда дело дошло до сетевого окружения

Сначала я ещё относился к происходящему с осторожным скепсисом.

Да, агент писал отчёты в чате: что он сделал, какие шаги выполнил, что проверил. Некоторые действия я визуально не успевал отследить и даже подумал, что, возможно, это баг или особенности новой функции. Всё‑таки Computer Use — это не старая, обкатанная десятилетиями история, а довольно свежий сценарий взаимодействия.

Но затем Codex сообщил, что основная часть настройки завершена, и осталось настроить сетевое окружение, включая прокси, чтобы программа заработала корректно.

Вот тут я уже почти не верил в успех.

Потому что одно дело — открыть приложение и пройтись по пунктам меню. Совсем другое — лезть в настройки окружения, понимать, что именно мешает работе, и доводить всё до запуска. В моей голове это всё ещё не укладывалось. Я продолжал сравнивать происходящее с тем, как обычно работают другие модели: сильные в тексте, сильные в рассуждении, но не всегда убедительные в реальном операционном действии.

И всё же я решил продолжить тест и разрешил ему идти дальше.

И программа в итоге заработала

Именно в этот момент я был уже не просто впечатлён, а по‑настоящему поражён.

Codex довёл настройку до конца. Да, на тестовом компьютере мне пришлось вручную подтвердить отдельные системные разрешения macOS — и это абсолютно нормально. OpenAI прямо указывает, что для Computer Use на macOS нужны системные разрешения вроде Screen Recording и Accessibility, иначе агент не сможет видеть экран и взаимодействовать с интерфейсом. Это не недостаток, а стандартная логика безопасности системы.

Но главный результат в другом: после настройки программа заработала.

Для меня это стало очень сильным сигналом. Потому что в тот момент я увидел не очередной «ИИ, который красиво пишет», а инструмент, который может брать на себя кусок реальной прикладной работы пользователя.

Почему этот опыт вообще важен

Здесь дело даже не в конкретной программе, которую я тестировал.

Главное — в смене парадигмы.

Раньше, чтобы автоматизировать взаимодействие между системами, почти всегда нужны были API, интеграции, коннекторы, плагины, специальные мосты между сервисами. Всё это долго, дорого и часто требует разработчиков.

Теперь появляется другая логика: если агент способен видеть интерфейс и пользоваться им как человек, то ему уже не всегда нужен отдельный API для каждой задачи.

Именно это делает Computer Use настолько интересным. OpenAI сама пишет, что Codex может использовать компьютер, «видя, кликая и печатая» в приложениях macOS, в том числе там, где не хватает CLI‑инструментов или структурированных интеграций. Это особенно полезно для:

проверки десктопных приложений,
изменения настроек через UI,
работы с источниками данных без плагинов,
воспроизведения багов, которые проявляются только в графическом интерфейсе,
фоновых задач, пока пользователь занят своим делом.

То есть речь уже идёт не просто о чат‑боте. Речь идёт о рабочем агенте.

Что мне особенно понравилось

1. Прозрачность работы

Агент не просто молча что‑то делает, а пишет, какие действия выполняет и к чему пришёл. Это снижает тревожность пользователя и даёт понимание, что вообще происходит.

2. Уточнения по делу

Когда нужно, он действительно спрашивает. И не ради формальности, а тогда, когда без этого уже нельзя продолжать безопасно.

3. Один промпт — и длинная задача не развалилась

Меня удивило, что мне хватило по сути одного качественно сформулированного запроса, чтобы получить почти полную настройку от начала до конца.

4. Он не бросил задачу на полпути

Это, возможно, впечатлило меня сильнее всего. Несмотря на то что бесплатный лимит у меня фактически заканчивался, последнее сообщение агента было очень человеческим по сути: программа настроена, осталось только перезапустить её, если будут вопросы — пишите.

В этом есть важная психологическая деталь. Он не оборвал процесс на середине, не «умер» в тот момент, когда стало сложно, а довёл задачу до логического финала и выдал понятный результат.

Для пользователя это воспринимается почти как работа нормального исполнителя.

Бесплатный доступ — это демонстрация, платный — уже инструмент

После этого теста у меня сформировалось довольно чёткое мнение.

Бесплатные лимиты Codex — это хороший способ попробовать продукт, протестировать один сценарий, почувствовать, как это работает. Но для регулярной работы, особенно если у вас действительно есть стек задач, этого недостаточно.

А вот платная версия уже выглядит как инструмент, который годится не только для энтузиастов, но и для реальных рабочих сценариев.

Причём я бы даже сказал так: если выбирать между обычным использованием ChatGPT и отдельным использованием Codex для практических задач на своём компьютере, то во многих случаях я бы рекомендовал смотреть именно в сторону Codex.

Почему? Потому что это уже не просто разговор с моделью. Это возможность:

поручить настройку,
поручить проверку,
поручить повторяющийся сценарий,
работать с программами и интерфейсами,
создавать навыки или заготовки под типовые действия.

Если у вас есть хобби‑проект, домашний проект, техническая рутина или небольшие бизнес‑процессы, то такой формат использования ИИ начинает приносить уже не впечатление, а практическую выгоду.

А как же Claude Code и Anthropic?

Сразу скажу: я не из тех, кто любит делать вид, будто на рынке есть только одна компания.

У Anthropic есть сильные модели, сильное сообщество, сильные сценарии работы, особенно там, где вокруг продукта уже выросла экосистема навыков, заготовок и подходов. Это нельзя игнорировать.

Более того, у Claude Code очень заметное сообщество: пользователи сами публикуют навыки, сценарии, инструкции, и за счёт этого продукт получает дополнительную ценность.

Но если говорить о моём текущем ощущении именно после практического теста, то сегодня я бы выбрал Codex.

Почему:

продукт явно развивается и не выглядит заброшенным;
есть реальный акцент на агентскую работу;
Computer Use делает его ближе к живому помощнику, а не просто к умной модели;
он уже умеет работать в реальном интерфейсе, а это огромный плюс для множества прикладных задач.

Да, у Codex пока меньше сообщества вокруг навыков и пользовательских заготовок. Да, некоторые вещи под себя, возможно, придётся настраивать и описывать самостоятельно. Но это вопрос времени. Если продукт продолжит развиваться в том же темпе, сообщество вокруг него тоже начнёт расти.

Почему я вообще считаю это прорывом

На мой взгляд, главное нововведение здесь не в том, что ИИ научился нажимать на кнопки.

Главное — в том, что OpenAI сделала важный шаг к агентским системам, которые не просто рассуждают, а выполняют задачу в пользовательской среде.

Сама OpenAI описывает обновлённый Codex как инструмент, который может:

работать с приложениями на компьютере,
действовать в фоне,
использовать встроенный браузер,
помнить контекст,
подключать плагины,
автоматизировать повторяющуюся работу.

Это уже довольно серьёзный сдвиг.

Если раньше ИИ был в основном «мозгом без рук», то теперь у этого мозга появляются руки, глаза и рабочее место.

И именно поэтому я считаю, что OpenAI в этот раз действительно выкатила не косметическое улучшение, а функцию, которая меняет пользовательский опыт.

Но важный момент: не надо впадать в эйфорию

При всей моей позитивной оценке, здесь важно не превращать обзор в фанатский восторг.

У Computer Use есть ограничения, и их нужно честно признавать.

Во‑первых, такие функции требуют доверия и внимания. Если агент работает с окнами, браузером, настройками и приложениями, пользователь должен понимать, к чему он даёт доступ.

Во‑вторых, в чувствительных сценариях — безопасность, платежи, учётные записи, системные параметры, приватные данные — обязательно нужен контроль со стороны человека. OpenAI сама рекомендует присутствовать при таких действиях и внимательно проверять разрешения.

В‑третьих, агентская работа через интерфейс — это мощно, но не магия. Где есть хороший API или структурированная интеграция, там иногда именно они останутся лучшим вариантом. Computer Use особенно силён там, где ничего другого просто нет или где нужно визуально пройти реальный пользовательский сценарий.

Мой вывод после теста

Я начинал этот тест с довольно прохладным отношением.

Думал, что Codex — это максимум аккуратный помощник по коду и не более. Думал, что бесплатного лимита не хватит ни на что серьёзное. Думал, что сетевое окружение он точно не сможет довести до рабочего состояния.

Но по факту я увидел совсем другое.

Я увидел инструмент, который:

реально работает на Mac,
умеет действовать в интерфейсе,
способен настраивать программу,
не теряется на многосоставной задаче,
и при этом создаёт ощущение не «чата с моделью», а настоящего цифрового помощника.

И да, давно у меня не было такого впечатления от нового ИИ‑функционала.

Если OpenAI продолжит развивать именно это направление, то Codex вполне может стать одним из самых сильных практических ИИ‑инструментов не только для разработчиков, но и для обычных пользователей, которым нужно не поговорить с нейросетью, а делегировать ей реальную задачу.

А теперь главный вопрос к вам:

Если ИИ уже умеет не только отвечать, но и реально работать за вас на компьютере — готовы ли вы доверить ему свою первую практическую задачу?