Hermes Agent получил Computer Use для macOS
Nous Research представила раннюю предварительную версию Computer Use для Hermes Agent. Функция позволяет AI-агенту управлять рабочим столом Mac: кликать, печатать, скроллить, перетаскивать элементы и выполнять действия в приложениях. По документации Hermes Agent, агент работает в фоне: курсор пользователя не двигается, фокус клавиатуры не меняется, а macOS не переключает рабочие пространства вслед за агентом.
Релиз сделан в партнёрстве с Cua - open-source проектом для Computer-Use Agents. Cua развивает инфраструктуру для агентов, которые могут работать с полноценными десктопными окружениями, включая sandbox, SDK и бенчмарки.
Главная особенность анонса - заявленная совместимость с любыми tool-capable моделями. В документации перечислены Claude, GPT, Gemini и open-source модель на локальном vLLM endpoint. Для пользователей Hermes Agent это открывает сценарий, где управление компьютером привязано к инструментальному слою агента, а не к одному поставщику модели.
Управление в фоне стало главным UX-аргументом
Computer Use в Hermes Agent делает ставку на фоновое управление Mac. Это важная деталь для пользовательского опыта: ранние GUI-агенты часто мешали работе, потому что забирали курсор, переключали окна или требовали отдельной машины.
Cua описывает такой подход как background computer-use. В разборе проекта сказано, что cua-driver позволяет агенту управлять приложениями macOS без перемещения курсора, смены фокуса и переходов между Spaces. Там же команда прямо связывает проблему adoption с привычной моделью «один курсор и одна клавиатура для одного активного окна».
Это сильный редакционный угол новости. Речь идёт не о демонстрации «агент нажимает кнопки», а о попытке сделать управление компьютером менее раздражающим для реальной работы. Если агент можно оставить в фоне, функция становится ближе к повседневной автоматизации, а не к демо для X.
Как устроена интеграция с Cua
В Hermes Agent режим Computer Use работает через computer_use toolset. Он общается по MCP через stdio с cua-driver , macOS-драйвером Cua. Драйвер использует приватные Apple SPI, включая SkyLight, чтобы отправлять синтетические события напрямую целевым процессам, не двигая общий курсор.
На практике пользователь должен установить и включить cua-driver , выдать разрешения macOS на Accessibility и Screen Recording, затем запустить сессию Hermes Agent с включённым computer_use . В документации приводится пример: агент может открыть Mail, найти последнее письмо от Stripe, прочитать его и кратко пересказать, что от пользователя требуется.
Видео-демонстрация в посте Nous Research, по данным ветки в X, была создана самим Hermes Agent с использованием навыка HyperFrames. Пост опубликован 12 мая 2026 года в 1:10 AM и набрал 281,5 тыс. просмотров на момент фиксации этих данных.
Open-source модели становятся частью сценария
В обсуждении под постом пользователи уточняли, работает ли Computer Use с open-source моделями и требуется ли vision-модель. Nous Research подтвердила поддержку open-source моделей, а в документации отдельно указала локальный vLLM endpoint как один из вариантов.
Для open-source сообщества это заметнее самой кнопки Computer Use. Управление компьютером постепенно становится слоем инфраструктуры: модель планирует действие, инструмент выполняет его в системе, а агент держит контекст задачи. Успех такой схемы будет зависеть от надёжности tool calls, восстановления после сбоев и качества визуального понимания интерфейса.
Здесь остаётся слабое место. Формулировка «any model» звучит широко, но в реальности агенту всё равно нужны способности к работе с инструментами, контекстом и состоянием workflow. Модель, которая формально подключается к инструменту, может проваливаться на длинных цепочках действий или терять нить после ошибки.
Ограничение пока упирается в macOS
Computer Use в Hermes Agent сейчас ограничен macOS. В документации прямо указано, что cua-driver использует приватные Apple SPI, которых нет в Linux и Windows. Для кроссплатформенной GUI-автоматизации команда предлагает использовать browser toolset.
Это уже вызвало вопросы в обсуждении под постом: пользователи отдельно жаловались на отсутствие Windows и Linux, а часть комментариев просила яснее указывать Mac-only статус. Такая реакция ожидаема. Computer Use звучит как универсальная функция агента, но первая реализация завязана на особенности macOS.
Есть и другой риск: зависимость от приватных API Apple. Hermes Agent предупреждает, что Apple может изменить поверхность SkyLight в обновлениях macOS. Для ранней preview-версии это нормальная оговорка, но для массового сценария такая зависимость может стать проблемой сопровождения.
Ранний preview вместо зрелого продукта
Nous Research продвигает Computer Use как раннюю предварительную версию. Основатель проекта Teknium также призвал попробовать early preview. Это важная формулировка для читателя: функцию лучше воспринимать как экспериментальную интеграцию, а не как стабильный слой автоматизации для всех рабочих процессов.
Новость выглядит заметной из-за сочетания трёх факторов: Hermes Agent уже позиционируется как автономный open-source агент, Cua даёт ему фоновое управление Mac, а поддержка разных моделей расширяет сценарий за пределы закрытых API. Главная проверка начнётся в обычных задачах: почта, браузер, документы, IDE, терминал и длинные цепочки действий, где агенту придётся не красиво нажать кнопку, а не потерять задачу после третьей развилки.