Найти в Дзене
DigiNews

ИИ сделал “Command Line Interface” важнее и функциональнее, чем когда-либо

Мнение: Google понимает, что просить агентов ориентироваться в GUI, созданных для людей, нелепо. Microsoft может этого не осознавать. Возвращение CLI как универсального интерфейса для автономных агентов. — theregister.com Мнение Интерфейс командной строки (CLI) возвращается, поскольку графические интерфейсы пользователя (GUI) плохо подходят для автономных агентов, что может обернуться проблемами для многих программ и их разработчиков. Сорок лет назад все успешные программы могли похвастаться продуманным GUI, а продукты без него не имели шансов. Хорошие графические интерфейсы снижали когнитивную нагрузку, связанную с работой с программой, — бремя, которое резко уменьшилось по мере унификации пунктов меню и жестов мыши в программном обеспечении. Поскольку интерфейс WIMPS (Windows, Icons, Menus, Pointers — Окна, Иконки, Меню, Указатели) стал повсеместным, освоение одной программы означало, что пользователь знал почти всё необходимое для работы с любой другой. Сегодня это настолько очевидн

Мнение: Google понимает, что просить агентов ориентироваться в GUI, созданных для людей, нелепо. Microsoft может этого не осознавать. Возвращение CLI как универсального интерфейса для автономных агентов. — theregister.com

Мнение Интерфейс командной строки (CLI) возвращается, поскольку графические интерфейсы пользователя (GUI) плохо подходят для автономных агентов, что может обернуться проблемами для многих программ и их разработчиков.

Сорок лет назад все успешные программы могли похвастаться продуманным GUI, а продукты без него не имели шансов. Хорошие графические интерфейсы снижали когнитивную нагрузку, связанную с работой с программой, — бремя, которое резко уменьшилось по мере унификации пунктов меню и жестов мыши в программном обеспечении.

Поскольку интерфейс WIMPS (Windows, Icons, Menus, Pointers — Окна, Иконки, Меню, Указатели) стал повсеместным, освоение одной программы означало, что пользователь знал почти всё необходимое для работы с любой другой. Сегодня это настолько очевидно, что мы даже не задумываемся об этом, но в те времена это было настоящей революцией.

Так не могло продолжаться вечно. Ясность классического GUI сменилась рококошными излишествами «лент» и «плавающих панелей» — парадом визуальных украшений, вызывающих сахарный спад замешательства. Сегодня мы, скорее всего, будем тратить минуты на поиски пункта меню, спрашивая себя: «В прошлый раз я его видел здесь, его убрали после обновления?»

Разработчики переделывали свои надежные интерфейсы, заменяя их чем-то менее полезным; вспомните печально известный случай, когда Apple испортила свой лидирующий на рынке FinalCut Pro (FCP), тем самым отдав рынок Adobe.

Измените интерфейс слишком сильно или слишком часто, и вся эта когнитивная нагрузка возвращается. Программа, которая должна быть невидимым помощником продуктивности, становится обузой: я отказался от FCP в пользу Premiere и ни разу не пожалел.

Автономные агенты сейчас переживают тот же кошмар — насколько это возможно для машины, — поскольку мы поручаем им работать с компьютерами от нашего имени, а они вынуждены пытаться изучать плохие GUI, чтобы управлять ими.

Агенты должны делать снимок экрана, передавать изображение в языковую модель, анализировать результаты, менять подход, используемый для попытки выполнения наших желаний, и повторять это до тех пор, пока не завершат любую задачу, поставленную человеком.

Плохие интерфейсы делают этот процесс медленным и неоправданно сложным: интерфейс, который изначально был создан для облегчения бремени людей, превратился в балласт как для людей, так и для наших агентов.

Нигде это не проявляется так ярко, как в программном обеспечении, которым пользуются почти все: Microsoft Office365Copilot (я правильно запомнил? они часто меняли название). Три года назад Microsoft внедрила свое ПО Copilot AI во все эти приложения, полагая, что, постоянно добавляя приложения в свой пакет без существенного повышения цен, она наконец-то представила автоматизацию офиса нового поколения и нашла способ ощутимо увеличить стоимость подписок.

Microsoft ошиблась. Гигант программного обеспечения оказался слишком рано и не в том месте, неправильно поняв, как люди используют ИИ. Редмонд поместил своих помощников внутрь приложений. Там они никому по-настоящему не нужны, поскольку обладают только локальным контекстом. Отключенные от мира, эти помощники не могли сделать многого — и люди быстро научились их игнорировать.

Вместо этого мы видим, как люди используют агентов — таких как Openclaw, Nanoclaw и многое другое — для управления приложениями. Агент находится вне приложения, используя это приложение как один из многих инструментов, к которым он имеет доступ, оркеструя решение проблемы.

Для этого агенту нужен универсальный интерфейс, которым проще управлять, чем GUI.

Так что поприветствуйте — снова — интерфейс командной строки.

Бородачи из *nix и опытные пользователи PowerShell будут утверждать, что CLI никогда по-настоящему не исчезал — и они правы, но они также составляют исчезающе малый процент пользователей компьютеров. Для остальных CLI был чем-то, с чем мы могли столкнуться, только когда с нашими компьютерами что-то шло очень не так.

Внезапно CLI становится лучшим способом для нас выполнять работу с помощью компьютеров. Никто не хочет целый день возиться с Outlook. Мы просто хотим сказать нашему агенту: «Запланируй встречу». CLI делает такие задачи легкими как для агентов, так и для людей. По мере того как GUI теряет актуальность для следующего поколения интерфейсов агентов, преобразующих двусмысленность человеческого языка в действия, CLI становится интерфейсом. Всё остальное — помехи.

Google это понял и сделал ставку на это, на прошлой неделе выпустив gws — CLI для Google Workspace. Установка добавляет «навыки», чтобы научить вашего агента полностью манипулировать всеми вашими Google Docs, Drive, Calendar, GMail, Sheets — всем. Вся вселенная «офисного» ПО — ранее полностью зависевшая от человека, сидящего за настольным или мобильным GUI, — стала просто еще одним инструментом, которым агент может управлять, чтобы помочь вам достичь ваших целей.

Возможно, Microsoft ждет момент озарения, когда руководство компании осознает, что флагманское программное обеспечение получило серьезный удар и было превзойдено простым интерфейсным клеем.

Редмонд будет не единственной жертвой. Почти каждому крупному поставщику программного обеспечения скоро придется спешно разрабатывать CLI для своих продуктов, надеясь опередить конкурента или гиперактивного кодера, который предоставит ту же самую функциональность через интерфейс, совместимый с агентами. Вот как выглядит «SaaSpocalypse».

Пример: мой агент Openclaw по имени Клодин извлек всю нашу историю чатов из лог-файлов, экспортировав ее во что-то, что я мог использовать, потому что я не смог разобраться, как экспортировать ее из Telegram. (Подозреваю, это премиум-функция, вздох.) Мой агент позволил мне обойти ущерб от разросшегося до барокко программного обеспечения. Вскоре мы все будем делать нечто подобное, постоянно. Это навсегда изменит программное обеспечение. ®

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Mark Pesce

Оригинал статьи