Найти в Дзене
Герман Геншин

Искусственный интеллект: ваш идеальный помощник в браузере?

Оглавление

Итог

Как меня знают, я всегда с настороженностью отношусь ко многим продуктам с приставкой "AI". Многие из них представляют собой просто уловки, а некоторые компании используют ИИ, чтобы легко привлечь инвесторов.

Но Agentic AI предлагает нечто полезное, о чем вы, возможно, еще не слышали — это браузеры.

Как работает Agentic AI в браузерах

Недавно меня пригласили на событие Opera Browser Days в Лиссабоне, Португалия. Там я смог увидеть, среди прочего, живую демонстрацию новой функции под названием Оператор. Это своего рода расширение встроенного чат-бота Aria в браузере, которое может выполнять действия по вашим текстовым командам.

Вы можете поручить ему купить что-то на сайте, найти и забронировать отель или Airbnb, заполнить форму, купить авиабилеты... Всё, что кажется "утомительным" в вашем повседневном серфинге по интернету, вы должны быть в состоянии передать Оператору, когда он активен.

Ваша задача — чётко указать, что именно ему делать, и предоставить как можно больше деталей. Например, если вы хотите купить билеты на мероприятие, скажите ему, на каком сайте это сделать, какое место вы хотите занять и сколько готовы заплатить.

Подобно тому, как вы не должны засыпать за рулём беспилотного автомобиля, следите за тем, что делает Оператор, и будьте готовы взять управление в свои руки в любой момент. Если он дойдёт до оформления заказа и не сможет завершить покупку из-за отсутствия данных вашей кредитной карты, лучше подождать, пока он не сдастся, и ввести данные самостоятельно, чем бездумно доверять свои данные ИИ, по понятным причинам. Тем не менее, это очень интересно.

Во время живой демонстрации, показанной нашей редакции, команда Opera заставила Оператора зайти на сайт доставки цветов, выбрать желтые цветы, купить их и доставить в номер отеля одного из присутствующих журналистов. Цветы были доставлены на следующий день, как если бы их купил человек.

По словам компании, Оператор глубоко проникает в структуру сайта и анализирует его, а не просто смотрит на основные элементы и кнопки, пытаясь угадать, как они работают. Он "читаёт" страницу, чтобы понять, как выполнять действия, такие как клики, ввод текста и навигация.

Учтите, у этого Оператора ещё много недостатков, которые нужно исправить, именно поэтому Opera пока не назначила конкретные сроки выпуска. Во время демонстрации были неудачи, из-за которых он либо не выполнил что-то должным образом, либо не справился с определенной задачей. Это проблема, с которой сталкиваются многие агентные ИИ сегодня—об этом позже. Но когда всё будет готово к запуску, я думаю, что браузер — отличная база для этой технологии.

Сравнение с другими агентными ИИ

-2

Несмотря на то, что это впечатляюще, внимательные читатели, вероятно, заметили, что это не совсем "новинка". Ещё одно сходное применение агентного ИИ — это Оператор ChatGPT, который в данный момент доступен только по платной подписке за $200 в месяц.

Как и реализация Opera, Оператор ChatGPT может просматривать интернет и выполнять действия за вас. Но есть важное отличие: ChatGPT работает на удаленном сервере, а Оператор Opera работает непосредственно в вашем браузере, используя куки и данные о просмотре, которые уже есть — и компания заверяет, что эти данные никогда не покинут ваш браузер, пока вы его используете.

Оператор ChatGPT просматривает веб за вас

Но чудес не ждите.

Важно отметить, что реализация ChatGPT также часто сталкивается с проблемами. Лучший способ сделать таких агентов более эффективными, вероятно, заключается в обучении их на конкретных сайтах, потому что именно поэтому пилотные программы, такие как функция "Купи за меня" Amazon или действия Microsoft Copilot, работают только на ограниченном количестве сайтов. Я бы предположил, что конечная цель — достичь такого универсального режима, каким сейчас пользуются ChatGPT и Opera, но, если сразу предоставить полную функциональность, гораздо проще выявить недостатки.

Агентный ИИ — это достаточно обширный термин. Агентный ИИ — это просто ИИ, который может самостоятельно принимать решения и выполнять задачи без вмешательства пользователя. Исходя из этого, мы также имеем бесконечное число приложений агентного ИИ — "Операторы", которые могут выполнять задачи за вас в браузере, это лишь один из их видов. Это именно то, о чем я упомянул в начале статьи, говоря, что это следует тому же уловочному пути, каким шли другие ИИ: некоторые из них действительно полезны, но многие просто не будут использоваться более одного или двух раз.

Существуют также способы запуска локальных ИИ моделей, которые могут выполнять автономные действия, такие как AnythingLLM. Тем не менее, большинство людей, вероятно, не захотят устанавливать локальный LLM на своем компьютере или смартфоне, поэтому это, вероятно, хороший промежуточный вариант.

Агентный ИИ — это следующий большой шаг, но стоит ли он мне?

ИИ может действовать за нас, но стоит ли нам это позволять?

Действительно ли это стоит?

То, будет ли это "целесообразно", зависит от того, как в конечном итоге будет выглядеть реализация этой функции. В конце концов, у нас сейчас только прототипы. Opera пока не назначила конкретные сроки для выхода этой функции — хотя её могут выпустить в ближайшие месяцы, очевидно, что ей ещё нужно время. Но я считаю, что это может стать тем, что люди станут использовать каждый день.

При более быстрой и точной реализации вы могли бы заставить Оператора сражаться на сайте продаж билетов на концерты, чтобы выиграть билеты по обычной цене, или пожилой человек мог бы использовать его для выполнения задач, с которыми он сам не справляется. Конечно, это зависит от того, улучшится ли он действительно.

Я верю, что это может стать действительно полезным инструментом, если его правильно развивать, и не исключаю, что другие браузеры — как минимум некоторые из менее известных — попытаются реализовать подобную версию в будущем. Хотя я бы не назвал это кардинальным изменением для себя в его нынешней реализации, так как он не делает ничего быстрее, чем я сам. Если признаться, я бы потратил больше времени на преодоление частых проблем, с которыми он сталкивался. Но у него есть потенциал. Надеюсь, к моменту выхода это будет более отточенный продукт.

Если вам понравилась эта статья, подпишитесь, чтобы не пропустить еще много полезных статей!

Вы также можете найти наши материалы в: