Найти в Дзене

ИИ агенты - начало

Пусть название не вводит вас в заблуждение. “Начало” тут использовано в контексте того, что я делаю первые шаги в изучении ИИ Агентов. Поскольку тема достаточно специфическая, потребует довольно много времени на погружение, то этой статьей стартует новая подборка “Изучаем ИИ агенты”. При этом, предположительно, бОльшая часть материалов будет в видео формате, где я буду показывать, как реализовать то или иное действие. Это статья вводная, по которой вы сможете определить для себя, есть ли смысл лично вам читать/смотреть материалы по этой теме. Тема ИИ Агентов уже около года настойчиво звенит в моем информационном поле, но руки разобраться, что это за зверь, дошли только сейчас. Для начала, давайте объясню своими словами, что такое ИИ агент и чем он отличается от обычного бота Chat GPT и подобных моделей. ИИ агент - это система, способная получать внешние данные и принимать решения в зависимости от заданных инструкций. Конечным итогом должно быть выполнение какой-либо реальной задачи. О

Пусть название не вводит вас в заблуждение. “Начало” тут использовано в контексте того, что я делаю первые шаги в изучении ИИ Агентов. Поскольку тема достаточно специфическая, потребует довольно много времени на погружение, то этой статьей стартует новая подборка “Изучаем ИИ агенты”. При этом, предположительно, бОльшая часть материалов будет в видео формате, где я буду показывать, как реализовать то или иное действие.

Это статья вводная, по которой вы сможете определить для себя, есть ли смысл лично вам читать/смотреть материалы по этой теме.

Тема ИИ Агентов уже около года настойчиво звенит в моем информационном поле, но руки разобраться, что это за зверь, дошли только сейчас. Для начала, давайте объясню своими словами, что такое ИИ агент и чем он отличается от обычного бота Chat GPT и подобных моделей.

ИИ агент - это система, способная получать внешние данные и принимать решения в зависимости от заданных инструкций. Конечным итогом должно быть выполнение какой-либо реальной задачи. Обычный бот отличается тем, что он просто генерирует текст в ответ на запрос, который вы ему отправляете. В рамках создания агентов - бот является просто одним из инструментов обработки данных. Причем выполняет он ключевую роль - обеспечивает принятие решения на базе входных данных.

А ИИ агент - закрывает процессы. Например, разбор входящей электронной почты, отсеивание спама, принятие решения о срочности того или иного письма и выбирает совершаемое действие. Условно говоря, в примере с почтой, ИИ агент получает доступ к вашей почте, считывает непрочитанные сообщения, далее делает анализ содержимого, и основываясь на инструкциях, что вы ему задали, принимает решение, что с ним делать: сообщить вам в телеграм по специальному каналу, что есть срочное письмо от того-то с таким-то кратким содержанием или переложить в папку нежелательных писем… Может принять решение, что на то письмо требуется ответ и создаст черновик этого ответа.

Основной идеей при создании такого помощника, в моем понимании, должна быть возможность легко самому пользователю добавлять/изменять инструкции, чтобы агент “учился” и не делал одних и тех же ошибок дважды.

Наиболее популярной системой, которая позволяет проектировать ИИ агентов, в настоящее время является n8n. Крупицы знаний, которые мне удастся собрать, я буду собирать в статьях в этой новой подборке. Учиться предполагаю “на кошках”, ну то есть сначала буду делать ИИ помощника для решения каких-то своих простых, но при этом реальных прикладных задач. А дальше, чем больше ты этим занимаешься и больше опыта получаешь, тем проще становится генерировать новые пути использования того или иного инструмента.

В любом случае, мне, как представителю ИТ служб, занимающимся внедрением цифровых решений, изучить этот инструмент на уровне специалиста не помешает. Заодно покажу, как выглядит процесс самостоятельного обучения.

Постараюсь, по крайней мере вначале, писать/рассказывать простым языком для неайтишников, но по мере усложнения задач и материала это будет все менее реально. Из того, что я вижу на данном этапе, все эти настройки по сути представляют собой no-code программирование. Это значит, что для того, чтобы работать с этой системой, некоторые базовые навыки нужны. По крайней мере нужно понимать, что такое типы данных, способы их хранения и обмена. Какие бывают форматы данных и т.п. Простые понятия для записи алгоритмов: циклы, условия и операторы. Это все относительно простые вещи, которыми легко может овладеть любой человек с техническим образованием.

Вчера я начал изучение. Установил локально n8n и попробовал погонять простые сценарии. В системах создания ИИ агентов эти сценарии называются Workflow. Буквально “рабочий поток”.

Выглядит это на доске n8n вот так. Это самый простой сценарий для Агента.

Любой сценарий начинается с триггера. Под триггером подразумевается некоторое событие, которое является спусковым для нашего workflow. Например, “каждый день в 8.00” или “по получению сообщения в определенном чате”. В скрине выше, триггером является отправленная заполненная форма “Создать пользователя”.

Далее событие запускает цепочку процессов. В качестве входных данных может быть само сообщение, или инструкции, где их получить. Далее с этими данными что-то делается: они могут преобразовываться, обрабатываться, на их основе могут приниматься решения, и это как раз блоки, которые реализуются моделями типа Сhat GPT, далее эти данные приводят к какому-то результату. Результат может выражаться в том, что данные куда-то сохранили, отправили кому-то сами данные или же уведомление, где можно их посмотреть. Или же проделали какое-то действие: отправили почту, сделали запись в календаре, создали задачу в CRM и т.п.

С “ноги” ворваться не удалось

Основная проблема с темой агентов в том, что большинство туториалов, которыми кишит весь ютуб, практически бесполезны. Причем по разным причинам. Где-то показывают сценарий по своей пользе аналогичный hello world в программировании, а где-то сразу говорят, - “такс, заходим в свой аккаунт на облаке n8n и оплачиваем”.

В общем, если и есть толковые видео, то как правило они сложно реализуемы для обычного жителя РФ, которому, чтобы воспользоваться плодами этих программных продуктов, нужно решать проблем сразу кучу. И которые решить сходу не так просто.

VPN. Причем ирония в том, что некоторые сервисы требуют наличия включенного VPN, а некоторые выключенного.

Возможность оплаты забугорных сервисов

При локальной установке, нужно серверное ПО и понимание, как его настроить. Т.е. при установке нужно подключить домен, прикрутить SSL сертификат и понимать, как в Doсker разворачиваются приложения. Без всего этого будет доступна малая часть функционала… для обучения может и хватит, но вот что-то реально прикладное построить уже не удастся.

Если сейчас показалось, что я ругаюсь на незнакомом языке, не спешите паниковать. Далее я подскажу решение, чтобы с этим можно было разобраться в мягком режиме без необходимости бросать все и изучать. Понимаю, что такие аббревиатуры, когда даже не понимаешь, “к чему и зачем все это”, могут запросто отключать мозг. Еще раз призываю. “Не боги горшки обжигают”. Если интересно, то разберетесь.

Итак, для обучения я установил себе n8n локально. Однако, на свой личный комп устанавливать серверное ПО я не стал, т.к. там сразу встает вопрос обеспечения безопасности данных на моем компе, а это тема отдельная и довольно обширная, в которой я откровенно слаб. Когда же развернул n8n, то обнаружил, что тестировать и учиться локально я могу только на самых простых вещах. Например, я не могу в качестве триггера использовать тот же телеграмм сообщение, т.к. это работает через webhook, который я просто не могу принять без серверного ПО с прикрученным доменным именем и SSL сертификатом.

Следующий шаг - вступление в чат сообщества, где разработчики на n8n общаются и обмениваются опытом. В следующей статье, где буду уже давать конкретику, дам ссылку на ту группу, в которую вступил. Собственно, именно в этой группе я нашел решение, чтобы не париться с проблемами VPN, а также с необходимостью самому настраивать домен и SSL. Оказывается, есть проверенные хостеры, которые предлагают хостинг с предустановленным программным обеспечением и настройками. Стоимость таких хостингов для простых задач начинается от 700 рублей в сутки.

В следующей паре статья/видео мы начнем изучение этого несомненно мощного инструмента. Пока в качестве тренировки я попробовал реализовать получение данных из NASA по официальному руководству новичка. Также попробовал настроить простые действия, вроде подключения к чат боту Chat GPT, оснащенному инструкцией и отправкой ответов мне в телеграм бота. Это из того, что получилось сделать без проблем. Проблемы у меня начались, когда я обнаружил, что без серверного оборудования никак, что российский IP сильно усложняет жизнь, а многие сервисы (подавляющее большинство), напрочь отрезаны от вас, если вы не можете их оплатить или хотя бы подтвердить саму вашу возможность оплаты.

Как уже говорил, эта статья вступительная, весь движ начнется в следующем выпуске по этой теме. К сожалению, на 2 дня по сложным темам, где надо делать контент с видеокамерой и со скринами из n8n, я выпадаю, поскольку нахожусь один с младшей дочкой на даче. В этих условиях, в лучшем случае, смогу писать что-то о жизни и опыте… и то, если будет время и возможности.

Если есть желание начинать что-то изучать параллельно вместе со мной, то вот вам ссылки:

https://n8n.io/ - официальный сайт приложения

https://community.n8n.io/ - форум и англоязычное комьюнити

https://t.me/n8n_community - пока я только в этой группе в телеге, там общаются новички и практики внедрения на базе n8n. Много “школоты”, но есть и опытные люди, которые отвечают на вопросы новичков

Из вещей, которые, если не знаете, рекомендую поинтересоваться, что это такое? Можно погуглить или спросить у чатботов:

  • Что такое REST API;
  • Форматы данных JSON, XML;
  • Типы данных

В принципе, у меня есть уже понимание, какого “агента” я хочу создать для личного пользования и что он будет уметь делать. Это будет мой личный преподаватель английского языка, который должен будет развивать мой разговорный английский язык. Общаться я с ним должен иметь возможность с помощью голосовых сообщений и получать ответы по выбору либо в аудио или в текстовом формате. Даже если я только эту задачу реализую, то уже будет интересно и будет о чем снять видео.

Из ближайших планов, как вернусь - арендовать хостинг с предустановленным n8n с настроенным сертификатом и доменом в еврозоне. Это сразу снимает кучу проблем.

Если интересно, то добавляйтесь ко мне в телеграм канал. К нему подключен чат, в котором можно будет вести диалоги и делиться опытом.