Vladimir Sukhov | Нейросети, профессии и доход

549 подписчиков

ИИ агенты с нуля: как устроены, сколько стоят и кто будет нужен в 2026

15 июня15 июн

264

7 мин

Про ИИ агентов сейчас говорят все. Обещают, что они будут зарабатывать, пока вы спите, решать задачи без вашего участия и вообще изменят всё. Может, и правда. Но прежде чем строить что-то на этом фундаменте, стоит разобраться: кем именно в этой схеме становитесь вы сами? Ответ есть в конце Что вы узнаете из этой статьи: GPT расшифровывается как Generative Pre-trained Transformer. Звучит страшно, на деле проще: это программа, которая предугадывает следующее слово. Её обучили на огромном массиве текста из интернета - она видела миллиарды предложений и научилась понимать, что после каких слов идёт. Текст модель видит не словами, а токенами. Hello World на английском - это 2 токена. «Привет мир» на русском - уже 5. Именно за токены вы платите при использовании API. Размер модели измеряется параметрами (или весами). GPT-3 - 120 млрд параметров. Это числа, настроенные в процессе обучения. Чем больше параметров - тем, как правило, умнее модель, но и дороже инференс (то есть сам процесс генер

Оглавление

Сначала про нейросети, потому что без этого агенты непонятны
От нейросети к агенту: в чём разница
Что такое агент и из чего он состоит

Что вы узнаете из этой статьи:

Как устроены нейросети внутри - токены, параметры, почему каждый раз разные ответы
Чем агент отличается от обычной автоматизации и почему это не одно и то же
Из чего состоит агент: пять компонентов простым языком
Сколько это реально стоит и когда агент - это оверинжиниринг
Какие навыки дают преимущество, когда агенты становятся массовым явлением

Сначала про нейросети, потому что без этого агенты непонятны

GPT расшифровывается как Generative Pre-trained Transformer. Звучит страшно, на деле проще: это программа, которая предугадывает следующее слово. Её обучили на огромном массиве текста из интернета - она видела миллиарды предложений и научилась понимать, что после каких слов идёт.

Текст модель видит не словами, а токенами. Hello World на английском - это 2 токена. «Привет мир» на русском - уже 5. Именно за токены вы платите при использовании API.

Размер модели измеряется параметрами (или весами). GPT-3 - 120 млрд параметров. Это числа, настроенные в процессе обучения. Чем больше параметров - тем, как правило, умнее модель, но и дороже инференс (то есть сам процесс генерации ответа).

И вот важный момент, который многих удивляет. Нейросеть недетерминирована: в неё встроена случайность, которую называют сэмплированием. Поэтому один и тот же запрос даёт разные ответы. Казалось бы, это баг, на деле - особенность, которая делает модель творческой, а не роботом с жёстким скриптом.

Самое интересное, что произошло за последние пару лет: нейросети научились думать. Рассуждающие модели теперь решают задачи, которых не было в обучающих данных. Олимпиадная задача по математике, на которую у человека уходят часы - за секунды. Это уже не просто «предугадывание слова».

От нейросети к агенту: в чём разница

Хорошая аналогия. ChatGPT расскажет вам, как варить кофе: шаги, температура, пропорции. Но чашку не нальёт - рук нет.

Обычная автоматизация - это кофемашина. Нажал кнопку, получил кофе. Работает отлично, пока процесс правильно настроен. Но если процесс кривой, автоматизация его не улучшит, она его масштабирует. Это правило умножения на ноль: автоматизировать сломанный процесс значит получать ошибку быстрее и в большем объёме.

Агенты частично решают эту проблему. Они не просто выполняют жёсткий сценарий - они адаптируются.

Что такое агент и из чего он состоит

Расскажу через конкретный кейс. Питер Штайнбергер - создатель OpenClaw, инструмента с 180 000+ звёздами на GitHub. Он был в Марракеше, захотел транскрибировать аудио. Запустил агента и ушёл. За 9 секунд агент сам нашёл нужные библиотеки (ffmpeg, whisper), получил API-ключ и выдал готовый текст. Без единого ручного действия со стороны Питера.

Как это работает? Агент состоит из пяти частей.

Мозг - это топовая языковая модель: Claude, GPT, Gemini. Именно она принимает решения, что делать дальше. Никакой бюджетной модели тут быть не должно - от качества мозга зависит всё.

Память бывает двух видов. Краткосрочная - это контекст разговора, то, что модель «помнит» прямо сейчас. Долгосрочная - файлы на диске, которые агент может читать и записывать между сессиями.

Инструменты (tools) - руки агента. Браузер, терминал, файловая система, планировщик задач. Через инструменты агент взаимодействует с реальным миром.

Скилы - это текстовые инструкции, которые задают навык. Как в фильме «Матрица»: «я знаю кунгфу» - и персонаж умеет драться. Скил говорит агенту, как действовать в конкретной ситуации: как писать тексты в определённом стиле, как проводить анализ, как общаться с клиентом. Важный нюанс: чужие скилы не скачать и не переложить на другого человека - навык их создавать надо развивать самому.

MCP (Model Context Protocol) - это переходник к внешним сервисам. Представьте USB-C: один порт, подключаешь что угодно. Через MCP агент подключается к Google Calendar, Notion, CRM, базам данных и сотням других сервисов.

Доступ к агенту организован через единую точку входа - Telegram, браузер - с обязательной аутентификацией. Иначе к вашему агенту может прийти кто угодно.

Кстати, если тема интересна - в Telegram-канале пишу о подобном регулярно: инструменты, лайфхаки, конкретные сценарии использования нейросетей в жизни и бизнесе. Там проще задать вопрос и не ждать следующей статьи.

Сколько это стоит

Раз мозг агента - это топовая языковая модель, бесплатного тут мало. Минимальный порог входа - от $20 в месяц за подписку на Claude или GPT.

Если идти в API (то есть встраивать модель в свой агент), цены считаются за токены. По данным апреля 2026 года: Claude Haiku - $0.40 за миллион токенов, Sonnet - $0.62, Opus - $1.00. Звучит дёшево, но при высокой нагрузке набегает.

Ещё одна статья расходов, которую часто недооценивают, - это MCP против локальных скилов. 10 000 операций через локальный скил обходятся примерно в $3.20. Те же 10 000 операций через удалённый MCP - около $55. В 17 раз дороже. Плюс 28% MCP-запросов падает по таймауту (ну, то есть просто не отвечает). Это надо учитывать при проектировании.

Когда агент нужен, а когда это пустая трата

Агент оправдан в задачах без жёстких границ, где нужна адаптация: анализ нестандартных данных, ответы на сложные клиентские запросы, исследование, принятие неочевидных решений.

Когда агент не нужен: пришло сообщение, обработали по правилу, ответили. Это обычная автоматизация. Для таких задач есть n8n - и это оверинжиниринг с переплатой, если тащить сюда агента с LLM-мозгом.

До 88% агентных проектов не доходят до продакшна, а 40% и вовсе будут отменены к 2027 году (это уже прогноз Gartner). Это не значит, что технология плохая - это значит, что люди запускают агентов там, где достаточно простой автоматизации (а такое бывает чаще, чем кажется).

Отдельно про безопасность, потому что это серьёзно. Вредоносные сайты уже умеют детектировать агентов по поведению и подсовывать им специальные инструкции через пиксели или скрытый текст. Агент с доступом к браузеру может прочитать данные карты. Агент с доступом к оплате в бесконечном цикле может сжечь весь бюджет. Это не страшилки - это реальные векторы атак, которые уже зафиксированы.

Кто будет нужен в 2026: вы - оркестратор

К 2030 году, по разным оценкам, может остаться только около 20% профессий в их нынешнем виде. Не потому что всех уволят завтра, а потому что задачи, которые раньше требовали команды из пяти человек, теперь закроет один человек с агентами.

Ключевой сдвиг - перестать мыслить как исполнитель и стать оркестратором. Дирижёром, который управляет агентами, а не делает всё руками.

Что это значит на практике? Нужны навыки, которые AI за вас не получит: умение формулировать видение и цели, декомпозиция сложных задач на части, промпт-инжиниринг (точнее - умение правильно ставить задачу машине), насмотренность в инструментах, продуктовое мышление, маркетинг, системное и креативное мышление, эмоциональный интеллект. И живой опыт - это последнее, что автоматизируется.

Скилы агента можно написать. Но понять, какой скил нужен и как его правильно сформулировать - это уже человеческая задача. И это навык, который надо развивать самому.

Когда стоит разобраться глубже

Если после прочтения появилось желание попробовать руками, а не просто «понять в теории» - это хороший знак.

В итоге

Агенты работают, пока вы занимаетесь чем-то другим. Но ценность теперь не в том, чтобы запустить агента, а в том, чтобы уметь им управлять. Оркестратор важнее исполнителя - это и есть ответ на вопрос из лида.

Если хочется не просто читать про AI, а реально его применять, у меня есть несколько мест, где это можно делать вместе.

Начать стоит с Telegram-канала. Это наш основной ресурс, где разбираем новые инструменты, кейсы автоматизации и приёмы, которые можно применить уже завтра.

Если зайдёт, залетайте в AI BASE. Это закрытое сообщество, где я делюсь личными наработками по автоматизации, вайб-кодингу и нейросетям.

А если хочется прямо сейчас сесть и попробовать руками, есть два бесплатных курса с нуля: по n8n для автоматизации без кода и по Claude Code для разработки в связке с AI.

Частые вопросы

Можно ли начать с агентами бесплатно?

Да. Есть онлайн-сервисы вроде Manus, где агенты уже собраны и доступны без технических знаний. Платный порог начинается, когда хочется строить своего агента с кастомной логикой.

Чем агент отличается от автоматизации в n8n?

n8n - это жёсткий сценарий: если А, то Б. Агент - это адаптивная система с языковым мозгом. Там, где n8n выполняет правило, агент принимает решение. Для простых задач n8n дешевле и надёжнее. Для сложных, нестандартных - нужен агент.

Нужно ли уметь кодить?

Не обязательно. Агентов можно строить через визуальные интерфейсы и готовые платформы. Но базовое понимание того, как всё устроено внутри, - как раз то, о чём эта статья.

Почему агенты не бесплатные, если нейросети вроде бы доступны?

Потому что мозг агента - это топовая модель, а инференс (генерация ответа) стоит денег. Чем сложнее задача и чем больше шагов агент делает, тем больше токенов тратится. Это как платить не за кофемашину, а за каждую чашку кофе.

Гаджеты и электроника

5,73 млн интересуются