21 подписчик

Как новичку создать первого AI агента с нуля

31 мая31 мая

9 мин

Год назад я понятия не имел, что такое AI агент. Я думал, это что-то из фантастики — умный робот, который сам принимает решения. Потом я потратил три недели на туториалы, сломал несколько проектов, и в итоге запустил своего первого агента за один вечер. Оказалось, что главная ошибка новичков — они усложняют там, где всё просто.

Сейчас AI агенты — это не экзотика. Это рабочий инструмент, который

Сейчас AI агенты — это не экзотика. Это рабочий инструмент, который уже используют тысячи разработчиков, фрилансеров и просто любопытных людей. Агент может сам искать информацию, выполнять задачи по шагам, обращаться к внешним сервисам и делать выводы. Без вашего участия.

Если вы хоть раз думали "хочу автоматизировать эту рутину, но не знаю с чего начать" — эта статья для вас. Я разберу всё по шагам: что такое агент, как он устроен, как написать первого с нуля и какие ошибки убивают проекты ещё на старте.

Что такое AI агент и чем он отличается от обычного чат-бота

Большинство людей путают агента с обычным чат-ботом. Разница принципиальная.

Чат-бот отвечает на вопрос. Агент — решает задачу. Он может разбить её на шаги, выполнить каждый, проверить результат и скорректировать действия. Это называется циклом "думай — действуй — наблюдай".

Простой пример. Вы пишете чат-боту: "Найди мне билеты в Москву на пятницу". Он скажет: "Вот ссылка на поиск". Агент — откроет поисковик, найдёт варианты, отфильтрует по цене, выберет лучший и пришлёт вам готовый ответ с деталями.

Технически агент — это языковая модель плюс инструменты. Инструменты — это функции, которые агент может вызывать: поиск в интернете, выполнение кода, чтение файлов, отправка запросов к API.

Подробнее о том, как работают AI инструменты в 2026 году

Архитектура агента: три компонента, которые нужно понять

Прежде чем писать код, нужно понять из чего состоит агент.

━━━━━━━━━━━━━━

Мозг (LLM)

Что это: языковая модель — GPT-4, Claude, Gemini Роль: принимает решения, формулирует шаги, интерпретирует результаты Аналог: человек, который думает

━━━━━━━━━━━━━━

Инструменты (Tools)

Что это: функции, которые агент вызывает Роль: поиск, код, файлы, API Аналог: руки человека

━━━━━━━━━━━━━━

Память (Memory)

Что это: история диалога, векторная база, внешнее хранилище Роль: помнит контекст, не теряет нить Аналог: записная книжка

━━━━━━━━━━━━━━

Это минимальная архитектура. Большинство первых агентов работают именно так — без лишних усложнений.

Пошаговое создание первого агента

Я буду использовать Python и библиотеку LangChain — самый популярный выбор для старта. Если вы никогда не работали с Python, вам хватит базового уровня.

Шаг 1. Установка окружения

pip install langchain langchain-openai python-dotenv

Создайте файл .env и добавьте ключ:

OPENAI_API_KEY=ваш_ключ_сюда

Шаг 2. Создание инструментов

Инструмент — это обычная функция с описанием. Агент сам решает, когда её вызывать.

from langchain.tools import tool

@tool

def get_current_weather(city: str) -> str:

"""Возвращает текущую погоду в городе."""

# Здесь реальный запрос к API погоды

return f"В {city} сейчас 22 градуса, облачно"

@tool

def calculate(expression: str) -> str:

"""Вычисляет математическое выражение."""

return str(eval(expression))

Шаг 3. Инициализация агента

from langchain_openai import ChatOpenAI

from langchain.agents import create_tool_calling_agent, AgentExecutor

from langchain_core.prompts import ChatPromptTemplate

llm = ChatOpenAI(model="gpt-4o", temperature=0)

tools = [get_current_weather, calculate]

prompt = ChatPromptTemplate.from_messages([

("system", "Ты полезный ассистент. Используй инструменты для ответа на вопросы."),

("human", "{input}"),

("placeholder", "{agent_scratchpad}"),

])

agent = create_tool_calling_agent(llm, tools, prompt)

executor = AgentExecutor(agent=agent, tools=tools, verbose=True)

Шаг 4. Запуск

result = executor.invoke({"input": "Какая погода в Москве? И сколько будет 17 умножить на 43?"})

print(result["output"])

Запустите — и увидите, как агент сам решает, какой инструмент вызвать, в каком порядке, и формулирует финальный ответ.

Это уже работающий агент. Примитивный, но честный.

История первая: как я сломал три проекта до того, как всё заработало

Первый мой агент должен был автоматически анализировать новости и присылать дайджест. Звучит просто. На практике — я потратил неделю.

Проблема номер один: агент уходил в бесконечный цикл. Он вызывал инструмент, получал результат, снова вызывал тот же инструмент, снова получал... Оказалось, я не ограничил максимальное количество итераций.

Проблема номер два: промпт был слишком расплывчатым. Агент не понимал, когда остановиться. Я написал "найди интересные новости" — и он искал часами, потому что "интересные" — субъективно.

Проблема номер три: инструменты возвращали слишком много данных. Модель перегружалась контекстом и начинала галлюцинировать.

Три исправления, которые решили всё: лимит итераций, конкретный промпт с чёткими критериями остановки, и обрезка вывода инструментов до 500 символов.

После этого агент заработал с первого запуска.

Что чаще всего делают неправильно

━━━━━━━━━━━━━━

Слишком сложный первый агент

Проблема: пытаются сразу сделать агента с памятью, 10 инструментами и базой данных Последствие: ничего не работает, непонятно где ошибка Решение: начать с одного инструмента и нарастить постепенно

━━━━━━━━━━━━━━

Нет ограничения итераций

Проблема: агент зацикливается и сжигает токены Последствие: счёт за API на несколько долларов за один запуск Решение: всегда устанавливать max_iterations=10

━━━━━━━━━━━━━━

Расплывчатые описания инструментов

Проблема: агент не понимает, когда использовать какой инструмент Последствие: вызывает не то, что нужно, или не вызывает вообще Решение: описание инструмента — это подсказка для модели, пишите конкретно

━━━━━━━━━━━━━━

Нет обработки ошибок

Проблема: инструмент падает с исключением — агент зависает Последствие: непредсказуемое поведение в продакшене Решение: оборачивать каждый инструмент в try/except

━━━━━━━━━━━━━━

Подводные камни, о которых не пишут в туториалах

Первое — стоимость. Агент делает несколько запросов к модели за одну задачу. Если задача сложная — это 10-20 запросов. При интенсивном использовании счёт растёт быстро. Всегда считайте токены до запуска в продакшен.

Второе — недетерминированность. Агент может решить одну и ту же задачу разными путями при разных запусках. Это нормально для некоторых сценариев, но плохо там, где нужна воспроизводимость. Параметр temperature=0 помогает, но не гарантирует полную стабильность.

Третье — безопасность инструментов. Если вы дали агенту инструмент для выполнения кода — убедитесь, что он работает в изолированной среде. Агент может сгенерировать код, который сделает что-то неожиданное.

Четвёртое — контекстное окно. Длинные диалоги и большие результаты инструментов заполняют окно контекста. Модель начинает "забывать" начало задачи. Решение — суммаризация истории и обрезка вывода.

Как работать с AI агентами без лишних затрат

История вторая: агент, который сэкономил 6 часов в неделю

Один мой знакомый — аналитик в небольшой компании. Каждую неделю он вручную собирал данные из трёх разных таблиц, сводил их в отчёт и отправлял руководителю. Два часа минимум, иногда три.

Мы сделали ему агента за один вечер. Три инструмента: чтение CSV, базовые вычисления, форматирование текста. Промпт с чёткой инструкцией что именно собирать и в каком формате выводить.

Теперь он запускает одну команду. Агент делает всё за 40 секунд.

"Я даже не верил, что это работает", — сказал он после первого запуска. — "Думал, будет какая-то магия, которую не понять. А тут просто функции и модель".

Вот именно. Никакой магии.

Аналитик смотрит на экран с автоматически сгенерированным отчётом

Оптимизация: как сделать агента надёжнее

Когда базовый агент работает, можно улучшать.

Добавить память. Самый простой способ — ConversationBufferMemory из LangChain. Агент будет помнить предыдущие сообщения в рамках сессии. Для долгосрочной памяти — векторная база данных, например Chroma или Pinecone.

Добавить логирование. Каждый шаг агента — вызов инструмента, промежуточный вывод, финальный ответ — должен писаться в лог. Это единственный способ понять, что пошло не так при отладке.

Структурированный вывод. Если агент должен возвращать данные в определённом формате — используйте Pydantic-схемы. Модель будет гарантированно возвращать JSON нужной структуры.

Параллельные инструменты. Некоторые задачи можно решать параллельно — например, делать несколько поисковых запросов одновременно. LangGraph позволяет строить такие графы выполнения.

Подробный разбор LangGraph и агентных архитектур

Чек-лист: агент готов к запуску

— Инструменты имеют чёткие описания — Установлен лимит итераций (max_iterations) — Каждый инструмент обёрнут в обработку ошибок — Промпт содержит конкретный критерий завершения задачи — Вывод инструментов ограничен по размеру — Логирование включено — Протестированы граничные случаи (нет данных, ошибка сети, пустой ответ) — Стоимость запуска оценена и приемлема

FAQ

Нужно ли знать машинное обучение, чтобы создать агента? Нет. Достаточно базового Python и понимания API. Модель — это чёрный ящик, вы работаете с ней через интерфейс.

Какую модель выбрать для первого агента? GPT-4o или Claude Sonnet. Они хорошо следуют инструкциям и правильно вызывают инструменты. Более дешёвые модели хуже справляются с многошаговыми задачами.

Можно ли сделать агента без LangChain? Да. LangChain — удобная обёртка, но не обязательная. Можно работать напрямую с API OpenAI через function calling.

Как агент узнаёт, когда остановиться? Из промпта и из логики модели. Если промпт чёткий — агент сам понимает финальное состояние. Лимит итераций — страховка на случай, если что-то пошло не так.

Агент может ошибаться? Да, и это нормально. Агенты не идеальны. Для критически важных задач нужна валидация результата и возможность ручного вмешательства.

История третья: провал, который стал уроком

Я видел проект, где агент должен был автоматически отвечать на письма клиентов. Звучало отлично. Запустили в пятницу вечером, ушли домой.

В понедельник оказалось, что агент ответил на 200 писем. Из них в 15 случаях написал что-то абсурдное — перепутал контекст, галлюцинировал детали, пообещал скидки, которых не существует.

Вывод простой: агент в продакшене без человеческой проверки — это риск. Особенно там, где общение с клиентами. Правильная схема: агент готовит черновик, человек одобряет и отправляет.

Автоматизируйте осторожно.

Менеджер смотрит на экран с множеством писем

Итоги

AI агент — это не магия и не рокет-сайенс. Это языковая модель плюс функции, которые она умеет вызывать. Архитектура простая, инструменты доступные, порог входа — один вечер.

Самое важное на старте: не усложнять. Один инструмент, чёткий промпт, лимит итераций. Потом — память, параллельные вызовы, сложные графы.

Реальная ценность агентов не в том, что они умные. А в том, что они терпеливые. Они делают рутину, которую вы ненавидите, снова и снова, без ошибок и без жалоб.

Как зарабатывать с помощью AI агентов в 2026 году