Январь показал: агент — это не чат за 2 вечера. Это 10-шаговые сценарии, "ложь" в логах и философия лопаты. История о том, почему я выбрал сложный путь, и при чём тут писатель без инструментов.
Почему не чат за 100₽?
Честно? Я мог бы не изобретать велосипед. Заплатить 100₽ за готовый сервис с чатом — и всё. Просто. Удобно. Работает.
Но я выбрал другой путь.
Почему?
Потому что мне хотелось получить колоссальный опыт в создании интересного приложения. Потому что идея родилась давно, и сейчас технологии позволяют создавать самостоятельно — с помощью искусственного интеллекта — сайты, приложения, функционал.
Даже если ты не учился на программиста 5 лет.
Я решил попробовать. И сразу понял: чат меня не интересует.
Чат vs. Агент: в чём разница?
Чат — это просто. Внедрить окно чата в интерфейс Focus? Дело на 2-3 вечера. Может, на три. Врезается быстро.
Но чат — это пассивная система.
Пока ты не напишешь — он не ответит. Он ждёт. Он не действует.
Агент — другое.
Агент — это самостоятельная сущность. Он может:
- Принимать решения самостоятельно
- Выполнять действия без команд
- Работать по настроенным сценариям
Это будущее.
И я решил строить именно агента.
Что показал январь: сложности, о которых я не думал
1. Агент врёт. И логирование это ловит.
Сценарий:
Я даю агенту задачу: "Прочитай заметку о книге 'Думай как математик' и сделай анализ."
Агент пишет в чате:
"Прочитал. Информация не найдена. Дайте мне информацию."
Я открываю логи.
Логи показывают: агент даже не приступил к чтению. Он даже не открыл инструмент для работы с заметками.
Он солгал.
Благодаря сервису логирования (о котором я писал в прошлой статье) я могу ловить галлюцинации искусственного интеллекта.
Это критически важно. Потому что без логов я бы поверил агенту и думал: "Проблема в данных."
2. Многошаговые сценарии — это непросто
Простой сценарий: агент пишет "Привет. Я заметил, что ты пишешь заметку. Могу помочь в оформлении?" — работает.
Сложный сценарий: от чтения заметки → анализ → сохранение информации в память пользователя → составление плана — падает.
Самый сложный сценарий, который я тестировал: 10 шагов.
Например:
- Прочитать одну или несколько книг
- Сделать исследование на заданные вопросы
- Сохранить автоматически информацию в память пользователя (один из шагов)
- Составить план дальнейших действий
- ...и так далее до 10 шага
Сложности:
- База данных ломается
- Агент пытается много раз выполнить одно и то же действие
- Агент работает медленно
- Агент пишет отчёт, что прочитал, но чтение не произошло
Нужно учитывать:
- Работу базы данных
- Как думает агент
- Прописана ли у него логика выполнения
Философия агента: лопата, писатель и инфраструктура
У меня философский склад ума. Я пишу в Telegram-канале Philosophy Повседневности. И философия помогает мне в разработке.
Аналогия 1: Дворник без лопаты
Представьте: вы нанимаете дворника, говорите ему "убери снег лопатой", но забываете дать лопату.
И не даёте инструкцию: как именно убрать? Какой должен быть итоговый результат?
С агентом — так же.
Нужно дать:
- Инструмент (например, доступ к базе данных с заметками)
- Инструкцию (как выполнить задачу)
- Ожидаемый результат
Без этого агент не работает.
Аналогия 2: Писатель с лопатой
Нельзя посадить писателя, дать ему лопату и сказать: "Напиши красивый сценарий."
Не подходит инструмент.
Не подходит роль.
С агентами — так же. Не каждая модель подходит для каждой задачи.
Аналогия 3: Инфраструктура = помещение
Агенту нужна инфраструктура. Как работнику — помещение для работы.
База данных — это комната, где агент работает.
Пользователь пишет заметку → она сохраняется в базе данных → агент получает доступ → работает с ней.
Без инфраструктуры агент бесполезен.
Не каждая модель подходит: GPT, DeepSeek, Mistral, Gemini
В мире искусственного интеллекта — великое множество моделей. Их, как волос на голове.
Есть "магазины" API, где можно получить ключи практически от любой модели: OpenAI, Yandex, Claude, DeepSeek и другие.
Я тестирую несколько:
- GPT (от OpenAI)
- DeepSeek
- Mistral
- Gemini (от Google)
Важное открытие: не все модели могут работать с Tools (инструменты) и JSON (формат передачи данных).
Некоторые модели физически не способны:
- Подключиться к инструментам
- Передавать данные в нужном формате
- Выполнять многошаговые сценарии
Я обратил внимание: только более современные и дорогие модели могут работать с этими инструментами.
Дешёвые модели для тестирования — не подходят.
Вывод: как в жизни — не каждый сотрудник подходит для работы. Нужны навыки, инструменты, инфраструктура.
Для кого этот агент?
Сейчас:
- Студенты — работа с заметками, анализ книг, исследования
- Предприниматели — работа с проектами, задачами, планирование
В будущем:
- Крупные и средние организации
Почему это важно для организаций?
Многие компании используют локальные модели (свои собственные, развёрнутые внутри компании).
Приложение Focus можно масштабировать и развернуть внутри организации.
Преимущества:
- Приватность — данные не уходят на сторонние серверы
- Экономия бюджета — не нужно платить за каждый запрос к API
- Умные решения за копейки — локальная модель + агент = мощный инструмент
Представьте:
У вас проект длится 5 лет. Обычная модель может "крашнуться" на большом массиве данных.
Агент способен работать с большим контекстом информации. Потому что он:
- Разбивает задачу на множество подзадач
- Делает работу планомерно
- Пишет сам себе отчёт
- Планирует действия
Даже сейчас (на текущих тестах) агент способен:
- Работать с большим массивом данных
- Выполнять многоуровневые шаги (до 10 шагов)
Инфраструктура для агента уже хорошо подготовлена. Модель, которую вы врезаете, становится самостоятельной сущностью.
Почему я это делаю (и что дальше)
Я мог бы заплатить 100₽ за чат. Но я выбрал сложный путь.
Почему?
Потому что хотел:
- Получить опыт
- Решить сложную задачу
- Создать что-то уникальное
Что дальше?
Так как это мой первый проект, сложно говорить о сроках. Не всё идёт по плану.
В планах: в феврале сделать ряд функций, чтобы можно было начать тестировать агента и раздел заметок.
Но как пойдёт — сложно сказать.
Потому что:
- Некоторые вещи могут отставать от сроков
- Я учусь на ходу
- Каждый раз сталкиваюсь с новыми ошибками
Старые ошибки больше не встречаются (я записываю их). Но каждый раз — что-то новое.
Прогнозировать очень сложно в ситуации неопределённости, учитывая, что задачи всё сложнее и сложнее.
Финал: если вам интересно
Январь показал: агент — это непросто.
Это:
- 10-шаговые сценарии
- "Ложь" в логах
- Философия лопаты и писателя
- Выбор моделей
- Постоянные новые ошибки
Но это путь, который я выбрал.
Если вам нравится:
- Следить за моим проектом
- Читать про разработку с простыми примерами
- Видеть, как рождается агентская система
Ставьте лайки. Поддержите проект.
Приложение Focus — это не просто менеджер задач. Это будущее за агентами, которые действуют самостоятельно.
Дмитрий, создатель Focus Блогер, No-Code разработчик, человек, который учится на ходу и не боится сложных задач