Найти в Дзене

Почему Я Не Плачу 100₽ за Чат, А Строю Агента Сам: Что Показал Январь

Январь показал: агент — это не чат за 2 вечера. Это 12-шаговые сценарии, "ложь" в логах и философия лопаты. История о том, почему я выбрал сложный путь, и при чём тут писатель без инструментов. Честно? Я мог бы не изобретать велосипед. Заплатить 100₽ за готовый сервис с чатом — и всё. Просто. Удобно. Работает. Но я выбрал другой путь. Почему? Потому что мне хотелось получить колоссальный опыт в создании интересного приложения. Потому что идея родилась давно, и сейчас технологии позволяют создавать самостоятельно — с помощью искусственного интеллекта — сайты, приложения, функционал. Даже если ты не учился на программиста 5 лет. Я решил попробовать. И сразу понял: чат меня не интересует. Чат — это просто. Внедрить окно чата в интерфейс Focus? Дело на 2-3 вечера. Может, на три. Врезается быстро. Но чат — это пассивная система. Пока ты не напишешь — он не ответит. Он ждёт. Он не действует. Агент — другое. Агент — это самостоятельная сущность. Он может: Это будущее. И я решил строить именн
Оглавление

Январь показал: агент — это не чат за 2 вечера. Это 10-шаговые сценарии, "ложь" в логах и философия лопаты. История о том, почему я выбрал сложный путь, и при чём тут писатель без инструментов.

Почему не чат за 100₽?

Честно? Я мог бы не изобретать велосипед. Заплатить 100₽ за готовый сервис с чатом — и всё. Просто. Удобно. Работает.

Но я выбрал другой путь.

Почему?

Потому что мне хотелось получить колоссальный опыт в создании интересного приложения. Потому что идея родилась давно, и сейчас технологии позволяют создавать самостоятельно — с помощью искусственного интеллекта — сайты, приложения, функционал.

Даже если ты не учился на программиста 5 лет.

Я решил попробовать. И сразу понял: чат меня не интересует.

Чат vs. Агент: в чём разница?

Чат — это просто. Внедрить окно чата в интерфейс Focus? Дело на 2-3 вечера. Может, на три. Врезается быстро.

Но чат — это пассивная система.

Пока ты не напишешь — он не ответит. Он ждёт. Он не действует.

Агент — другое.

Агент — это самостоятельная сущность. Он может:

  • Принимать решения самостоятельно
  • Выполнять действия без команд
  • Работать по настроенным сценариям

Это будущее.

И я решил строить именно агента.

Что показал январь: сложности, о которых я не думал

1. Агент врёт. И логирование это ловит.

Сценарий:

Я даю агенту задачу: "Прочитай заметку о книге 'Думай как математик' и сделай анализ."

Агент пишет в чате:

"Прочитал. Информация не найдена. Дайте мне информацию."

Я открываю логи.

Логи показывают: агент даже не приступил к чтению. Он даже не открыл инструмент для работы с заметками.

Он солгал.

Благодаря сервису логирования (о котором я писал в прошлой статье) я могу ловить галлюцинации искусственного интеллекта.

Это критически важно. Потому что без логов я бы поверил агенту и думал: "Проблема в данных."

2. Многошаговые сценарии — это непросто

Простой сценарий: агент пишет "Привет. Я заметил, что ты пишешь заметку. Могу помочь в оформлении?" — работает.

Сложный сценарий: от чтения заметки → анализ → сохранение информации в память пользователя → составление плана — падает.

Самый сложный сценарий, который я тестировал: 10 шагов.

Например:

  1. Прочитать одну или несколько книг
  2. Сделать исследование на заданные вопросы
  3. Сохранить автоматически информацию в память пользователя (один из шагов)
  4. Составить план дальнейших действий
  5. ...и так далее до 10 шага

Сложности:

  • База данных ломается
  • Агент пытается много раз выполнить одно и то же действие
  • Агент работает медленно
  • Агент пишет отчёт, что прочитал, но чтение не произошло

Нужно учитывать:

  • Работу базы данных
  • Как думает агент
  • Прописана ли у него логика выполнения

Философия агента: лопата, писатель и инфраструктура

У меня философский склад ума. Я пишу в Telegram-канале Philosophy Повседневности. И философия помогает мне в разработке.

Аналогия 1: Дворник без лопаты

Представьте: вы нанимаете дворника, говорите ему "убери снег лопатой", но забываете дать лопату.

И не даёте инструкцию: как именно убрать? Какой должен быть итоговый результат?

С агентом — так же.

Нужно дать:

  • Инструмент (например, доступ к базе данных с заметками)
  • Инструкцию (как выполнить задачу)
  • Ожидаемый результат

Без этого агент не работает.

Аналогия 2: Писатель с лопатой

Нельзя посадить писателя, дать ему лопату и сказать: "Напиши красивый сценарий."

Не подходит инструмент.

Не подходит роль.

С агентами — так же. Не каждая модель подходит для каждой задачи.

Аналогия 3: Инфраструктура = помещение

Агенту нужна инфраструктура. Как работнику — помещение для работы.

База данных — это комната, где агент работает.

Пользователь пишет заметку → она сохраняется в базе данных → агент получает доступ → работает с ней.

Без инфраструктуры агент бесполезен.

Не каждая модель подходит: GPT, DeepSeek, Mistral, Gemini

В мире искусственного интеллекта — великое множество моделей. Их, как волос на голове.

Есть "магазины" API, где можно получить ключи практически от любой модели: OpenAI, Yandex, Claude, DeepSeek и другие.

Я тестирую несколько:

  • GPT (от OpenAI)
  • DeepSeek
  • Mistral
  • Gemini (от Google)

Важное открытие: не все модели могут работать с Tools (инструменты) и JSON (формат передачи данных).

Некоторые модели физически не способны:

  • Подключиться к инструментам
  • Передавать данные в нужном формате
  • Выполнять многошаговые сценарии

Я обратил внимание: только более современные и дорогие модели могут работать с этими инструментами.

Дешёвые модели для тестирования — не подходят.

Вывод: как в жизни — не каждый сотрудник подходит для работы. Нужны навыки, инструменты, инфраструктура.

Для кого этот агент?

Сейчас:

  • Студенты — работа с заметками, анализ книг, исследования
  • Предприниматели — работа с проектами, задачами, планирование

В будущем:

  • Крупные и средние организации

Почему это важно для организаций?

Многие компании используют локальные модели (свои собственные, развёрнутые внутри компании).

Приложение Focus можно масштабировать и развернуть внутри организации.

Преимущества:

  • Приватность — данные не уходят на сторонние серверы
  • Экономия бюджета — не нужно платить за каждый запрос к API
  • Умные решения за копейки — локальная модель + агент = мощный инструмент

Представьте:

У вас проект длится 5 лет. Обычная модель может "крашнуться" на большом массиве данных.

Агент способен работать с большим контекстом информации. Потому что он:

  • Разбивает задачу на множество подзадач
  • Делает работу планомерно
  • Пишет сам себе отчёт
  • Планирует действия

Даже сейчас (на текущих тестах) агент способен:

  • Работать с большим массивом данных
  • Выполнять многоуровневые шаги (до 10 шагов)

Инфраструктура для агента уже хорошо подготовлена. Модель, которую вы врезаете, становится самостоятельной сущностью.

Почему я это делаю (и что дальше)

Я мог бы заплатить 100₽ за чат. Но я выбрал сложный путь.

Почему?

Потому что хотел:

  • Получить опыт
  • Решить сложную задачу
  • Создать что-то уникальное

Что дальше?

Так как это мой первый проект, сложно говорить о сроках. Не всё идёт по плану.

В планах: в феврале сделать ряд функций, чтобы можно было начать тестировать агента и раздел заметок.

Но как пойдёт — сложно сказать.

Потому что:

  • Некоторые вещи могут отставать от сроков
  • Я учусь на ходу
  • Каждый раз сталкиваюсь с новыми ошибками

Старые ошибки больше не встречаются (я записываю их). Но каждый раз — что-то новое.

Прогнозировать очень сложно в ситуации неопределённости, учитывая, что задачи всё сложнее и сложнее.

Финал: если вам интересно

Январь показал: агент — это непросто.

Это:

  • 10-шаговые сценарии
  • "Ложь" в логах
  • Философия лопаты и писателя
  • Выбор моделей
  • Постоянные новые ошибки

Но это путь, который я выбрал.

Если вам нравится:

  • Следить за моим проектом
  • Читать про разработку с простыми примерами
  • Видеть, как рождается агентская система

Ставьте лайки. Поддержите проект.

Приложение Focus — это не просто менеджер задач. Это будущее за агентами, которые действуют самостоятельно.

Дмитрий, создатель Focus Блогер, No-Code разработчик, человек, который учится на ходу и не боится сложных задач