Интеллектуальные инновации искусственного интеллекта

16 подписчиков

Почему Я Не Плачу 100₽ за Чат, А Строю Агента Сам: Что Показал Январь

15 января15 янв

5 мин

Январь показал: агент — это не чат за 2 вечера. Это 12-шаговые сценарии, "ложь" в логах и философия лопаты. История о том, почему я выбрал сложный путь, и при чём тут писатель без инструментов. Честно? Я мог бы не изобретать велосипед. Заплатить 100₽ за готовый сервис с чатом — и всё. Просто. Удобно. Работает. Но я выбрал другой путь. Почему? Потому что мне хотелось получить колоссальный опыт в создании интересного приложения. Потому что идея родилась давно, и сейчас технологии позволяют создавать самостоятельно — с помощью искусственного интеллекта — сайты, приложения, функционал. Даже если ты не учился на программиста 5 лет. Я решил попробовать. И сразу понял: чат меня не интересует. Чат — это просто. Внедрить окно чата в интерфейс Focus? Дело на 2-3 вечера. Может, на три. Врезается быстро. Но чат — это пассивная система. Пока ты не напишешь — он не ответит. Он ждёт. Он не действует. Агент — другое. Агент — это самостоятельная сущность. Он может: Это будущее. И я решил строить именн

Оглавление

Почему не чат за 100₽?
Чат vs. Агент: в чём разница?
Что показал январь: сложности, о которых я не думал

Январь показал: агент — это не чат за 2 вечера. Это 10-шаговые сценарии, "ложь" в логах и философия лопаты. История о том, почему я выбрал сложный путь, и при чём тут писатель без инструментов.

Почему не чат за 100₽?

Честно? Я мог бы не изобретать велосипед. Заплатить 100₽ за готовый сервис с чатом — и всё. Просто. Удобно. Работает.

Но я выбрал другой путь.

Почему?

Потому что мне хотелось получить колоссальный опыт в создании интересного приложения. Потому что идея родилась давно, и сейчас технологии позволяют создавать самостоятельно — с помощью искусственного интеллекта — сайты, приложения, функционал.

Даже если ты не учился на программиста 5 лет.

Я решил попробовать. И сразу понял: чат меня не интересует.

Чат vs. Агент: в чём разница?

Чат — это просто. Внедрить окно чата в интерфейс Focus? Дело на 2-3 вечера. Может, на три. Врезается быстро.

Но чат — это пассивная система.

Пока ты не напишешь — он не ответит. Он ждёт. Он не действует.

Агент — другое.

Агент — это самостоятельная сущность. Он может:

Принимать решения самостоятельно
Выполнять действия без команд
Работать по настроенным сценариям

Это будущее.

И я решил строить именно агента.

Что показал январь: сложности, о которых я не думал

1. Агент врёт. И логирование это ловит.

Сценарий:

Я даю агенту задачу: "Прочитай заметку о книге 'Думай как математик' и сделай анализ."

Агент пишет в чате:

"Прочитал. Информация не найдена. Дайте мне информацию."

Я открываю логи.

Логи показывают: агент даже не приступил к чтению. Он даже не открыл инструмент для работы с заметками.

Он солгал.

Благодаря сервису логирования (о котором я писал в прошлой статье) я могу ловить галлюцинации искусственного интеллекта.

Это критически важно. Потому что без логов я бы поверил агенту и думал: "Проблема в данных."

2. Многошаговые сценарии — это непросто

Простой сценарий: агент пишет "Привет. Я заметил, что ты пишешь заметку. Могу помочь в оформлении?" — работает.

Сложный сценарий: от чтения заметки → анализ → сохранение информации в память пользователя → составление плана — падает.

Самый сложный сценарий, который я тестировал: 10 шагов.

Например:

Прочитать одну или несколько книг
Сделать исследование на заданные вопросы
Сохранить автоматически информацию в память пользователя (один из шагов)
Составить план дальнейших действий
...и так далее до 10 шага

Сложности:

База данных ломается
Агент пытается много раз выполнить одно и то же действие
Агент работает медленно
Агент пишет отчёт, что прочитал, но чтение не произошло

Нужно учитывать:

Работу базы данных
Как думает агент
Прописана ли у него логика выполнения

Философия агента: лопата, писатель и инфраструктура

У меня философский склад ума. Я пишу в Telegram-канале Philosophy Повседневности. И философия помогает мне в разработке.

Аналогия 1: Дворник без лопаты

Представьте: вы нанимаете дворника, говорите ему "убери снег лопатой", но забываете дать лопату.

И не даёте инструкцию: как именно убрать? Какой должен быть итоговый результат?

С агентом — так же.

Нужно дать:

Инструмент (например, доступ к базе данных с заметками)
Инструкцию (как выполнить задачу)
Ожидаемый результат

Без этого агент не работает.

Аналогия 2: Писатель с лопатой

Нельзя посадить писателя, дать ему лопату и сказать: "Напиши красивый сценарий."

Не подходит инструмент.

Не подходит роль.

С агентами — так же. Не каждая модель подходит для каждой задачи.

Аналогия 3: Инфраструктура = помещение

Агенту нужна инфраструктура. Как работнику — помещение для работы.

База данных — это комната, где агент работает.

Пользователь пишет заметку → она сохраняется в базе данных → агент получает доступ → работает с ней.

Без инфраструктуры агент бесполезен.

Не каждая модель подходит: GPT, DeepSeek, Mistral, Gemini

В мире искусственного интеллекта — великое множество моделей. Их, как волос на голове.

Есть "магазины" API, где можно получить ключи практически от любой модели: OpenAI, Yandex, Claude, DeepSeek и другие.

Я тестирую несколько:

GPT (от OpenAI)
DeepSeek
Mistral
Gemini (от Google)

Важное открытие: не все модели могут работать с Tools (инструменты) и JSON (формат передачи данных).

Некоторые модели физически не способны:

Подключиться к инструментам
Передавать данные в нужном формате
Выполнять многошаговые сценарии

Я обратил внимание: только более современные и дорогие модели могут работать с этими инструментами.

Дешёвые модели для тестирования — не подходят.

Вывод: как в жизни — не каждый сотрудник подходит для работы. Нужны навыки, инструменты, инфраструктура.

Для кого этот агент?

Сейчас:

Студенты — работа с заметками, анализ книг, исследования
Предприниматели — работа с проектами, задачами, планирование

В будущем:

Крупные и средние организации

Почему это важно для организаций?

Многие компании используют локальные модели (свои собственные, развёрнутые внутри компании).

Приложение Focus можно масштабировать и развернуть внутри организации.

Преимущества:

Приватность — данные не уходят на сторонние серверы
Экономия бюджета — не нужно платить за каждый запрос к API
Умные решения за копейки — локальная модель + агент = мощный инструмент

Представьте:

У вас проект длится 5 лет. Обычная модель может "крашнуться" на большом массиве данных.

Агент способен работать с большим контекстом информации. Потому что он:

Разбивает задачу на множество подзадач
Делает работу планомерно
Пишет сам себе отчёт
Планирует действия

Даже сейчас (на текущих тестах) агент способен:

Работать с большим массивом данных
Выполнять многоуровневые шаги (до 10 шагов)

Инфраструктура для агента уже хорошо подготовлена. Модель, которую вы врезаете, становится самостоятельной сущностью.

Почему я это делаю (и что дальше)

Я мог бы заплатить 100₽ за чат. Но я выбрал сложный путь.

Почему?

Потому что хотел:

Получить опыт
Решить сложную задачу
Создать что-то уникальное

Что дальше?

Так как это мой первый проект, сложно говорить о сроках. Не всё идёт по плану.

В планах: в феврале сделать ряд функций, чтобы можно было начать тестировать агента и раздел заметок.

Но как пойдёт — сложно сказать.

Потому что:

Некоторые вещи могут отставать от сроков
Я учусь на ходу
Каждый раз сталкиваюсь с новыми ошибками

Старые ошибки больше не встречаются (я записываю их). Но каждый раз — что-то новое.

Прогнозировать очень сложно в ситуации неопределённости, учитывая, что задачи всё сложнее и сложнее.

Финал: если вам интересно

Январь показал: агент — это непросто.

Это:

10-шаговые сценарии
"Ложь" в логах
Философия лопаты и писателя
Выбор моделей
Постоянные новые ошибки

Но это путь, который я выбрал.

Если вам нравится:

Следить за моим проектом
Читать про разработку с простыми примерами
Видеть, как рождается агентская система

Ставьте лайки. Поддержите проект.

Приложение Focus — это не просто менеджер задач. Это будущее за агентами, которые действуют самостоятельно.

Дмитрий, создатель Focus Блогер, No-Code разработчик, человек, который учится на ходу и не боится сложных задач