Артур Хорошев про автоматизацию и нейросети

3273 подписчика

Настройка ИИ-агента: подключаем базу знаний через RAG и OpenClaw

7 апреля7 апр

7 мин

Настройка ИИ-агента через RAG и платформу OpenClaw позволяет создать автономного цифрового сотрудника с доступом к вашей локальной базе знаний. Система работает в фоне, индексирует документы через встроенную базу SQLite и управляется прямо из мессенджеров, обеспечивая точные ответы с цитированием источников и абсолютную приватность данных. В начале года я окончательно устал от неповоротливых корпоративных решений. Платить за тяжелые векторные базы данных, чтобы бот просто искал нужные регламенты по моим локальным папкам — это бред. В апреле 2026 года правила игры изменились. OpenClaw сделал то, чего мы все ждали: превратил сложную разработку RAG-систем в утилиту, которая ставится за десять минут на обычный Mac Mini. Я перевел на эту архитектуру уже десяток клиентских проектов, и, честно говоря, пути назад нет. Сегодня разберем, как собрать такую систему руками. Без воды, только то, что работает в реальных боевых условиях. OpenClaw изначально выстрелил под именем Clawdbot, собрав 100 00

Оглавление

Что за зверь этот OpenClaw и зачем он вам
Локальная RAG система: прощайте, тяжелые базы данных
Сравнение подходов к базе знаний

В начале года я окончательно устал от неповоротливых корпоративных решений. Платить за тяжелые векторные базы данных, чтобы бот просто искал нужные регламенты по моим локальным папкам — это бред. В апреле 2026 года правила игры изменились. OpenClaw сделал то, чего мы все ждали: превратил сложную разработку RAG-систем в утилиту, которая ставится за десять минут на обычный Mac Mini. Я перевел на эту архитектуру уже десяток клиентских проектов, и, честно говоря, пути назад нет.

Сегодня разберем, как собрать такую систему руками. Без воды, только то, что работает в реальных боевых условиях.

Что за зверь этот OpenClaw и зачем он вам

OpenClaw изначально выстрелил под именем Clawdbot, собрав 100 000 звезд на GitHub за первую неделю релиза. По сути, это open-source фреймворк, который висит в фоне на вашем сервере или компе и работает как шлюз. Вы пишете ему в обычный Telegram или WhatsApp, а он под капотом дергает нужные LLM, лезет в ваши документы и выдает готовый результат.

Многие новички путают понятия. Некоторые гуглят запросы вроде фифа настройка ии или игровые настройки ии, думая, что автономные агенты — это просто ползунки сложности поведения ботов в играх. Другие ищут настройки ии для фото или видео настройки для ии, пытаясь прикрутить агентов к генерации картинок. И хотя графику генерировать можно, главная сила таких систем — в работе с текстом и данными.

Моя рекомендация здесь простая: не пытайтесь натянуть агента на все задачи сразу. Настройка ии агента начинается с одной конкретной боли. Например, быстрая выжимка из юридических контрактов. Засунули документы в папку, бот их прочитал, вы в мессенджере задали вопрос — получили ответ со ссылкой на страницу.

Локальная RAG система: прощайте, тяжелые базы данных

Раньше архитектура rag системы требовала танцев с бубном вокруг Pinecone или разворачивания Postgres с расширением pgvector. Это было дорого и долго. Сейчас тренд — Zero-Ops. Никакого администрирования баз.

В OpenClaw по умолчанию используется концепция постоянной памяти на базе локальной SQLite. Данные для обучения нейросети и индексация документов реализованы через легковесные расширения sqlite-vec и FTS5. Вы просто кидаете PDF или DOCX в нужную папку, и система сама нарезает их на чанки и векторизует.

Сравнение подходов к базе знаний

Как мы работали раньше: облачные векторные базы. Цена около 70 долларов в месяц за приличный объем. Плюсы — масштабируемость. Минусы — ваши конфиденциальные данные улетают на чужие сервера, плюс задержки в сети.

Как мы работаем сейчас в 2026 году: локальная rag система на SQLite. Цена ноль. Плюсы — абсолютная приватность, мгновенный отклик, данные лежат на вашем жестком диске. Минусы — при объеме базы свыше терабайта поиск может слегка замедлиться.

Локальная векторизация полностью закрыла потребности соло-разработчиков и малого бизнеса. Если у вас база документов до 50 ГБ — даже не смотрите в сторону облачных БД. SQLite справится блестяще.

Программируем мозг: файлы вместо сложного кода

Любая настройка ии начинается с задания контекста. В OpenClaw поведение и доступы программируются через три основных Markdown-файла. Никакого сложного Python-кода, только текст.

SOUL.md определяет личность агента и тональность его ответов
USER.md хранит предпочтения пользователя и контекст бизнеса
AGENTS.md содержит жесткие операционные правила и ограничения

Это по сути и есть ваш базовый промт для настройки ии. Я всегда советую прописывать в AGENTS.md жесткое правило: агент обязан возвращать ID документа или номер страницы при каждом ответе. LLM обожают придумывать факты, и если вы не настроите гибридный поиск с принудительным цитированием, замучаетесь проверять за ботом цифры.

Кстати, если вам нужен агент, который будет сам собирать данные с сайтов, можете посмотреть мой проект Tilda AI Agent (скачать) : https://github.com/Horosheff/Tilda-AI-Agent-Feeds. Он отлично интегрируется в подобные связки.

Секретный соус: Read-Write RAG и автоматизация

Типичная ошибка новичка — настроить систему только на чтение. Агент сканирует базу, отвечает и забывает. Это тупик.

Внедрите цикличный Read-Write RAG. Агент должен запрашивать данные перед задачей, а после ее выполнения — самостоятельно формировать отчет и сохранять его обратно в базу знаний. Ну, то есть… он сам себя обучает от сессии к сессии. Это дает эффект сложного процента в накоплении знаний.

Кстати, я автоматизировал сбор входящих заявок из Telegram напрямую в такую базу знаний через Make.com — время обработки лида упало с двух часов до трех минут. Если интересна автоматизация — вот реф-ссылка: https://www.make.com/en/register?pc=horosheff

Чем умнее становится ваша система, тем больше рутины она забирает. Ии для настройки рекламы, например, может сам анализировать прошлые кампании из базы знаний и предлагать новые креативы на основе успешных кейсов.

Обучение автоматизации на Make.com

MCP заменяет классические API

Еще один тектонический сдвиг 2026 года — массовый переход на Model Context Protocol. Подключение внешних инструментов через обычный REST API отмирает.

MCP позволяет LLM нативно воспринимать внешние базы или парсеры как структурированный инструмент. Вы не пишете километровые инструкции, как боту дергать API. Вы просто даете ему MCP-сервер, и он сам разбирается, когда и какой запрос туда отправить. Например, для сложного извлечения таблиц из PDF мы сейчас используем парсер Docling, подключенный именно по этому протоколу.

Если вы хотите объединить все свои инструменты — от Wordstat до генерации картинок — в одну систему без написания кода, советую использовать MCP сервис автоматизации «ВСЁ ПОДКЛЮЧЕНО». Это экономит недели времени на интеграциях.

Модели, токены и параноидальная безопасность

Выбор «мозгов» для вашей системы критичен. Если вы гоняете огромные объемы текста через API, вы быстро разоритесь. Для сложных задач логики и анализа текущий флагман ChatGPT-5.4 или Claude 4.6 Sonnet вне конкуренции. Claude сейчас вообще лидер в вайб-кодинге и написании скриптов.

Но для рутинного векторного поиска я рекомендую локальные модели. Qwen 3.5 через Ollama — топовое решение. Выставляете окно контекста на 64k токенов и гоняете гигабайты текста бесплатно. Если нужна генерация кода внутри базы — ставьте DeepSeek V4. А для корпоративного сегмента, где важны ГОСТы и работа внутри РФ, отлично показывает себя YandexGPT 4 Enterprise.

Тут важный момент про безопасность. Исследователи кибербезопасности бьют тревогу не просто так. Относитесь к ИИ-агенту с доступом к вашим файлам как к подозрительному стажеру. Не давайте ему доступ к своей основной почте. Заведите отдельные виртуалки. Многие мои коллеги покупают для таких агентов отдельный дешевый неттоп — чисто чтобы физически изолировать личные данные от возможных уязвимостей.

Также не забывайте про визуальную часть. Если ваш маркетинговый агент генерирует контент, подключите ему Nano Banano 2 для сочных креативов или GPT Image 1.5, который теперь выдает разрешение 4096×4096. А если нужна идеальная типографика на баннерах — используйте Ideogram.

Что делать прямо сейчас

Хватит складировать инструкции по папкам, которые никто не читает. Пора заставить ваши данные работать на вас.

Установите OpenClaw на свой ПК или сервер
Настройте базовые файлы SOUL.md и AGENTS.md
Загрузите в локальную папку десяток ваших ключевых документов и регламентов
Настройте интеграцию с Telegram, чтобы общаться с базой с телефона
Переведите агента в режим Read-Write, чтобы он сохранял историю решений

Хотите научиться автоматизации рабочих процессов с помощью сервиса make.com и нейросетей ? Подпишитесь на наш Telegram-канал или загляните к нам — Мы в MAX.

Если хочешь разобраться глубже в автоматизации и собрать архитектуру под себя — у меня есть обучение: Обучение по Автоматизации, CursorAI, маркетингу и make.com. А готовые шаблоны можно забрать тут: Блюпринты по make.com.

Частые вопросы

Как начать обучение нейросетям с нуля бесплатно?

Скачайте Ollama на свой компьютер и запустите локальную модель вроде Qwen 3.5 или DeepSeek V4. Это не требует денег и позволяет безопасно экспериментировать с промптами и настройками агентов прямо в терминале.

Что такое локальная rag система простыми словами?

Это папка с вашими документами на компьютере, которую нейросеть прочитала и запомнила. Когда вы задаете вопрос, бот не лезет в интернет, а ищет ответ только по вашим файлам, сохраняя 100% приватность.

Где брать данные для обучения нейросети компании?

Используйте ваши внутренние регламенты, записи зумов, переписки с клиентами в техподдержке и успешные контракты. Инструменты вроде OpenClaw конвертируют этот мусорный массив данных в структурированную векторную базу.

Как работает ии настройка яндекс для корпоративных задач?

YandexGPT 4 Enterprise разворачивается через API в закрытом контуре компании. Модель учитывает российскую специфику, законы и ГОСТы, что делает ее идеальной для юридических и бухгалтерских RAG-систем без риска утечки за рубеж.

Нужно ли знать программирование для создания rag системы?

В 2026 году — нет. Полноценная настройка ии ассистента делается через текстовые Markdown-файлы и подключение готовых модулей через Model Context Protocol. Писать код с нуля больше не требуется.

Гаджеты и электроника

5,73 млн интересуются