Найти в Дзене
ECHO: мой ИИ-дворецкий

30 эпох, 3 падения WSL и одна нейросеть, которая заговорила. Мои итоги недели

В прошлый раз я показал Джарвиса, который хотел спать. Сегодня — он проснулся и даже сказал «Добрый вечер». Правда, сначала назвал меня картошкой. Йо, народ! Это ECHO. Неделя выдалась та ещё: я вплотную занялся архитектурой своего Джарвиса, и теперь могу поделиться не только граблями, но и реальными результатами. Если вы думаете, что собрать локального ИИ — это просто скачать пару библиотек, — уверяю, вас ждёт сюрприз. Для начала — хорошие новости. Базовая инфраструктура готова: Redis крутится, агенты общаются, контекст собирается. Я написал BaseAgent — это такая универсальная заготовка, от которой будут плясать все будущие помощники. ContextAgent уже следит за тем, что у меня на экране и в буфере обмена. Пока он только подглядывает, но скоро начнёт советовать. Самое вкусное — голосовой модуль. faster-whisper исправно переводит мою бормотацию в текст, piper пытается говорить, а RVC… ну, RVC пока учится. Я собрал 24 минуты чистого голоса Джарвиса из фильмов, запустил обучение, и сейчас
Оглавление

В прошлый раз я показал Джарвиса, который хотел спать. Сегодня — он проснулся и даже сказал «Добрый вечер». Правда, сначала назвал меня картошкой.

Йо, народ! Это ECHO. Неделя выдалась та ещё: я вплотную занялся архитектурой своего Джарвиса, и теперь могу поделиться не только граблями, но и реальными результатами. Если вы думаете, что собрать локального ИИ — это просто скачать пару библиотек, — уверяю, вас ждёт сюрприз.

Что уже работает.

Для начала — хорошие новости. Базовая инфраструктура готова: Redis крутится, агенты общаются, контекст собирается. Я написал BaseAgent — это такая универсальная заготовка, от которой будут плясать все будущие помощники. ContextAgent уже следит за тем, что у меня на экране и в буфере обмена. Пока он только подглядывает, но скоро начнёт советовать.

-2

Самое вкусное — голосовой модуль. faster-whisper исправно переводит мою бормотацию в текст, piper пытается говорить, а RVC… ну, RVC пока учится. Я собрал 24 минуты чистого голоса Джарвиса из фильмов, запустил обучение, и сейчас нейросеть проходит 30-ю эпоху. На выходе обещает быть тот самый бархатный баритон. Но, как водится, не без приключений.

Как я чуть не спалил ноутбук.

Обучение идёт на CPU — с GPU в WSL2 пока не подружился. Ноутбук греется так, что я боюсь жарить на нём яичницу. На 37-й эпохе WSL просто закрылся. Без предупреждения, без ошибок — взял и умер. Я сидел и смотрел на чёрный экран минуты три. Потом перезапустил. На 68-й — опять вылет. Пришлось уговаривать технику. На третий раз доучилось до 50. Ноут выжил, я — не знаю.

Что дальше?

Сейчас я подключаю ядро к Ollama, выбираю модель (DeepSeek, Qwen или Mistral — пока тестирую). Дальше — ReasonerAgent, который будет замечать, где Джарвис тупит, и отправлять запросы в фабрику знаний. В планах — научить его искать информацию в интернете, проверять факты и создавать временных агентов под конкретные задачи. Это уже не просто болталка, это настоящий думающий партнёр.

А вы сталкивались с тем, что нейросеть понимает команды слишком буквально? Поделитесь историями в комментариях — обещаю самые дикие запрограммировать и показать в следующих сериях.

Если хотите узнать подробнее о нейросетях почитайте этого парня он подробно обо всем пишет. Он в этом разбирается. Не то что я! https://dzen.ru/loloxcka