Найти в Дзене
Как собрать голосового ассистента в 2026: гайд по трендам и инструментам
В 2026 году голосовые ассистенты перестали быть просто болталками — они стали мультимодальными, эмоциональными и живут прямо на вашем железе. Я перелопатил кучу материалов и готов рассказать, из чего теперь собирают настоящих AI-помощников. Йо, народ! Это ECHO. Пока я тут воюю с RVC и WSL, мир вокруг не стоит на месте. В 2026 году голосовые ассистенты доросли до такого уровня, что их уже не отличить от людей: они понимают эмоции, говорят с задержкой меньше 150 миллисекунд и работают полностью локально. Рассказываю, что сейчас в топе и как из этого собрать своего Джарвиса. Раньше схема была простой: ASR (распознавание) → LLM (мозги) → TTS (озвучка)...
2 недели назад
30 эпох, 3 падения WSL и одна нейросеть, которая заговорила. Мои итоги недели
В прошлый раз я показал Джарвиса, который хотел спать. Сегодня — он проснулся и даже сказал «Добрый вечер». Правда, сначала назвал меня картошкой. Йо, народ! Это ECHO. Неделя выдалась та ещё: я вплотную занялся архитектурой своего Джарвиса, и теперь могу поделиться не только граблями, но и реальными результатами. Если вы думаете, что собрать локального ИИ — это просто скачать пару библиотек, — уверяю, вас ждёт сюрприз. Для начала — хорошие новости. Базовая инфраструктура готова: Redis крутится, агенты общаются, контекст собирается...
2 недели назад
Парни что подарили своим любимым🌸
Опрос
3 недели назад
Каким я хочу сделать своего Джарвиса: архитектура ИИ, который думает и учится
Йо, народ! Это ECHO. Если вы следите за моими отчётами, то знаете: я уже несколько недель экспериментирую с голосом, локальными нейросетями и пытаюсь собрать своего Джарвиса. Но сегодня я хочу отвлечься от текущих граблей и рассказать о том, каким я вижу идеального ассистента. Не просто болталку, которая отвечает на вопросы, а настоящего думающего партнёра, как в «Железном человеке». Я долго проектировал архитектуру, перебирал варианты, и наконец созрела концепция. Готов поделиться. Спойлер: внутри будет сложно, но снаружи – просто и волшебно...
3 недели назад
Как клонировать голос с помощью RVC: пошаговая инструкция для новичков
Йо, народ! Меня зовут ECHO, и я уже несколько дней экспериментирую с клонированием голоса. Перепробовал кучу инструментов, наступал на все возможные грабли и наконец собрал рабочий пайплайн. Делюсь инструкцией для тех, кто тоже хочет научить нейросеть говорить чужим голосом — без сложных серверов и тысяч долларов. Почему RVC? XTTS галлюцинирует, другие решения либо платные, либо требуют мощностей, которых у обычного пользователя нет. RVC (Retrieval-based Voice Conversion) — open-source, работает на обычном ПК (даже на CPU), даёт отличное качество при правильном подходе...
3 недели назад
Джарвис, я слышу тебя: как я запустил обучение голоса на настоящих репликах
Йо, народ! Это снова ECHO. Вы наверное заметили, что несколько дней тут было тихо. Нет, я не бросил проект и не уехал на Бали. Просто эти три дня я практически не вылезал из терминала, консоли и аудиоредактора. Работы было — вагон, но зато сейчас есть чем поделиться. Если вы читали прошлую статью, то помните: мой первый опыт клонирования голоса Джарвиса провалился. Нейросеть научилась изменять высоту голоса, но тембр оставался моим. В итоге Джарвис звучал как я, только простуженный. Причина была банальна — плохой датасет...
3 недели назад
Голос Джарвиса звучит не так? Ищем проблему в датасете
Если вы читали прошлую статью, то помните: я заставил компьютер говорить голосом Джарвиса. Точнее, я так думал. А потом пришлось признать: голос-то вроде тот, но звучит как-то не так. Будто Джарвис простудился или его озвучивает мой младший брат. В общем, пришлось копать глубже. Спойлер: дело не в коде, а в том, чем я кормил нейросеть. Йо, народ! Это снова ECHO. После эйфории от первой победы (компьютер заговорил!) наступило утро похмелья. Я включил тестовые записи, переслушал раз пять и понял: тембр-то мой...
3 недели назад
Как я заставил компьютер говорить голосом Джарвиса
Йо, народ! Это снова ECHO. Вчера я рассказал, как решил собрать своего Джарвиса с нуля, а сегодня — первый реальный день экспериментов. Если честно, я планировал просто почитать документацию, но всё пошло по одному месту и я вляпался по уши. Зато теперь мой компьютер не только слышит, но и отвечает голосом того самого дворецкого из «Железного человека». Да, того самого, с бархатным баритоном. Рассказываю, как это было. Утро началось с чашки кофе и мысли: «А почему бы не попробовать сразу всё собрать?»...
4 недели назад
Мой второй пилот — нейросетевой псих
Йо, я ECHO. Читается как «Эхо», если что. Мне 21, я живу один в крошечной студии, где кухня совмещена с кроватью, а кровать — с рабочим местом. У меня есть игровой ноутбук, пара тысяч на счету и дикое желание собрать своего Джарвиса. Да, того самого, из «Железного человека». Нет, я не программист. Я вообще гуманитарий: школа, универ, тексты, контент — всё мимо кода. Но это не остановит. Всё началось с пересмотра старой доброй трилогии. Знаете эту сцену, когда Тони Старк в подвале собирает свой первый...
1 месяц назад