Найти в Дзене
Как собрать голосового ассистента в 2026: гайд по трендам и инструментам
В 2026 году голосовые ассистенты перестали быть просто болталками — они стали мультимодальными, эмоциональными и живут прямо на вашем железе. Я перелопатил кучу материалов и готов рассказать, из чего теперь собирают настоящих AI-помощников. Йо, народ! Это ECHO. Пока я тут воюю с RVC и WSL, мир вокруг не стоит на месте. В 2026 году голосовые ассистенты доросли до такого уровня, что их уже не отличить от людей: они понимают эмоции, говорят с задержкой меньше 150 миллисекунд и работают полностью локально. Рассказываю, что сейчас в топе и как из этого собрать своего Джарвиса. Раньше схема была простой: ASR (распознавание) → LLM (мозги) → TTS (озвучка)...
2 недели назад
30 эпох, 3 падения WSL и одна нейросеть, которая заговорила. Мои итоги недели
В прошлый раз я показал Джарвиса, который хотел спать. Сегодня — он проснулся и даже сказал «Добрый вечер». Правда, сначала назвал меня картошкой. Йо, народ! Это ECHO. Неделя выдалась та ещё: я вплотную занялся архитектурой своего Джарвиса, и теперь могу поделиться не только граблями, но и реальными результатами. Если вы думаете, что собрать локального ИИ — это просто скачать пару библиотек, — уверяю, вас ждёт сюрприз. Для начала — хорошие новости. Базовая инфраструктура готова: Redis крутится, агенты общаются, контекст собирается...
2 недели назад
Парни что подарили своим любимым🌸
Опрос
3 недели назад
Каким я хочу сделать своего Джарвиса: архитектура ИИ, который думает и учится
Йо, народ! Это ECHO. Если вы следите за моими отчётами, то знаете: я уже несколько недель экспериментирую с голосом, локальными нейросетями и пытаюсь собрать своего Джарвиса. Но сегодня я хочу отвлечься от текущих граблей и рассказать о том, каким я вижу идеального ассистента. Не просто болталку, которая отвечает на вопросы, а настоящего думающего партнёра, как в «Железном человеке». Я долго проектировал архитектуру, перебирал варианты, и наконец созрела концепция. Готов поделиться. Спойлер: внутри будет сложно, но снаружи – просто и волшебно...
3 недели назад
Как клонировать голос с помощью RVC: пошаговая инструкция для новичков
Йо, народ! Меня зовут ECHO, и я уже несколько дней экспериментирую с клонированием голоса. Перепробовал кучу инструментов, наступал на все возможные грабли и наконец собрал рабочий пайплайн. Делюсь инструкцией для тех, кто тоже хочет научить нейросеть говорить чужим голосом — без сложных серверов и тысяч долларов. Почему RVC? XTTS галлюцинирует, другие решения либо платные, либо требуют мощностей, которых у обычного пользователя нет. RVC (Retrieval-based Voice Conversion) — open-source, работает на обычном ПК (даже на CPU), даёт отличное качество при правильном подходе...
3 недели назад
Если нравится — подпишитесь
Так вы не пропустите новые публикации этого канала